在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
意见反馈

原创机器学习中的聚类算法有哪几种？

发布时间：2020-04-03 19:00:35 浏览 11835 来源：博学谷作者：照照

目前，聚类算法被广泛应用于用户画像、广告推荐、新闻推送和图像分割等等。聚类算法是机器学习中一种“数据探索”的分析方法，它帮助我们在大量的数据中探索和发现数据的结构。那么机器学习中的聚类算法有哪几种呢？下面我将为大家一一介绍常见的几种聚类算法，分别是高斯聚类模型、基于密度的聚类算法、凝聚层次聚类和均值漂移算法。

聚类算法

1、高斯聚类模型

事实上，GMM 和 k-means 很像，不过 GMM 是学习出一些概率密度函数来，简单地说，k-means 的结果是每个数据点被 assign 到其中某一个 cluster 了，而 GMM 则给出这些数据点被 assign 到每个 cluster 的概率，又称作 soft assignment 。

2、基于密度的聚类算法

基于密度的聚类算法最大的优点在于无需定义类的数量，其次可以识别出局外点和噪声点、并且可以对任意形状的数据进行聚类。DBSCAN同样是基于密度的聚类算法，但其原理却与均值漂移大不相同：首先从没有被遍历的任一点开始，利用邻域距离epsilon来获取周围点；如果邻域内点的数量满足阈值则此点成为核心点并以此开始新一类的聚类；其邻域内的所有点也属于同一类，将所有的邻域内点以epsilon为半径进行步骤二的计算；重复步骤二、三直到变量完所有核心点的邻域点；此类聚类完成，同时又以任意未遍历点开始步骤一到四直到所有数据点都被处理；最终每个数据点都有自己的归属类别或者属于噪声。

3、K均值聚类

这一最著名的聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分的高效，由于只需要计算数据点与剧类中心的距离，其计算复杂度只有O(n)。其工作原理主要分为以下四步：首先我们需要预先给定聚类的数目同时随机初始化聚类中心。我们可以初略的观察数据并给出较为准确的聚类数目；每一个数据点通过计算与聚类中心的距离了来分类到最邻近的一类中；根据分类结果，利用分类后的数据点重新计算聚类中心；重复步骤二三直到聚类中心不再变化。

4、凝聚层次聚类

层次聚类法主要有自顶向下和自底向上两种方式。其中自底向上的方式，最初将每个点看做是独立的类别，随后通过一步步的凝聚最后形成独立的一大类，并包含所有的数据点。这会形成一个树形结构，并在这一过程中形成聚类。

5、均值漂移算法

这是一种基于滑动窗口的均值算法，用于寻找数据点中密度最大的区域。其目标是找出每一个类的中心点，并通过计算滑窗内点的均值更新滑窗的中心点。最终消除临近重复值的影响并形成中心点，找到其对应的类别。其工作原理主要是以下几点：首先以随机选取的点为圆心r为半径做一个圆形的滑窗。其目标是找出数据点中密度最高点并作为中心；在每个迭代后滑动窗口的中心将为想着较高密度的方向移动；连续移动，直到任何方向的移动都不能增加滑窗中点的数量，此时滑窗收敛；将上述步骤在多个滑窗上进行以覆盖所有的点。当过个滑窗收敛重叠时，其经过的点将会通过其滑窗聚类为一个类。

以上就是机器学习中常见的五种聚类算法，大家都了解了吗？如果还想深入学习聚类算法的相关内容，比如原理、算法效果的衡量标准以及基于Kmeans算法进行改进的优化方法，可以上博学谷官网进行有关课程的在线学习。希望大家通过课程可以学会使用聚类算法进行数据分析，挖掘商业价值。

机器学习人工智能

— 申请免费试学名额 —

在职想转行提升，担心学不会？根据个人情况规划学习路线，闯关式自适应学习模式保证学习效果
讲师一对一辅导，在线答疑解惑，指导就业！

上一篇：人工智能是什么？人工智能培训的内容是什么？下一篇：智能机器人软件开发培训学什么？

相关推荐 更多

人工智能的七大发展趋势预测

人工智能其实不是一个新概念，但是它的崛起确实是近几年才发生。随着大数据、物联网等技术的发展，人工智能也以前所未有的速度发展着。因此想要预测人工智能的发展，其实不是一件简单容易的事情。小编根据目前已有的人工智能发展文献，整理出了人工智能的七大发展趋势预测，相信对大家了解AI技术的发展有一定启示。

7682

2019-11-19 10:42:36

人工智能人工智能开发
入门数据科学必读书单推荐

随着技术的迅猛发展和数据的快速增长，数据科学已经开始渗透各行各业。数据科学作为一门跨学科的领域，想要入门可以说并不轻松，需要学习的内容包括了SQL、Python编程语言、网络爬虫、数据分析、机器学习、数据挖掘以及数据结构算法等等内容。下面是小编整理的入门数据科学必读书单推荐，感兴趣的朋友可以看看，相信对你的学习一定会有帮助。

6849

2019-11-20 16:37:50

Python开发编程语言机器学习
人工智能教材进入高中课堂是怎么回事？

想必大家早已听说，我国发布了第一本给高中生学习的人工智能教材《人工智能基础（高中版）》。这无疑加快了人工智能的普及，毕竟人工智能都出教材了，全民学习AI技术的时代还会远吗？下面我们来详细看看这本AI教材有什么特点？主要讲了什么内容？为什么让高中生学习人工智能？对未来发展又有什么意义？

8262

2019-11-22 11:05:35

人工智能人工智能入门
人工智能的就业前景和工资怎么样？

人工智能这把大火近些年来越烧越旺，随着AI技术的广泛应用，不少技术都落到了实地，如人脸识别技术，语音识别技术等等。由此人工智能的人才需求正在逐年矿大，这也吸引了不少想要入门人工智能的小伙伴。虽然大家对人工智能都不陌生，但是对于它的就业行情和薪资，了解的人还是知之甚少。下面我们一起来看看人工智能的就业前景和工资到底怎么样。

12186

2019-12-05 13:09:03

就业前景人工智能薪资待遇
AI换脸技术原理分析

近来AI换脸技术引起了巨大的争议，众所周知，人脸互换是计算机视觉领域中的大热应用，在技术进步的同时也埋下了不少的隐患。因此在不久前的《网络音视频信息服务管理规定》中，国家出台了针对AI换脸造假视频的管控政策。由此可见AI换脸技术的迅猛发展，甚至达到了以假乱真的地步。既然AI技术如此神奇，本文就来带大家深度分析AI技术的具体原理，感兴趣的朋友可以接着看下去。

26751

2019-12-09 11:42:37

机器学习人工智能开发