

knn和kmeans的区别

2022-01-11

文/夜满月

专题:区别

knn属于监督学习,类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。kmeans属于非监督学习,事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。

knn和kmeans的区别

1.KNN算法是分类算法，分类算法肯定是需要有学习语料，然后通过学习语料的学习之后的模板来匹配我们的测试语料集，将测试语料集合进行按照预先学习的语料模板来分类

2Kmeans算法是聚类算法，聚类算法与分类算法最大的区别是聚类算法没有学习语料集合。

K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。

Kmeans算法的缺陷

聚类中心的个数K 需要事先给定，但在实际中这个 K 值的选定是非常难以估计的，很多时候，事先并不知道给定的数据集应该分成多少个类别才最合适

Kmeans需要人为地确定初始聚类中心，不同的初始聚类中心可能导致完全不同的聚类结果。(可以使用Kmeans++算法来解决)

针对上述第2个缺陷，可以使用Kmeans++算法来解决

K-Means ++ 算法

k-means++算法选择初始seeds的基本思想就是：初始的聚类中心之间的相互距离要尽可能的远。

从输入的数据点集合中随机选择一个点作为第一个聚类中心

对于数据集中的每一个点x，计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)

选择一个新的数据点作为新的聚类中心，选择的原则是：D(x)较大的点，被选取作为聚类中心的概率较大

重复2和3直到k个聚类中心被选出来

利用这k个初始的聚类中心来运行标准的k-means算法

从上面的算法描述上可以看到，算法的关键是第3步，如何将D(x)反映到点被选择的概率上，一种算法如下：

先从我们的数据库随机挑个随机点当“种子点”

对于每个点，我们都计算其和最近的一个“种子点”的距离D(x)并保存在一个数组里，然后把这些距离加起来得到Sum(D(x))。

然后，再取一个随机值，用权重的方式来取计算下一个“种子点”。这个算法的实现是，先取一个能落在Sum(D(x))中的随机值Random，然后用Random -= D(x)，直到其<=0，此时的点就是下一个“种子点”。

重复2和3直到k个聚类中心被选出来

利用这k个初始的聚类中心来运行标准的k-means算法

小编推荐

1.浙大海宁国际校区和浙大本部区别哪个更好

2.中外合作办学怎么查是不是计划内和计划外有什么区别

3.中外合作办学和国际本科的区别有什么不同

4.中外合作大学与普通大学的区别应该怎么选

5.郑州大学中外合作办学和普通的区别学费是多少

6.中外合作办学项目和机构的区别优缺点有哪些

7.中外合作办学毕业证是啥样的有什么区别

8.军校和警校的区别有哪些多少分能考上

下载文档

上一篇：couch和sofa的区别
下一篇：relaxing和relaxed区别

knn和kmeans的区别

knn和kmeans的区别

Kmeans算法的缺陷

小编推荐

猜你喜欢

高三英语听力怎么提高成绩有哪些方法技巧

高三英语一对一补课有用吗有什么优势

高三英语听力不好怎么提高有什么学习方法

高三英语太差怎么补救学习技巧有哪些

高中英语怎么学才能学好学习技巧有哪些

高三一对一补英语有用吗有什么好处

高三如何快速提高英语成绩提分方法有哪些

高三英语突然下降的原因怎么应对

knn和kmeans的区别

knn和kmeans的区别

Kmeans算法的缺陷

小编推荐

猜你喜欢

高三英语听力怎么提高成绩 有哪些方法技巧

高三英语一对一补课有用吗 有什么优势

高三英语听力不好怎么提高 有什么学习方法

高三英语太差怎么补救 学习技巧有哪些

高中英语怎么学才能学好 学习技巧有哪些

高三一对一补英语有用吗 有什么好处

高三如何快速提高英语成绩 提分方法有哪些

高三英语突然下降的原因 怎么应对

高三英语听力怎么提高成绩有哪些方法技巧

高三英语一对一补课有用吗有什么优势

高三英语听力不好怎么提高有什么学习方法

高三英语太差怎么补救学习技巧有哪些

高中英语怎么学才能学好学习技巧有哪些

高三一对一补英语有用吗有什么好处

高三如何快速提高英语成绩提分方法有哪些

高三英语突然下降的原因怎么应对