“4.3 实例：使用 K-近邻算法进行分类”的版本间的差异

2018年5月29日 (二) 13:59的版本

K最近邻 (k-Nearest Neighbors，KNN) 算法是一种分类算法，也是最简单易懂的机器学习算法，没有之一。1968年由 Cover 和 Hart 提出，应用场景有字符识别、文本分类、图像识别等领域。该算法的思想是：一个样本与数据集中的k个样本最相似，如果这k个样本中的大多数属于某一个类别，则该样本也属于这个类别。还是直接讲例子最好懂，一直没找到好的例子，就改造了下Peter Harrington的《机器学习实战》中电影分类的例子，当然实际情况不可能这么简单，这里只是为了说明该算法的用法。

     先准备下电影分类数据集（电影名称与分类来自于优酷网；镜头数量则纯属虚构）：

@@ 第3行： / 第3行： @@
        先准备下电影分类数据集（电影名称与分类来自于优酷网；镜头数量则纯属虚构）：
-序号	电影名称	搞笑镜头	拥抱镜头	打斗镜头	电影类型
+[[文件:AIred012.jpg]]
-	宝贝当家	45	           12	            9	         喜剧片
-	美人鱼	        21	           17	            5	喜剧片
-	澳门风云3	54	9	11	喜剧片
-	功夫熊猫	39	0	31	喜剧片
-	谍影重重	5	2	57	动作片
-	叶问3	3	2	65	动作片
-	伦敦陷落	2	3	55	动作片
-	我的特工爷爷	6	4	21	动作片
-	奔爱	7	46	4	爱情片
-	夜孔雀	9	39	8	爱情片
-	代理情人	9	38	2	爱情片
-	新步步惊心	8	34	17	爱情片
-	唐人街探案	23	3	17	？

“4.3 实例：使用 K-近邻算法进行分类”的版本间的差异

2018年5月29日 (二) 13:59的版本

导航菜单

个人工具

命名空间

变种

视图

更多

搜索

导航

工具