查看“4.3 实例:使用 K-近邻算法进行分类”的源代码
←
4.3 实例:使用 K-近邻算法进行分类
跳转至:
导航
,
搜索
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
K最近邻 (k-Nearest Neighbors,KNN) 算法是一种分类算法,也是最简单易懂的机器学习算法,没有之一。1968年由 Cover 和 Hart 提出,应用场景有字符识别、文本分类、图像识别等领域。该算法的思想是:一个样本与数据集中的k个样本最相似,如果这k个样本中的大多数属于某一个类别,则该样本也属于这个类别。还是直接讲例子最好懂,一直没找到好的例子,就改造了下Peter Harrington的《机器学习实战》中电影分类的例子,当然实际情况不可能这么简单,这里只是为了说明该算法的用法。 先准备下电影分类数据集(电影名称与分类来自于优酷网;镜头数量则纯属虚构): 序号 电影名称 搞笑镜头 拥抱镜头 打斗镜头 电影类型 1 宝贝当家 45 12 9 喜剧片 2 美人鱼 21 17 5 喜剧片 3 澳门风云3 54 9 11 喜剧片 4 功夫熊猫 39 0 31 喜剧片 5 谍影重重 5 2 57 动作片 6 叶问3 3 2 65 动作片 7 伦敦陷落 2 3 55 动作片 8 我的特工爷爷 6 4 21 动作片 9 奔爱 7 46 4 爱情片 10 夜孔雀 9 39 8 爱情片 11 代理情人 9 38 2 爱情片 12 新步步惊心 8 34 17 爱情片 13 唐人街探案 23 3 17 ?
返回至
4.3 实例:使用 K-近邻算法进行分类
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息