“4.3 实例:使用 K-近邻算法进行分类”的版本间的差异
来自CloudWiki
(创建页面,内容为“ K最近邻 (k-Nearest Neighbors,KNN) 算法是一种分类算法,也是最简单易懂的机器学习算法,没有之一。1968年由 Cover 和 Hart 提出,…”) |
|||
第3行: | 第3行: | ||
先准备下电影分类数据集(电影名称与分类来自于优酷网;镜头数量则纯属虚构): | 先准备下电影分类数据集(电影名称与分类来自于优酷网;镜头数量则纯属虚构): | ||
− | + | [[文件:AIred012.jpg]] | |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− |
2018年5月29日 (二) 13:59的版本
K最近邻 (k-Nearest Neighbors,KNN) 算法是一种分类算法,也是最简单易懂的机器学习算法,没有之一。1968年由 Cover 和 Hart 提出,应用场景有字符识别、文本分类、图像识别等领域。该算法的思想是:一个样本与数据集中的k个样本最相似,如果这k个样本中的大多数属于某一个类别,则该样本也属于这个类别。还是直接讲例子最好懂,一直没找到好的例子,就改造了下Peter Harrington的《机器学习实战》中电影分类的例子,当然实际情况不可能这么简单,这里只是为了说明该算法的用法。
先准备下电影分类数据集(电影名称与分类来自于优酷网;镜头数量则纯属虚构):