查看“11.2scikit-learn里的k-均值算法”的源代码
←
11.2scikit-learn里的k-均值算法
跳转至:
导航
,
搜索
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
# -*- coding: utf-8 -*- from sklearn.cluster import KMeans from sklearn.externals import joblib import numpy final = open('c:/test/final.dat' , 'r') data = [line.strip().split('\t') for line in final] feature = [[float(x) for x in row[3:]] for row in data] #调用kmeans类 clf = KMeans(n_clusters=9) s = clf.fit(feature) print s #9个中心 print clf.cluster_centers_ #每个样本所属的簇 print clf.labels_ #用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数 print clf.inertia_ #进行预测 print clf.predict(feature) #保存模型 joblib.dump(clf , 'c:/km.pkl') #载入保存的模型 clf = joblib.load('c:/km.pkl') ''' #用来评估簇的个数是否合适,距离越小说明簇分的越好,选取临界点的簇个数 for i in range(5,30,1): clf = KMeans(n_clusters=i) s = clf.fit(feature) print i , clf.inertia_ 来源:网络
返回至
11.2scikit-learn里的k-均值算法
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息