PCA算法

来自CloudWiki
112.38.217.43讨论2018年6月27日 (三) 06:07的版本
跳转至: 导航搜索

pca算法步骤:

假设有m条n维数据。

1. 将原始数据按列组成n行m列矩阵X

2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值

3. 求出协方差矩阵C=1/mXXT

4. 求出协方差矩阵的特征值以及对应的特征向量

5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P

6. Y=PX即为降维到k维后的数据