“PCA算法”的版本间的差异
来自CloudWiki
第4行: | 第4行: | ||
1. 将原始数据按列组成n行m列矩阵X | 1. 将原始数据按列组成n行m列矩阵X | ||
+ | |||
2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值 | 2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值 | ||
+ | |||
3. 求出协方差矩阵C=1/mXXT | 3. 求出协方差矩阵C=1/mXXT | ||
+ | |||
4. 求出协方差矩阵的特征值以及对应的特征向量 | 4. 求出协方差矩阵的特征值以及对应的特征向量 | ||
+ | |||
5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P | 5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P | ||
+ | |||
6. Y=PX即为降维到k维后的数据 | 6. Y=PX即为降维到k维后的数据 |
2018年6月27日 (三) 06:07的版本
pca算法步骤:
假设有m条n维数据。
1. 将原始数据按列组成n行m列矩阵X
2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值
3. 求出协方差矩阵C=1/mXXT
4. 求出协方差矩阵的特征值以及对应的特征向量
5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P
6. Y=PX即为降维到k维后的数据