“PCA算法”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
第4行: 第4行:
 
   
 
   
 
1. 将原始数据按列组成n行m列矩阵X  
 
1. 将原始数据按列组成n行m列矩阵X  
 +
 
2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值  
 
2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值  
 +
 
3. 求出协方差矩阵C=1/mXXT  
 
3. 求出协方差矩阵C=1/mXXT  
 +
 
4. 求出协方差矩阵的特征值以及对应的特征向量  
 
4. 求出协方差矩阵的特征值以及对应的特征向量  
 +
 
5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P  
 
5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P  
 +
 
6. Y=PX即为降维到k维后的数据
 
6. Y=PX即为降维到k维后的数据

2018年6月27日 (三) 06:07的版本

pca算法步骤:

假设有m条n维数据。

1. 将原始数据按列组成n行m列矩阵X

2. 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值

3. 求出协方差矩阵C=1/mXXT

4. 求出协方差矩阵的特征值以及对应的特征向量

5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P

6. Y=PX即为降维到k维后的数据