方差

来自CloudWiki
跳转至: 导航搜索

上文说到,我们希望投影后投影值尽可能分散,而这种分散程度,可以用数学上的方差来表述。此处,一个字段的方差可以看做是每个元素与字段均值的差的平方和的均值,即:

Var(a)=\frac{1}{m}\sum_{i=1}^m{(a_i-\mu)^2}

由于上面我们已经将每个字段的均值都化为0了,因此方差可以直接用每个元素的平方和除以元素个数表示:

Var(a)=\frac{1}{m}\sum_{i=1}^m{a_i^2}

于是上面的问题被形式化表述为:寻找一个一维基,使得所有数据变换为这个基上的坐标表示后,方差值最大。