机器学习-PCA降维

特征选择也是降维。和特征选择、稀疏的区别:

  • 特征选择:(选择特征的子集)假设有的特征是有用的,有的特征没有用,把有用的特征选择出来,保留的特征没有发生任何改变的。(通过减少属性的数目实现了降维效果)
  • 稀疏表示:仍然用高维向量表示样本,但是高维向量中存在很多零元素。(稀疏编码-字典学习)(将一个空间转化成了另外一个空间。表示空间发生了变化,侧重于构造稀疏表示,也有降维的效果)
  • PCA:通过某种数学变换将原始的高维属性空间转变为一个低维的空间,我们不要求稀疏,在低维空间的表示一般是稠密的。(也没有抛弃掉任何原始特征)

PCA

假设高维数据近似分布在一个低维空间中。