pca主成分分析

网友 1

最佳答案

回答者:网友

主成分分析PCA是一种简化数据集的技术。

它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推终固胶侵晶田括松

主成分分析经常用于减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。


主成分分析的运作:

获取数据集,计算数据的协方差矩阵,计算特征值和特征向量除以马地降练防间治望合协方差矩阵,选择主成分,从选定的组件构造新的特征数据集。

iris数据集是本文中的目标数据集。数据有4个特征或变量; 或矩阵代数中的4维。并且,1个目标向量显示依赖于4个特征的花的类型。所以,问题在于四维。4D并不多,但会尝试将其缩小为2D以说明PCA。


我来回答