因為要算協方差。單純的線性變換只是產生了倍數縮放,無法消除量綱對協方差的影響,而協方差是為了讓投影后方差最大。
在統計學中,主成分分析(PCA)是-種簡化數據集的技術,是一個線性變換。
這個變換把數據變換,到一個新的坐標系統中,使得任何數據投影的第- -大方差在第一個坐標(稱為第-主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。
主成分分析經常用減少數據集的維數,同時保持數據集的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。
這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體應用而定。