• <cite id="u60o2"><nav id="u60o2"></nav></cite>
    
    
  • <samp id="u60o2"><pre id="u60o2"></pre></samp>
  • <tr id="u60o2"></tr>
    <th id="u60o2"></th>
    <td id="u60o2"></td><kbd id="u60o2"><acronym id="u60o2"></acronym></kbd>
      首頁 > news > 生信分析之PCA

      生信分析之PCA

      ? ? ? ? PCA (Principal Component Analysis),即主成分分析,是一種對數(shù)據(jù)進行簡化分析的技術(shù),這種方法可以有效的找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復雜數(shù)據(jù)降維,揭示隱藏在復雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。
      ? ? ? ? 比較抽象?那咱們舉個簡單的例子。
      ? ? ? ? 小A和小B是一對雙胞胎,他們在外貌、身高、體型等方面差異都很小。但是小A的額頭上有顆痣,小B沒有。此時,分辨小A和小B只需要根據(jù)額頭上的痣即可,無需關(guān)注兩個人在外貌、身高、體型等方面的微小差別。這顆“痣”可以作為區(qū)分小A和小B的主成分。
      ? ? ? ? 但是數(shù)據(jù)分析時,數(shù)據(jù)之間的區(qū)分點并不像“痣”那么明確,并且計算機也不會像人似的那么智能,它不會區(qū)分哪些特征可以作為區(qū)分數(shù)據(jù)的主要因素。這時候就需要給計算機一種區(qū)分方法——PCA主成分分析。
      PCA的原理
      ? ? ? ? 假設(shè)我們有N個P維的數(shù)據(jù)要區(qū)分, X1,X2,……,Xn。如果P比較大,那么處理的數(shù)據(jù)量較大,我們需要將P維的數(shù)據(jù)降至d維(d<P)。首先構(gòu)造矩陣S=[X1,X2…Xn],算出協(xié)方差矩陣C(P維方陣),求出C的特征值T和特征向量V。將特征值按從大到小排列取出前d個特征值,并將這些特征值對應的特征向量構(gòu)成一個投影矩陣L。使用S×L則得到降維后的提出主成分的矩陣。
      ? ? ? ? (不知道你們懂了么,反正數(shù)學小白的小編……?O(∩_∩)O)
      ? ? ? ? 忽略頭疼的原理,下面小編將從PCA分析的用途、PCA算法、PCA圖解讀、PCA分析軟件等方面來進行詳細解釋。
      PCA的用途
      ? ? ? ? PCA分析它可以反映以下問題喲!
      (1)揭示造成樣本差異性的主成分及其貢獻率。如在下圖中,造成樣本差異性最大的成分為PC1,貢獻率為97.85%。
      (2)揭示不同處理下的樣品的情況。樣品組成越相似,樣本在PCA中的距離越近。
      (3)樣本間的差異性。兩樣本在橫、縱坐標軸上的距離表示樣本受主成分(PC1和PC2)影響下的相似性距離。
      PCA的算法
      ? ? ? ? 對于微生物多樣性分析,PCA分析是基于每個樣品的OUT(97%相似性)豐度作圖。
      ? ? ? ? 通過分析不同樣品OTU(97%相似性)組成可以反映樣品間的差異和距離,PCA 運用方差分解,將多組數(shù)據(jù)的差異反映在二維坐標圖上,坐標軸取能夠最大反映方差值的兩個特征值。
      PCA的解讀
      ? ? ? ? 以下圖為例對PCA圖進行解讀喲!
      圖中的點:不同顏色表示不同的分組。紅色表示A組,藍色表示B組。
      坐標軸:能夠最大反映樣本差異性的兩個成分(PC1和PC2)。
      坐標軸上的刻度:為相對距離,無實際意義。
      百分數(shù):表示成分的貢獻率。如PC1成分的貢獻率為97.85%,PC2成分的貢獻率為1%。
      ? ? ? ? 對于目前比較流行的3D-PCA分析圖,它的圖解也是相同的。只不過二維PCA只展現(xiàn)貢獻率前二名的成分,3D-PCA可以更直觀的展現(xiàn)貢獻率前三位的成分。
      分析軟件
      ? ? ? ? PCA分析可以用mothur,PC-ORD或是CANOCO做出來喲。
    • <cite id="u60o2"><nav id="u60o2"></nav></cite>
      
      
    • <samp id="u60o2"><pre id="u60o2"></pre></samp>
    • <tr id="u60o2"></tr>
      <th id="u60o2"></th>
      <td id="u60o2"></td><kbd id="u60o2"><acronym id="u60o2"></acronym></kbd>