LEfSe是一種用于發(fā)現(xiàn)高維生物標(biāo)識和揭示基因組特征的軟件。包括基因,代謝和分類,用于區(qū)別兩個(gè)或兩個(gè)以上生物條件(或者是類群)。該算法強(qiáng)調(diào)的是統(tǒng)計(jì)意義和生物相關(guān)性。讓研究人員能夠識別不同豐度的特征以及相關(guān)聯(lián)的類別。
LEfSe 通過生物學(xué)統(tǒng)計(jì)差異使其具有強(qiáng)大的識別功能。然后,它執(zhí)行額外的測試,以評估這些差異是否符合預(yù)期的生物學(xué)行為。具體來說,首先使用non-parametric factorial Kruskal-Wallis (KW) sum-rank test(非參數(shù)因子克魯斯卡爾—沃利斯和秩驗(yàn)檢)檢測具有顯著豐度差異特征,并找到與豐度有顯著性差異的類群。最后,LEfSe采用線性判別分析(LDA)來估算每個(gè)組分(物種)豐度對差異效果影響的大小。
LDA:使用這種方法能夠使投影后模式樣本的類間散布矩陣最大,并且同時(shí)類內(nèi)散布矩陣最小。就是說,它能夠保證投影后模式樣本在新的空間中有最小的類內(nèi)距離和最大的類間距離,即模式在該空間中有最佳的可分離性。
分析軟件:LEfSE[2](http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=lefse_upload)根據(jù)分類學(xué)組成對樣品按照不同的分組條件進(jìn)行線型判別分析(LDA),找出對樣品劃分產(chǎn)生顯著性差異影響的群落或物種。
參考文獻(xiàn):
[1] Chenhong Zhang, Shoufeng Li, Liu Yang, et al. Structural modulation of gut microbiota in life-long calorie-restricted mice. NATURE COMMUNICATIONS, 4:2163, DOI:10.1038/ncomms 3163(2013).
[2] Segata N, Izard J, Waldron L, Gevers D, Miropolsky L et al. (2011) Metagenomic biomarker discovery and explanation. Genome Biol 12: R60.10.1186/gb-2011-12-6-r60 PubMed: 21702898.
例圖:


注:左圖為聚類樹,紅色區(qū)域和綠色區(qū)域表示不同分組,樹枝中紅色節(jié)點(diǎn)表示在紅色組別中起到重要作用的微生物類群,綠色節(jié)點(diǎn)表示在綠色組別中起到重要作用的微生物類群,黃色節(jié)點(diǎn)表示的是在兩組中均沒有起到重要作用的微生物類群。圖中英文字母表示的物種名稱在右側(cè)圖例中進(jìn)行展示。右圖為統(tǒng)計(jì)兩個(gè)組別當(dāng)中有顯著作用的微生物類群通過LDA 分析(線性回歸分析)后獲得的LDA 分值。

微基生物 您自己的微生態(tài)研究團(tuán)隊(duì)|專注微生態(tài)研究與應(yīng)用

