如果不是沒(méi)有錢(qián),誰(shuí)想測(cè)3個(gè)重復(fù)?_焦點(diǎn)快看
這篇文章上次發(fā)出后,有朋友留言說(shuō)到底要測(cè)幾個(gè)重復(fù)?其實(shí)也沒(méi)有定論,有錢(qián)多多益善。只是需要知道
(資料圖片僅供參考)
重復(fù)少時(shí),發(fā)現(xiàn)的差異基因會(huì)有不少假陰性,獲得不了結(jié)果時(shí),可嘗試加測(cè)一些,可獲得更穩(wěn)定的結(jié)果。
重復(fù)少時(shí),抽樣隨機(jī)性大。如下圖隨機(jī)抽取2個(gè)生物重復(fù)獲得的差異基因數(shù)目最多時(shí)是最少時(shí)的5倍以上;隨機(jī)抽取3個(gè)生物重復(fù)獲得的差異基因數(shù)目最多時(shí)是最少時(shí)的3倍左右。
2016年英國(guó)鄧迪大學(xué)的Geoffrey J Barton教授在RNA發(fā)表一篇文章專(zhuān)門(mén)評(píng)估這一問(wèn)題。作者對(duì)野生型和snf2突變型酵母樣品分別測(cè)序了48個(gè)生物學(xué)重復(fù);質(zhì)控后,野生型樣品保留42個(gè)生物學(xué)重復(fù),突變型樣品剩余44個(gè)生物學(xué)重復(fù)。
在控制假陽(yáng)性率為0.05的標(biāo)準(zhǔn)下,用所有可用生物重復(fù)計(jì)算出的差異基因定義為該差異基因鑒定工具的金標(biāo)準(zhǔn)差異基因集。
作者評(píng)估了11個(gè)常用的差異基因分析工具,性能最好的是edgeR, DESeq2和limma。
下面以edgeR為例展示了不同生物學(xué)重復(fù)數(shù)目對(duì)鑒定差異基因的影響。
圖A展示了,在控制相同的假陽(yáng)性率水平下,不同的生物學(xué)重復(fù)鑒定出的差異基因數(shù)目 (nr: number of biological replicates)。作者從所有生物重復(fù)中隨機(jī)抽取2組、3組、4組…生物學(xué)重復(fù),分別計(jì)算差異基因,發(fā)現(xiàn):
差異基因的數(shù)目整體與生物重復(fù)數(shù)量正相關(guān)。
差異基因數(shù)目的穩(wěn)定性與生物重復(fù)數(shù)量負(fù)相關(guān);
生物重復(fù)較少時(shí),不同的抽樣導(dǎo)致的差異基因數(shù)目波動(dòng)較大;
生物重復(fù)較多時(shí),檢測(cè)出的差異基因數(shù)目受抽樣影響較小,體現(xiàn)在柱狀圖數(shù)據(jù)分布更集中 (可視化之為什么要使用箱線圖?)。
圖B展示了,不同生物學(xué)重復(fù)與鑒定的差異基因的真陽(yáng)性率的關(guān)系。不同的實(shí)線代表不同的差異基因篩選倍數(shù)變化(T=|Log2(FC)|)條件下的真陽(yáng)性率。虛線代表假陽(yáng)性率,近乎一條直線,說(shuō)明edgeR的假陽(yáng)性率控制的還是比較好的,比較低,且不受生物重復(fù)數(shù)影響。如果篩選閾值比較高,比如4倍差異(T=2)時(shí),較低的重復(fù)數(shù)即可獲得較高的真陽(yáng)性率。而篩選閾值較低(T=0)時(shí),真陽(yáng)性率受生物學(xué)重復(fù)影響較大;生物學(xué)重復(fù)越少,真陽(yáng)性率越低。常規(guī)篩選標(biāo)準(zhǔn)2倍差異(T=1)時(shí)需要20個(gè)生物重復(fù)才能達(dá)到與4倍差異相同的真陽(yáng)性率。
圖C則是圖B的另一種展現(xiàn),橫軸是篩選倍數(shù)閾值 (T=|Log2(FC)|)。藍(lán)色虛線代表3個(gè)生物重復(fù)條件下的假陽(yáng)性率,在常規(guī)篩選標(biāo)準(zhǔn)2倍差異(T=1)時(shí),假陽(yáng)性率已趨近于0。不同顏色的實(shí)現(xiàn)代表不同生物重復(fù)下的真陽(yáng)性率隨篩選閾值差異倍數(shù)的變化,整體呈現(xiàn)正相關(guān);且生物重復(fù)越多,真陽(yáng)性率越高,并受篩選閾值影響越少。
圖D展示了真陽(yáng)性、真陰性 (非金標(biāo)準(zhǔn)差異基因定義為真陰性(無(wú)差異)基因)、假陽(yáng)性、假陰性基因數(shù)目隨生物重復(fù)數(shù)的變化。生物重復(fù)越多,漏掉的差異基因(假陰性基因)越少。
原文:https://rnajournal.cshlp.org/content/22/6/839.long
這么多重復(fù)測(cè)序起來(lái)需要多少錢(qián)?有沒(méi)有便宜的方法?見(jiàn)遺傳所屠強(qiáng)研究組開(kāi)發(fā)Decode-seq方法顯著提高差異表達(dá)基因分析的準(zhǔn)確性。
Nature重磅綜述 |關(guān)于RNA-seq,你想知道的都在這
39個(gè)工具,120種組合深度評(píng)估 (轉(zhuǎn)錄組分析工具哪家強(qiáng))
DESeq2差異基因分析和批次效應(yīng)移除
轉(zhuǎn)錄組分析的正確姿勢(shì)(第三版)
120分的轉(zhuǎn)錄組試題(第三份答案)
往期精品(點(diǎn)擊圖片直達(dá)文字對(duì)應(yīng)教程)后臺(tái)回復(fù)“生信寶典福利第一波”或點(diǎn)擊閱讀原文獲取教程合集
關(guān)鍵詞: 一篇文章
相關(guān)閱讀
-
如果不是沒(méi)有錢(qián),誰(shuí)想測(cè)3個(gè)重復(fù)?_焦點(diǎn)快看
這篇文章上次發(fā)出后,有朋友留言說(shuō)到底要測(cè)幾個(gè)重復(fù)?其實(shí)也沒(méi)有定... -
環(huán)球看點(diǎn)!迎接2023 | 北極星開(kāi)源一周...
北極星(PolarisMesh)是開(kāi)源的一體化服務(wù)治理平臺(tái),致力于解決分布... -
一款強(qiáng)大的API接口文檔管理工具_(dá)觀速訊
在團(tuán)隊(duì)協(xié)作開(kāi)發(fā)項(xiàng)目的時(shí)候,接口文檔承擔(dān)著向其他開(kāi)發(fā)人員說(shuō)明接口... -
世界熱門(mén):Dance in the moment
今天和同事聊天,聊到了《明朝那些事兒》,聊到了朱元璋,他小時(shí)候... -
使用 IdentityServer 保護(hù) Vue 前端-焦點(diǎn)速讀
前情提要《使用IdentityServer保護(hù)Web應(yīng)用(AntDPro前端+SpringBoot... -
Free Arch: 將 IdentityServer 部署到 Okteto
最終成果部署了一個(gè)免費(fèi)的IdentityServer實(shí)例:https: id6-jeff-...