國際學(xué)術(shù)期刊《自然》最新發(fā)表一篇基因組學(xué)論文稱,谷歌研究團(tuán)隊(duì)研發(fā)的一款深度學(xué)習(xí)模型AlphaGenome,能預(yù)測(cè)長達(dá)100萬堿基對(duì)的DNA序列的功能。
研究團(tuán)隊(duì)認(rèn)為,基于能預(yù)測(cè)DNA序列變異如何影響不同生物過程,AlphaGenome可用于理解遺傳疾病、改進(jìn)基因檢測(cè),并為開發(fā)新療法提供信息。

本項(xiàng)研究的AlphaGenome工作原理示意圖(圖片來自谷歌DeepMind)。施普林格·自然 供圖
該論文介紹,基因變異會(huì)影響生物學(xué)過程并可能引發(fā)疾病,但理解DNA序列變化如何影響其功能是個(gè)難題。大多數(shù)變化(約98%)發(fā)生于非編碼區(qū)域(不編碼蛋白質(zhì)但影響基因表達(dá)的DNA區(qū)域),使得預(yù)測(cè)其影響變得困難。要解決這一問題需要計(jì)算模型,現(xiàn)有的方法在序列長度和預(yù)測(cè)強(qiáng)度上必須做出取舍,但AlphaGenome能在長DNA序列中做出高分辨率預(yù)測(cè)。
在本項(xiàng)研究中,谷歌DeepMind團(tuán)隊(duì)展示了AlphaGenome的能力,這一深度學(xué)習(xí)模型用人類和小鼠基因組訓(xùn)練來學(xué)習(xí)DNA序列如何影響不同生物學(xué)過程。AlphaGenome可以即時(shí)預(yù)測(cè)5930種人類或1128種小鼠遺傳信號(hào),這些信號(hào)與特定功能有關(guān),如基因表達(dá)、剪接(基因組的切割與重組)和蛋白質(zhì)修飾。在26項(xiàng)變異效果預(yù)測(cè)評(píng)估中,其結(jié)果在25項(xiàng)中與現(xiàn)有頂尖模型表現(xiàn)相當(dāng)或更優(yōu)。因此,該模型優(yōu)勢(shì)在于能同時(shí)對(duì)多種遺傳信號(hào)和生物學(xué)結(jié)果進(jìn)行多重預(yù)測(cè)。
研究團(tuán)隊(duì)總結(jié)表示,進(jìn)一步改進(jìn)這一工具或能拓展其應(yīng)用,例如增加涵蓋的物種,或拓展模型能識(shí)別的非編碼序列范圍。未來,AlphaGenome有望深化對(duì)DNA序列變異引發(fā)的復(fù)雜生物學(xué)結(jié)果的理解。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。