成人aⅴ综合视频国产,国产猛烈无遮掩视频免费网站男女,亚洲精品高清在线一区二区三区,午夜第九超神福利电影网,成年女人看片免费视频播放器

人工智能揭秘DNA中的“暗物質(zhì)”

2025-07-01 09:12 來(lái)源:科技日報
查看余下全文
(責任編輯:馬常艷)
手機看中經(jīng)經(jīng)濟日報微信中經(jīng)網(wǎng)微信
當前位置     首頁(yè) > 新聞 > 科教更多新聞 > 正文
中經(jīng)搜索

人工智能揭秘DNA中的“暗物質(zhì)”

2025年07月01日 09:12   來(lái)源:科技日報   

【科技創(chuàng )新世界潮】

◎本報記者 張佳欣

2003年,科學(xué)家首次對人類(lèi)基因組進(jìn)行測序,揭示了構成我們生命“藍圖”的全部DNA序列。盡管98%的基因組不直接編碼蛋白質(zhì),它們仍深刻影響著(zhù)基因的調控和細胞功能。這些非編碼區域曾被視為“垃圾DNA”,但如今被認為可能蘊藏著(zhù)重要的生物學(xué)秘密,就像是基因界的“暗物質(zhì)”。

今年6月25日,“深度思維”公司宣布,他們開(kāi)發(fā)出一款名為AlphaGenome(阿爾法基因組)的人工智能(AI)模型,有望在破譯這一“暗物質(zhì)”上取得突破?!蹲匀弧冯s志報道稱(chēng),這一“從序列到功能”的模型能預測DNA中微小變化會(huì )對一系列分子過(guò)程產(chǎn)生的影響,為解碼人類(lèi)基因調控機制提供了新路徑。

解釋DNA序列的“一體化”工具

深度思維公司在2020年推出的“阿爾法折疊2”(AlphaFold 2),成功破解了一個(gè)困擾科學(xué)界數十年的難題:如何根據蛋白質(zhì)的氨基酸序列,準確預測其三維結構。這一突破不僅改變了結構生物學(xué)研究方式,也推動(dòng)了新藥研發(fā)的進(jìn)程。

相比之下,要理解DNA序列的功能則更加復雜,因為它不像蛋白質(zhì)那樣擁有一個(gè)確定的“正確答案”。這些功能主要體現在DNA對基因表達的調控上,比如決定基因什么時(shí)候開(kāi)啟或關(guān)閉,在哪些細胞中發(fā)揮作用,以及以何種強度表達。

如果說(shuō)蛋白質(zhì)結構預測是在拼出“零件”的立體模型,那么DNA功能預測就是要理解說(shuō)明書(shū)中每一個(gè)符號、注釋、開(kāi)關(guān)命令甚至“暗物質(zhì)”區域的真正含義。其中涉及的信息層級更復雜、關(guān)聯(lián)更廣泛,且同一個(gè)DNA片段可能在不同時(shí)間、不同細胞類(lèi)型中扮演不同角色,因此建模難度遠高于蛋白質(zhì)。

幾十年來(lái),生物學(xué)家嘗試用各種計算工具來(lái)揭示DNA復雜而隱秘的調控機制,但這些模型往往聚焦于單一功能??茖W(xué)家們渴望一種用于解釋DNA序列的“一體化”工具,于是,“阿爾法基因組”應運而生。

據美國趣味工程網(wǎng)站報道稱(chēng),與以往需在“序列長(cháng)度”與“預測精度”之間取舍的模型不同,“阿爾法基因組”實(shí)現了二者兼得。它既能捕捉長(cháng)程基因組上下文信息,又能提供堿基層面的精準預測,拓展了疾病生物學(xué)、罕見(jiàn)變異研究、合成DNA設計等領(lǐng)域的研究視野。

一次可處理百萬(wàn)個(gè)堿基對

據深度思維官網(wǎng)介紹,該模型一次可處理多達100萬(wàn)個(gè)堿基對,并預測數千種分子屬性,包括基因表達、剪接模式、蛋白質(zhì)結合位點(diǎn)和染色質(zhì)可及性,覆蓋多種不同類(lèi)型的細胞。這是首次有AI系統能聯(lián)合建模如此廣泛的調控特征。

“阿爾法基因組”訓練所用的數據集來(lái)自多個(gè)公開(kāi)的超大規模數據資源。令人驚訝的是,訓練一個(gè)完整模型僅需4小時(shí),且所需計算資源僅為前代模型的一半。在26項基準測試中,其有24項表現優(yōu)于或持平于專(zhuān)用模型。

新模型的一大亮點(diǎn)是其變異評分系統,能高效對比突變前后的DNA序列,并跨多種生物通路評估其影響。

“阿爾法基因組”還具備剪接位點(diǎn)建模功能,這是首次有模型能夠預測與囊性纖維化、脊髓性肌萎縮等疾病相關(guān)的RNA剪接異常。

在合成生物學(xué)領(lǐng)域,“阿爾法基因組”可用于設計特定的調控序列,例如僅在神經(jīng)細胞中激活某些基因,而在肌肉細胞中保持沉默。同時(shí),它也有望用于研究生物效應強烈的罕見(jiàn)遺傳變異,如導致孟德?tīng)栠z傳病的突變。

在一項驗證中,研究人員將“阿爾法基因組”應用于先前研究中識別出的某種白血病相關(guān)突變。結果,該模型準確預測出,某些非編碼區變異會(huì )間接激活附近的TAL1致癌基因,這一機制正是T細胞急性淋巴細胞白血病中已知的致病過(guò)程。

模型尚不適用于個(gè)體診斷

盡管“阿爾法基因組”的表現令人矚目,但深度思維團隊表示,該系統目前仍存在很多限制。它并未設計用于個(gè)體基因組解讀,也無(wú)法像23andMe或臨床基因檢測那樣預測疾病風(fēng)險或祖源信息。也就是說(shuō),該模型不適用于個(gè)體診斷或醫療決策。

“阿爾法基因組”目前的訓練數據僅限于人類(lèi)和小鼠,尚未覆蓋其他物種,其跨物種適應性尚待驗證。同時(shí),它在識別調控元件與遠距離靶基因(距離超過(guò)10萬(wàn)個(gè)堿基)之間關(guān)系方面的能力仍較弱,也無(wú)法完全建模細胞在不同狀態(tài)、不同組織中的動(dòng)態(tài)調控機制。

美國冷泉港實(shí)驗室計算生物學(xué)家彼得·庫指出:“這些模型往往是在一個(gè)固定條件下訓練的,但現實(shí)中的細胞是動(dòng)態(tài)的,蛋白質(zhì)水平、DNA化學(xué)修飾、轉錄狀態(tài)等都會(huì )隨時(shí)間和環(huán)境變化,這些變化會(huì )顯著(zhù)影響同一段DNA序列的行為?!币虼?,未來(lái)模型需要引入更多“多模態(tài)”“多時(shí)間尺度”因素,才能更真實(shí)地模擬生物過(guò)程。

(責任編輯:馬常艷)

成人aⅴ综合视频国产,国产猛烈无遮掩视频免费网站男女,亚洲精品高清在线一区二区三区,午夜第九超神福利电影网,成年女人看片免费视频播放器