哥倫比亞大學瓦格洛斯內外科醫(yī)學院團隊開發(fā)了一種創(chuàng)新的人工智能(AI)模型——通用表達轉換器(GET),該模型能夠精確預測人類細胞內的基因活動,為理解細胞內部工作機制提供了全新視角。這項突破性成果可幫助科學家以前所未有的方式,探索從癌癥到遺傳疾病等一系列健康問題,推動醫(yī)學研究向前邁進一大步。相關論文發(fā)表在最新一期《自然》雜志上。
傳統(tǒng)生物學方法擅長描述細胞的工作原理,以及它們如何響應外界變化,但缺乏對細胞行為及其對變化(例如致癌突變)反應的預測能力。相比之下,GET模型能夠準確預測細胞活動,這標志著生物學從一個主要依賴描述性分析的領域,轉變?yōu)榭梢灶A測并調控細胞行為背后系統(tǒng)的科學。
此次,團隊利用AI預測特定細胞內活躍的基因,這類信息對于確定細胞身份及功能至關重要。他們利用來自正常人體組織的數(shù)百萬個細胞的基因表達數(shù)據(jù)訓練了一個機器學習模型,這些數(shù)據(jù)不僅包括基因組序列,也涵蓋了有關基因組哪些部分是可訪問和表達的信息。
GET模型的整體思路與ChatGPT等大型語言模型相仿:通過訓練數(shù)據(jù)識別基礎規(guī)則(如語言語法),然后將這些規(guī)則應用于新場景。經過數(shù)據(jù)訓練后,GET模型變得足夠精準,可以預測未曾見過的細胞類型中的基因表達模式,并且結果與實驗數(shù)據(jù)高度一致。
此外,團隊還使用GET模型揭示了患病細胞中隱藏的生物機制。在一個具體案例中,針對一種遺傳性兒童白血病的研究顯示,AI成功預測了某些突變會破壞決定白血病細胞命運的兩種轉錄因子之間的互動,實驗證實了AI的預測。這增強了人們對這種疾病驅動機制的理解。
這項研究不僅為探索多種疾病病理開辟了新途徑,也為發(fā)現(xiàn)新的治療靶點提供了可能,F(xiàn)在,科學家可以通過向計算機模型輸入新發(fā)現(xiàn)的突變,來了解和預測這些突變對細胞的具體影響。
(責任編輯:華康)