-
潘禺:在這迷人又壯美的科學(xué)領(lǐng)域,“中國玩家”能奮起直追嗎?
最后更新: 2024-10-10 08:34:47在賈姆珀的領(lǐng)導(dǎo)下,AlphaFold被更新重建了,DeepMind設(shè)計(jì)了一種新型的Transformer架構(gòu),神經(jīng)網(wǎng)絡(luò)調(diào)整了其連接的強(qiáng)度,以創(chuàng)建更準(zhǔn)確的蛋白質(zhì)進(jìn)化和結(jié)構(gòu)數(shù)據(jù)表示。
AlphaFold2的預(yù)測效率和準(zhǔn)確性有了巨大提高。DeepMind找了大約50篇發(fā)表在《科學(xué)》、《自然》和《細(xì)胞》等高端期刊上的論文,這些論文都是實(shí)驗(yàn)主義者的辛勤工作成果,描述新的蛋白質(zhì)結(jié)構(gòu)和功能,將AlphaFold2的預(yù)測結(jié)果與之對照,可以繼續(xù)打磨改進(jìn)。
在2020年的CASP比賽中,評估員將預(yù)測的蛋白質(zhì)結(jié)構(gòu)與經(jīng)過驗(yàn)證的實(shí)驗(yàn)結(jié)構(gòu)進(jìn)行比較來打分,100分即模型和現(xiàn)實(shí)在原子層面上完全匹配。AlphaFold2的大多數(shù)結(jié)構(gòu)都達(dá)到或超過了90分。大多數(shù)情況下,算法都有效。
DeepMind已經(jīng)解決了蛋白質(zhì)折疊問題中的結(jié)構(gòu)預(yù)測部分。AlphaFold2能夠準(zhǔn)確地根據(jù)其氨基酸序列預(yù)測蛋白質(zhì)的結(jié)構(gòu)。對于因疫情封鎖在家,通過Zoom參加CASP會議看到AlphaFold2演示的科學(xué)家們來說,這個(gè)小小震撼意味著,蛋白質(zhì)科學(xué)的世界已經(jīng)永遠(yuǎn)改變了。
設(shè)計(jì)蛋白質(zhì):逆蛋白質(zhì)折疊問題
長期以來,實(shí)驗(yàn)生物學(xué)家對計(jì)算持懷疑態(tài)度,AlphaFold2的成功無疑改變了這一點(diǎn),但如果說“改變一切”,就有些夸大其詞。
AlphaFold2并不等于結(jié)構(gòu)生物學(xué)家的失業(yè)。
當(dāng)然,失業(yè)總會存在。一些細(xì)胞生物學(xué)家和生物化學(xué)家過去常常與結(jié)構(gòu)生物學(xué)家合作,現(xiàn)在他們已經(jīng)用AlphaFold2來取代。盡管,訓(xùn)練AlphaFold的數(shù)據(jù),是結(jié)構(gòu)生物學(xué)家過去用一個(gè)個(gè)實(shí)驗(yàn)精心確定的。
結(jié)構(gòu)生物學(xué)的技術(shù),除了前面說的X射線晶體學(xué),還有冷凍電鏡、NMR 波譜、雙偏振干涉測量等技術(shù)。
而中國公眾可能對冷凍電鏡比較熟悉。這一昂貴的設(shè)備(Cryo-EM,冷凍電子顯微鏡),其原理是快速冷凍生物樣品并用電子束轟擊它們。X射線晶體學(xué)需要蛋白質(zhì)結(jié)晶,而冷凍電鏡能夠處理非晶態(tài)樣品。X射線晶體學(xué)在高分辨率原子級結(jié)構(gòu)方面有優(yōu)勢,而冷凍電鏡在解析大型復(fù)合物和動態(tài)過程中更為強(qiáng)大。過去十年中,冷凍電鏡發(fā)展迅速,成為解析復(fù)雜生物大分子結(jié)構(gòu)的重要工具之一。廣為公眾熟知的中國科學(xué)家施一公、顏寧等人,都是用冷凍電鏡解析蛋白質(zhì)結(jié)構(gòu)的專家。
結(jié)構(gòu)生物學(xué)家顏寧
如果結(jié)構(gòu)生物學(xué)家僅僅研究蛋白質(zhì)結(jié)構(gòu),那他們當(dāng)然失業(yè)了。但結(jié)構(gòu)生物學(xué)家的目標(biāo)是發(fā)現(xiàn)蛋白質(zhì)的功能。有了AlphaFold2,他們就有了一個(gè)更好的工具,可以在幾分鐘內(nèi)創(chuàng)建一個(gè)假設(shè),而不是等待幾個(gè)月甚至幾年通過實(shí)驗(yàn)來確定一個(gè)結(jié)構(gòu)。
結(jié)構(gòu)生物學(xué)家的角色不僅僅是獲取結(jié)構(gòu)數(shù)據(jù),還包括解釋這些數(shù)據(jù)、設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證假設(shè),并理解蛋白質(zhì)功能和與疾病相關(guān)的機(jī)制。這個(gè)問題就像AIGC會不會讓創(chuàng)作者失業(yè)。ChatGPT能告訴你的答案也許準(zhǔn)確度已經(jīng)很高,但未必完美,對AI大模型生成的內(nèi)容,每一個(gè)創(chuàng)作者都還需要仔細(xì)甄別、驗(yàn)證,并理解這些內(nèi)容的真正意義,用這些內(nèi)容為自己和社會創(chuàng)造價(jià)值。
AlphaFold2的不完美在于,在預(yù)測簡單的小型蛋白質(zhì)結(jié)構(gòu)方面,非常出色,但在預(yù)測包含多個(gè)部分的蛋白質(zhì),動態(tài)蛋白質(zhì)(與其他分子相互作用時(shí),形狀會發(fā)生變化)時(shí),準(zhǔn)確性較低。有時(shí),蛋白質(zhì)需要被特定的離子、鹽或金屬包圍才能正確折疊,自然環(huán)境會改變蛋白質(zhì)的形狀,AlphaFold2并不能考慮。
僅僅識別已知蛋白質(zhì)的結(jié)構(gòu)和功能是不夠的。
對于新藥研發(fā)來說,科學(xué)家需要設(shè)計(jì)那些在自然界中不存在的蛋白質(zhì),這就是蛋白質(zhì)設(shè)計(jì),也可以理解為“逆蛋白質(zhì)折疊問題”。還記得用AI解決蛋白質(zhì)折疊問題是什么意思嗎?無非就是向深度學(xué)習(xí)算法輸入氨基酸序列,要求其輸出蛋白質(zhì)結(jié)構(gòu)。這個(gè)問題逆過來,就是設(shè)計(jì)師將一個(gè)蛋白質(zhì)結(jié)構(gòu)輸入算法,并要求其輸出氨基酸序列。然后,設(shè)計(jì)師使用那個(gè)氨基酸序列在實(shí)驗(yàn)室中構(gòu)建蛋白質(zhì)。
宋樂就曾講過,要設(shè)計(jì)一段有效的蛋白質(zhì),“有20個(gè)不同的位置,每個(gè)位置有20種不同的選擇。這是一個(gè)巨大的空間,人的思維很難對這個(gè)空間進(jìn)行整體的篩選或?qū)Ρ?,而?jì)算機(jī)來做這件事就有巨大優(yōu)勢?!?
Foldit游戲的創(chuàng)建者貝克,就做了一個(gè)專門用于設(shè)計(jì)的算法,稱為RoseTTAFold diffusion,F(xiàn)oldit游戲本身也更新了設(shè)計(jì)蛋白質(zhì)的版本。蛋白質(zhì)設(shè)計(jì)并非新鮮事物,但深度學(xué)習(xí)加速了其發(fā)展。以前,訓(xùn)練有素的蛋白質(zhì)設(shè)計(jì)師需要花費(fèi)數(shù)周或數(shù)月的時(shí)間,才能創(chuàng)建新蛋白質(zhì)的主鏈。現(xiàn)在他們可以在幾天內(nèi),甚至一夜之間完成。
AlphaFold3與中國玩家
2022年,谷歌DeepMind發(fā)布了全球已知的2.18億種蛋白質(zhì)的結(jié)構(gòu)預(yù)測,這幾乎就是所有。其競爭對手Meta公司也于當(dāng)年推出了蛋白質(zhì)結(jié)構(gòu)預(yù)測模型ESMFold。
但AlphaFold2仍有缺陷,比如前文提到的無法考慮環(huán)境。細(xì)胞內(nèi)部是復(fù)雜的生物學(xué)環(huán)境,充滿了各種分子——蛋白質(zhì)、信號分子、信使RNA、細(xì)胞器等,蛋白質(zhì)不是獨(dú)立工作,而是不斷與其他分子相互作用,這會改變其自身的形式和功能。將細(xì)胞分子的景觀渲染出來,可視化呈現(xiàn),你會看到非常壯美的復(fù)雜性。
真核細(xì)胞的細(xì)胞景觀橫截面,渲染圖顯示了其復(fù)雜而壯美
AlphaFold2的能力限于預(yù)測單一蛋白質(zhì)結(jié)構(gòu),而要幫助生物學(xué)家理解這個(gè)復(fù)雜原生環(huán)境中的蛋白質(zhì),就是這一領(lǐng)域現(xiàn)在的發(fā)展方向。2024年春,谷歌DeepMind更新算法,發(fā)表了AlphaFold3的論文,大衛(wèi)·貝克則推出了RoseTTAFold All-Atom算法,都致力于能夠預(yù)測蛋白質(zhì)互相結(jié)合,或與DNA、RNA和其他小分子結(jié)合時(shí)的結(jié)構(gòu)。
AlphaFold3能預(yù)測分子復(fù)合物的結(jié)構(gòu),比如某種在植物真菌中發(fā)現(xiàn)的酶。根據(jù)業(yè)內(nèi)專家的分析,目前這些算法的準(zhǔn)確性仍有待改進(jìn),不太可能很快帶來新藥。一個(gè)重要變化是,AlphaFold2的基礎(chǔ)代碼是開源的,每個(gè)人都可以研究算法并為自己的項(xiàng)目重建,但谷歌沒有開源AlphaFold3。
中國企業(yè)也在加入AI+生命科學(xué)的領(lǐng)域。基于AlphaFold2算法改進(jìn),華為昇思MindSpore團(tuán)隊(duì),采用自己的昇騰計(jì)算平臺,在2022年4月一度拿下CAMEO這一蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽的第一名,這個(gè)比賽每周都會在線更新分?jǐn)?shù)和名次。
2020年創(chuàng)立的百圖生科,則致力于搭建“xTrimo”生命科學(xué)大模型,這是一個(gè)雄心勃勃的超大規(guī)模多模態(tài)模型體系,在底座通用模型上,除了蛋白質(zhì)生成模型,還有多個(gè)下游任務(wù)模型共同組成。比如靶點(diǎn)發(fā)現(xiàn),也就是免疫細(xì)胞擾動后功能變化預(yù)測模型。
當(dāng)發(fā)現(xiàn)了一個(gè)疾病靶點(diǎn)后,就要設(shè)計(jì)一個(gè)蛋白質(zhì)。
如果將疾病相關(guān)的靶點(diǎn)想象成一把鎖,設(shè)計(jì)蛋白質(zhì)就是配鑰匙,要打開鎖,鎖齒和鑰匙就要契合,這就需要模型來預(yù)測。因此蛋白質(zhì)生成不僅要預(yù)測結(jié)構(gòu),還要預(yù)測蛋白質(zhì)與靶點(diǎn)的契合度,也就是結(jié)合的緊密強(qiáng)弱,然后再對AI生成的許多設(shè)計(jì)做篩選,將最合適的送去試驗(yàn)。
xTrimo有多個(gè)層次,第一層是對單個(gè)蛋白質(zhì)的建模,第二層是對細(xì)胞中蛋白質(zhì)相互作用的建模,第三層是對細(xì)胞本身的建模,第四層則是對細(xì)胞系統(tǒng)的建模。因而,這個(gè)體系不僅能表征單體蛋白質(zhì),還能表征蛋白質(zhì)相互作用、免疫細(xì)胞、免疫系統(tǒng)等多層次生物問題,幫助研究者更快發(fā)現(xiàn)新的蛋白質(zhì)、新的細(xì)胞形態(tài),發(fā)現(xiàn)新的靶點(diǎn)和藥物設(shè)計(jì)方向。
為此,百圖生科構(gòu)建了世界最大的免疫圖譜,包含66億個(gè)蛋白,超300億條蛋白互作關(guān)系,1億個(gè)單細(xì)胞,以及超6100萬條免疫互作關(guān)系和6000億條泛細(xì)胞共現(xiàn)關(guān)系。
結(jié)語
生命體的高度復(fù)雜,還遠(yuǎn)不是AI科學(xué)家使用的龐大但依然有限的數(shù)據(jù)量就能揭示的。
蛋白質(zhì)折疊問題仍未完全解決。AI能識別出給定氨基酸序列可能的折疊模式,但蛋白質(zhì)折疊過程中,究竟發(fā)生了什么,其中的信息依然是黑箱。對于理解整件事發(fā)生的過程,AI并不能給出答案,深度學(xué)習(xí)算法無法告訴我們基于蛋白質(zhì)的生命機(jī)制和本質(zhì),無法告訴我們背后的基本物理原理。如果只有結(jié)果,沒有過程,這還是科學(xué)嗎?
無論如何,科學(xué)確實(shí)在前進(jìn)。70年前,人們還認(rèn)為蛋白質(zhì)只是一種凝膠狀物質(zhì)。但今天,我們看到了蛋白質(zhì)世界的一個(gè)又一個(gè)結(jié)構(gòu)。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
標(biāo)簽 心智觀察所- 原標(biāo)題:在這迷人又壯美的科學(xué)領(lǐng)域,“中國玩家”能奮起直追嗎? 本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 袁以衡 
-
我國科技成果轉(zhuǎn)化問題到了必須要解決的地步
2024-10-08 16:58 心智觀察所 -
2024年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)揭曉
2024-10-07 17:45 諾貝爾獎(jiǎng) -
跨越7公里!我科學(xué)家研究分布式光量子計(jì)算獲重要進(jìn)展
2024-10-07 10:00 科技前沿 -
潘建偉:明年計(jì)劃發(fā)射2-3顆低軌衛(wèi)星,10年內(nèi)建成量子星座
2024-10-04 09:43 科技前沿 -
國際首次!我國科研團(tuán)隊(duì)完成超導(dǎo)太赫茲通信實(shí)驗(yàn)
2024-10-03 19:57 科技前沿 -
突破!我科研人員在高溫超導(dǎo)研究領(lǐng)域取得新進(jìn)展
2024-10-03 10:23 科技前沿 -
打破國外壟斷!全球最大,成功下線
2024-09-30 11:26 中國精造 -
新突破!自主可控,首試成功
2024-09-27 20:41 科技前沿 -
2024全球創(chuàng)新指數(shù)發(fā)布:中國居第11
2024-09-27 07:11 -
重要突破!我國科研人員發(fā)現(xiàn)能強(qiáng)效抑制艾滋病病毒的納米抗體
2024-09-26 08:06 科技前沿 -
全球首座!我國海上稠油熱采關(guān)鍵技術(shù)取得重大突破
2024-09-25 08:34 能源戰(zhàn)略 -
一箭五星!力箭一號遙四商業(yè)運(yùn)載火箭發(fā)射成功
2024-09-25 08:04 航空航天 -
“蛟龍?zhí)枴笔状未钶d外籍科學(xué)家進(jìn)行下潛作業(yè)
2024-09-25 07:41 科技前沿 -
中國將在月球上建無線網(wǎng)
2024-09-24 19:44 嫦娥奔月 -
為了美國的“新質(zhì)生產(chǎn)力”,雷蒙多操碎了心
2024-09-24 12:01 心智觀察所 -
月背“土特產(chǎn)”將開放申請!先發(fā)給國內(nèi)科學(xué)家研究
2024-09-24 09:06 科技前沿 -
可用上千年!效率最高的輻光伏核電池在我國面世
2024-09-24 07:22 能源戰(zhàn)略 -
42.02萬高斯!我國打破美國創(chuàng)造的世界紀(jì)錄
2024-09-22 17:00 科技前沿 -
美國開始重新審視量子計(jì)算機(jī),這對中國很重要
2024-09-20 08:45 心智觀察所 -
俄羅斯擁抱西方的舊夢:“瓦森納協(xié)定”正走向歷史垃圾堆
2024-09-18 07:45 心智觀察所
相關(guān)推薦 -
最新聞 Hot
-
“美國政府像青少年,拿信用卡揮霍,直到…”
-
“聽到東方驚雷了嗎?那是14億中國人在笑話美國”
-
“以色列和俄羅斯正進(jìn)行秘密會談”
-
“不同于西方,中國正建設(shè)由技術(shù)驅(qū)動的福利模式”
-
中國駐泰國大使館:被騙至緬甸的男模特已獲救
-
“越南在走鋼絲,稍有不慎,就會惹惱中國”
-
最新民調(diào):4成支持馬斯克成立新政黨
-
美伊下周在挪威談?
-
“俄美有興趣共同實(shí)施經(jīng)濟(jì)領(lǐng)域一些‘有前景的項(xiàng)目’,特別是能源”
-
人才引進(jìn)被舉報(bào)中止1年后,再招考入圍名單與此前一致?包頭通報(bào)
-
特朗普威脅:周五,接關(guān)稅吧
-
“歐洲領(lǐng)導(dǎo)人向我求助,我提了建議”
-
“我簽署時(shí)候,B-2、F-22將從頭頂飛過”
-
天文學(xué)家發(fā)現(xiàn)第三個(gè)進(jìn)入太陽系的“星際訪客”
-
馮德萊恩承認(rèn):來不及談成,退而求其次…
-
特朗普簽署行政令:外國游客得加錢
-