首頁 > 科技要聞 > 科技> 正文

清華率先開源AI制藥智能體平臺!生物科研進(jìn)入Autopilot時代

量子位 整合編輯:太平洋科技 發(fā)布于:2025-03-17 16:37

AI智能體,確實(shí)到了爆發(fā)時刻。

不論是因?yàn)闀闯鋈Φ腗anus,還是后續(xù)一眾迅速跟進(jìn)的OpenManus們……都在印證之前“AI智能體元年”的論斷——背后核心印證的是基礎(chǔ)大模型能力,已經(jīng)到了足夠支撐上層建筑的時候。

無獨(dú)有偶,在更加垂直專業(yè)的生命科學(xué)領(lǐng)域,AI智能體也迎來了標(biāo)志性事件。

就在最近,一個名為OpenBioMed的智能體平臺低調(diào)亮相,率先對外開源開放。作為全球首個AI制藥領(lǐng)域的智能體開源平臺,生命科學(xué)領(lǐng)域、制藥領(lǐng)域的研發(fā)人員人人可用。

生命科學(xué)研究,開始進(jìn)入智能體驅(qū)動的新范式時代。

而驅(qū)動OpenBioMed智能體平臺的,是清華智能產(chǎn)業(yè)研究院(AIR)和清華系專注于AI制藥的高精尖創(chuàng)業(yè)公司——水木分子。

以及雖然是新團(tuán)隊(duì),但核心人物卻是AI老面孔——大牛聶再清,他是水木分子的首席科學(xué)家,也是前天貓精靈背后的首席AI科學(xué)家,一個因?yàn)锳I騷擾電話不堪其擾而打造“二哈”反騷擾AI的硬核程序員。

現(xiàn)在,他希望通過為制藥研發(fā)人員打造智能體,把AI之力,AI智能體之用,帶入每一個人都是受眾、每一個人都會受益的制藥產(chǎn)業(yè)中。

清華果然是清華,俠之大者果然為國為民。

恰如清華大學(xué)智能科學(xué)講席教授、清華大學(xué)AIR院長張亞勤院士所說,經(jīng)過近四年的發(fā)展,清華大學(xué)AIR已匯聚了一批既懂科研又懂產(chǎn)業(yè)的人工智能領(lǐng)域?qū)W者:

如今,大模型與生成式AI技術(shù)正引領(lǐng)科學(xué)研究進(jìn)入一個全新的人機(jī)協(xié)作新范式。生命科學(xué)智能體的出現(xiàn)與廣泛應(yīng)用,將徹底改變科學(xué)發(fā)現(xiàn)的進(jìn)程,大幅提升科研效率。

在這一新范式下,科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問題和任務(wù)描述,充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗(yàn)和直覺。而智能體則通過高通量的文獻(xiàn)閱讀、海量實(shí)驗(yàn)數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行,成為科學(xué)家最得力的助手。這種深度的人機(jī)協(xié)作,將推動科學(xué)研究進(jìn)入一個全新的時代。

全球首個生命科學(xué)與制藥智能體開源平臺

名叫OpenBioMed,架構(gòu)如下:

最底層是AI制藥任務(wù)用到的科研數(shù)據(jù)和知識圖譜,中間則是專為生命科學(xué)和制藥打造的垂直大模型和該領(lǐng)域研發(fā)中涉及的核心任務(wù)算法,然后最上層集成了最新最強(qiáng)的基座大語言模型、智能體設(shè)計(jì)平臺……

最后可以實(shí)現(xiàn)面向場景的定制化應(yīng)用。

流程全自動,效率指數(shù)級提升。

OpenBioMed可以實(shí)現(xiàn)什么?實(shí)現(xiàn)藥物設(shè)計(jì)項(xiàng)目、生命科學(xué)研究項(xiàng)目的Autopilot。

舉個例子,在過去,如果要發(fā)起一項(xiàng)藥物設(shè)計(jì),即便是一份報(bào)告生成,可能也需要一位老法師(制藥專家),描述需求后讓一個團(tuán)隊(duì)來配合執(zhí)行。

但如果通過水木分子打造的AI智能體平臺,完全可以Autopilot——老法師發(fā)出議題:針對攜帶KRAS G12C突變的局部晚期或轉(zhuǎn)移性非小細(xì)胞肺癌(NSCLC)患者,設(shè)計(jì)新型藥物分子。

接著AI智能體就會調(diào)動大模型展開推理,然后調(diào)用工具并形成工作流。

整個流程完全實(shí)現(xiàn)了完全自動化,大模型能力之下,整合了蛋白質(zhì)結(jié)構(gòu)分析、AI分子生成、計(jì)算篩選等技術(shù)和工具調(diào)用,形成從靶點(diǎn)分析到候選藥物確定的閉環(huán)設(shè)計(jì)報(bào)告。

顯而易見,按照Autopilot這樣的節(jié)奏,過往數(shù)周數(shù)月甚至數(shù)年的制藥設(shè)計(jì)周期,會被顯著加快。

而且容易忽略的是,由于基座大模型的加持,Autopilot對于老法師的門檻也在降低,即便無法實(shí)現(xiàn)“人人都是老法師”,但對于制藥領(lǐng)域的資源依賴降低也大有助益。

以及智能體可以7×24小時工作——未來制藥領(lǐng)域,可能會出現(xiàn)智能體在凌晨3點(diǎn)自主優(yōu)化分子結(jié)構(gòu)的場景。

需要說明的是,Autopilot是水木分子在制藥AI智能體上的最新成果,但不是全部路線。

作為智能雙引擎的另一個,基于旗下ChatDD——AI制藥領(lǐng)域的DeepSeek,水木分子還推出了Copilot模式,主打人類專家的“智能助手”。

在制藥領(lǐng)域,類似設(shè)計(jì)報(bào)告一樣的工作已經(jīng)是非常成熟、標(biāo)準(zhǔn)化的任務(wù),或者在某些特定領(lǐng)域中,智能體當(dāng)前的能力已經(jīng)足夠強(qiáng)大,可以達(dá)到人類專家的水平,Autopilot作為全流程自動化執(zhí)行角色,可以大大縮短研發(fā)周期。

而在需要高度專業(yè)知識和經(jīng)驗(yàn)的任務(wù)中,把關(guān)者和決策者就必須是人類專家。

所以有了Copilot模式,就可以實(shí)現(xiàn)智能體與人類專家共同協(xié)作,智能體提供輔助支持,但最終決策權(quán)在人類專家手中。

具體如針對難成藥靶點(diǎn)3D構(gòu)象生成、藥物篩選等任務(wù),Autopilot來執(zhí)行;AI靶點(diǎn)挖掘、驗(yàn)證實(shí)驗(yàn)方案優(yōu)化,則由Copilot來實(shí)現(xiàn)。

Autopilot和Copilot被水木分子視為生物醫(yī)藥的智能雙引擎,二者配合之下,可以顯著縮短研發(fā)周期,降低系統(tǒng)誤差,從而實(shí)現(xiàn)藥物研發(fā)成本的下降。

當(dāng)然,Autopilot和Copilot只是生命科學(xué)領(lǐng)域研發(fā)的最新進(jìn)展,是行業(yè)智能體落地應(yīng)用的表現(xiàn)。

在水木分子的設(shè)計(jì)中,完整的制藥研發(fā)新范式,由三部分構(gòu)成——

通用大模型底座+行業(yè)大模型+行業(yè)智能體。

三位一體,缺一不可。

一個時代有一個時代的制藥研發(fā)范式

大模型為核心技術(shù)的制藥研發(fā)范式,被水木分子命名為ChatDD,Chat Drug Design——對話式藥物設(shè)計(jì)。

ChatDD將專家的認(rèn)知和大模型的知識連接起來,通過人機(jī)協(xié)作對話式的方式進(jìn)行藥物研發(fā)。這一模式不僅重新定義了藥物研發(fā),還通過藥物研發(fā)AI智能體(Copilot / Autopilot)實(shí)現(xiàn)了更高的靈活性和效率。

而在此之前,連點(diǎn)成線回溯,人類的制藥研發(fā)大致歷經(jīng)了三大階段:

第一代:TMDD——傳統(tǒng)手工藥物設(shè)計(jì)。

在遠(yuǎn)古時代至19世紀(jì)末,藥物設(shè)計(jì)主要依賴傳統(tǒng)手工方法TMDD,Traditional Manual Drug Design)?茖W(xué)家通過手工合成、提取和篩選藥物,基于大量試驗(yàn)和經(jīng)驗(yàn)進(jìn)行探索。然而,這種方法存在低通量、缺乏系統(tǒng)性、耗時長和成本高等局限性。

第二代:CADD——計(jì)算機(jī)輔助藥物設(shè)計(jì)。

20世紀(jì)中葉,計(jì)算機(jī)技術(shù)的興起帶來了計(jì)算機(jī)輔助藥物設(shè)計(jì)CADD,Computer-Aided Drug Design)。CADD通過計(jì)算機(jī)技術(shù)加速藥物發(fā)現(xiàn)和設(shè)計(jì)過程,具有高通量篩選和工具屬性強(qiáng)的特點(diǎn),但仍依賴研究人員的經(jīng)驗(yàn)和直覺。

第三代:AIDD——人工智能藥物設(shè)計(jì)。

21世紀(jì)初,人工智能技術(shù)的發(fā)展推動了人工智能藥物設(shè)計(jì)AIDD,AI Drug Design)。AIDD具有超高通量和流程化的特點(diǎn),能夠從大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)中挖掘藥物發(fā)現(xiàn)和設(shè)計(jì)的規(guī)律。然而,AIDD缺乏模型與專家的交互,且對大規(guī)模高質(zhì)量標(biāo)注數(shù)據(jù)的依賴成為瓶頸。

在第四代制藥范式中,科學(xué)家的角色將更加聚焦于提出高質(zhì)量的問題和任務(wù)描述,充分發(fā)揮人類的創(chuàng)造力、經(jīng)驗(yàn)和直覺。

而智能體則通過高通量的文獻(xiàn)閱讀、海量實(shí)驗(yàn)數(shù)據(jù)分析、算法迭代與任務(wù)執(zhí)行,成為科學(xué)家最得力的助手。

按照水木分子的架構(gòu)圖譜,最底層是“知識”,上面是大模型和工具,再往上就是智能體,通過調(diào)用大模型能力,完成立項(xiàng)決策、臨床前藥物發(fā)現(xiàn)、藥物開發(fā)、臨床試驗(yàn)以及其他企業(yè)私有任務(wù)的部署。

但即便架構(gòu)圖譜清晰,路徑明確,智能體要真正成為第四代制藥范式的主角,就需要解決最核心的行業(yè)痛點(diǎn)——打通兩大模態(tài)

一個模態(tài)是文本模態(tài),或者可以稱為自然語言模態(tài),是通用大模型底座。

另一個模態(tài)則是生物模態(tài),以生物數(shù)據(jù)為“語言”,是行業(yè)大模型基礎(chǔ)。

類比來說,兩個模態(tài)很像目前基礎(chǔ)大模型領(lǐng)域文本和圖像兩個模態(tài),文生圖和圖生文如果要相互轉(zhuǎn)換,就需要“跨模態(tài)翻譯”,或者說對齊。

于是在生物數(shù)據(jù)大模型層面,水木分子打造了PharMolixFM。

它采用全原子建模的方式,把小分子、肽、蛋白質(zhì)、DNA、RNA和離子等結(jié)構(gòu)生物學(xué)研究對象的基本單元,實(shí)現(xiàn)了多尺度統(tǒng)一。

其次又把蛋白質(zhì)折疊、蛋白質(zhì)序列與結(jié)構(gòu)設(shè)計(jì)、大小分子對接、基于靶點(diǎn)的分子生成等多任務(wù)統(tǒng)一。

最終完成了全原子基礎(chǔ)大模型PharMolixFM。

該模型在多個關(guān)鍵任務(wù)上也實(shí)現(xiàn)了SOTA,包括分子對接任務(wù)、基于靶點(diǎn)結(jié)構(gòu)的藥物設(shè)計(jì)任務(wù)等,都在對應(yīng)的行業(yè)基準(zhǔn)測試數(shù)據(jù)集,創(chuàng)造了性能新紀(jì)錄。

并且為了把分子結(jié)構(gòu)翻譯為化學(xué)家可理解且機(jī)器可利用的文本,水木分子還打造了“圖生文”工具OCSU。

在通用大模型層面,基于最新DeepSeek-R1帶來的推理技術(shù),站在行業(yè)巨人肩膀上,水木分子與清華AIR聯(lián)手推出了升級版的生物醫(yī)藥多模態(tài)開源基礎(chǔ)大模型BioMedGPT-R1,把強(qiáng)推理慢思考的范式,帶到了醫(yī)藥研發(fā)領(lǐng)域。

效果也非常顯著,不僅以67.1%的正確率通過了USMLE美國醫(yī)師資格考試,還在CheBI-20化學(xué)分子理解任務(wù)中,實(shí)現(xiàn)了15%的性能提升,進(jìn)一步提高了由BioMedGPT-10B創(chuàng)造的最好成績。

而這一系列技術(shù)能力和工具,被封裝集成,然后在智能體平臺OpenBioMed實(shí)現(xiàn)了All in One。

更難能可貴的是,作為全球首個該領(lǐng)域的智能體平臺,OpenBioMed發(fā)布即開源,或者說為開源而生——OpenBioMed站在了開源基礎(chǔ)大模型、開源生命科學(xué)成果的基礎(chǔ)上,然后也通過開源的方式,進(jìn)一步把智能火炬?zhèn)鬟f更深入、更廣泛。

匯集眾智,賦予眾人。

在制藥或者更廣泛的生命科學(xué)研發(fā)領(lǐng)域,如果最好的資源能無差別覆蓋到更多研發(fā)者,或許會讓整個領(lǐng)域的推進(jìn)更快更高效,一旦生物醫(yī)藥領(lǐng)域進(jìn)入了涌現(xiàn)期,商業(yè)價值和社會價值,無疑會輻射到每一個人。

但依然有問題懸而未決,作為水木分子首席科學(xué)家,聶再清不只一次被問及這個問題——

會有AI獨(dú)立制藥的一天嗎?

“AI在制藥領(lǐng)域必須是助手”

“AI在制藥領(lǐng)域,必須是助手!

這就是水木分子首席科學(xué)家聶再清的回答。實(shí)際上,作為科學(xué)家、AI領(lǐng)域的大牛,聶再清很少有如此絕對的論斷,但這一次他無比肯定,他補(bǔ)充說,從價值觀上就需要明確AI的“助手”設(shè)定。

這也是AI在深入生命科學(xué)等前沿領(lǐng)域之時,常被人討論的話題。

一方面,AI的能力正在不斷突破人類的極限,或許用不了多久,AI就會獨(dú)立發(fā)現(xiàn)新規(guī)律、新材料、新方法,人類已經(jīng)不再是最聰明的那一個;另一方面,生命醫(yī)藥領(lǐng)域關(guān)系的是人類最基本最脆弱的身體健康……

有一派的觀點(diǎn)是需要最大化助力AI的發(fā)展,包括在“獨(dú)立”問題上,因?yàn)橹挥腥绱瞬拍艽蛟斐稣嬲龔?qiáng)大的AI模型和系統(tǒng),如果硅基正在覺醒,那碳基讓出統(tǒng)治權(quán)也是歷史發(fā)展的必然選擇。

但另一派不這樣認(rèn)為,他們堅(jiān)守的依然是“以人為本”的原則和信條,AI需要為人所用、幫助人向善,并且從一開始設(shè)計(jì)的時候就要確保其安全性。

很顯然,聶再清選擇站在以人為本這一邊。

他本科碩士都畢業(yè)于清華大學(xué)計(jì)算機(jī)系,博士師從美國人工智能學(xué)會前主席Subbarao Kambhampati教授,先后在微軟、阿里巴巴達(dá)摩院從事AI技術(shù)研發(fā),是能力、資歷和影響力兼具的AI大牛,帶隊(duì)獲得過中國AI領(lǐng)域的最高獎項(xiàng)吳文俊人工智能科技進(jìn)步獎。

2020年開始,他獲得張亞勤院士感召,加入清華大學(xué)AIR智能產(chǎn)業(yè)研究院,擔(dān)任清華大學(xué)國強(qiáng)教授、清華大學(xué)智能產(chǎn)業(yè)研究院首席研究員,并以水木分子首席科學(xué)家身份對外亮相。

但聶再清自己來說,他覺得自己始終在做的事情只有一件——

智能助手。

他說從微軟亞洲研究院開始,做的其實(shí)就是“助手”相關(guān)的工作,比爾蓋茨對智能助手“Personal Assistant”情有獨(dú)鐘,希望打造出一套人機(jī)交互里的完美助手。

后來去阿里巴巴達(dá)摩院,負(fù)責(zé)的天貓精靈,更是直接的AI助手,只不過交互方式更偏向于語音。

現(xiàn)在在清華大學(xué)智能產(chǎn)業(yè)研究院,“AI助手”也是其主軸,水木分子所做的事情,只不過是把“助手”放在了AI與生命科學(xué)兩大前沿的交叉創(chuàng)新地帶。

即便Agent智能體的定義業(yè)內(nèi)還沒有清晰的共識,但聶再清看來,AI智能體就是AI助手的另一種表述——更時髦流行的表述而已。

水木分子為生物制藥領(lǐng)域的研發(fā)人員提供Autopilot和Copilot兩種智能體可選模式。

OpenBioMed是由清華AIR和水木分子共同推出的全球首個生命科學(xué)與制藥智能體開源平臺,可以開源供業(yè)界開發(fā)生物醫(yī)藥智能體。

ChatDD是水木分子的商用平臺和產(chǎn)品,通過Copilot助手和AutoPilot智能體兩種模式,支持多種醫(yī)藥行業(yè)和企業(yè)的藥研任務(wù),場景包括例如: 立項(xiàng)、藥物設(shè)計(jì)和分析報(bào)告生成等。

二者放在一起,組成的就是生物醫(yī)藥的智能雙引擎,可以幫助更多科學(xué)家接近他們曾經(jīng)在科幻里才能接近的向往——

之前有個統(tǒng)計(jì)說,讓科學(xué)家選擇想成為的超級英雄,最后被選擇最多的角色是:鋼鐵俠。以為他以凡人之軀,借助科技之力比肩神明,打造AI助手發(fā)現(xiàn)了新元素、新材料、完成了時空穿越的模型驗(yàn)證。

哪個科學(xué)家不想擁有一個賈維斯\星期五?

現(xiàn)在,水木分子邁出了引領(lǐng)全球的一步,率先開源OpenBioMed的智能體平臺,希望生物醫(yī)藥研發(fā)人員,每一個都可以變成鋼鐵俠。

本文來源:量子位

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 二維碼 回到頂部
    国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av