中國教育報-中國教育新聞網訊(記者 任朝霞 通訊員 符云霞 江倩倩)3月22日,上海交通大學洪亮教授團隊發布最新研究成果,建立了全球最大的蛋白質序列數據集,并將AI與蛋白質設計改造相結合,基于該數據集訓練了Venus(啟明星)系列模型,可以精準高效地預測、設計蛋白質的功能。配合Venus系列模型,團隊還研制了全球首款低通量大體積蛋白質表達、純化與功能檢測自動化一體機,把蛋白質設計從“復雜科學”變為“簡單工程”。目前,已有多款產品進入規模化生產,能夠助力阿爾茲海默癥等疾病的診斷。
蛋白質是由氨基酸序列構成的,氨基酸序列的長度從數百個到上千個不等。據介紹,團隊建立的蛋白質序列數據集包含36.2億條陸地微生物蛋白質序列、26.4億條海洋微生物蛋白質序列、24.3億條抗體蛋白質序列、0.6億條病毒蛋白質序列,覆蓋從常規地表生物到極端環境微生物的蛋白質序列信息,配備了數億功能標簽,是全球數據規模最大、功能批注標簽最多的數據集。
“我們訓練了Venus(啟明星)系列模型,這個模型學習自然界蛋白質序列的組織規則以及它與功能之間的關系,其預測蛋白質突變功能的精度位居行業榜單之首。”洪亮表示,Venus系列模型具備兩大核心功能:“AI定向進化”與“AI挖酶”。“AI定向進化”是指Venus系列模型可以對一個不盡如人意的蛋白質產品的多種性能進行優化。“AI挖酶”則是指Venus系列模型基于其海量的未知功能蛋白質數據集“海選”超能力戰士,去精準發掘滿足苛刻應用需求的具備超常規功能的蛋白質。這些超常規功能的蛋白質在生物技術、醫藥研發和工業生產中具有巨大的應用潛力。
配合Venus系列模型,團隊研發了自動化一體機,可在24小時內不間斷地完成100余個蛋白質的表達、純化與檢測任務,較人力效率提高近10倍。目前,Venus系列模型設計的多款蛋白質已經實現了產業化落地。在金賽藥業單域抗體耐堿性改造項目中,借助模型,不到1年就讓普通單域抗體耐堿性提升4倍,每年節約上千萬元成本。在某體外診斷公司堿性磷酸酶(ALP)改造項目中,模型使ALP分子活性超國際頭部公司產品3倍,為心梗、阿爾茲海默癥等超敏檢測診斷帶來新突破。
工信部備案號:京ICP備05071141號
互聯網新聞信息服務許可證 10120170024
中國教育報刊社主辦 中國教育新聞網版權所有,未經書面授權禁止下載使用
Copyright@2000-2022 m.junhanjc.com All Rights Reserved.