上海高校建立全球最大蛋白質(zhì)序列數(shù)據(jù)集
中新社上海3月22日電 (記者 許婧 鄭瑩瑩)上海交通大學(xué)洪亮教授團(tuán)隊(duì)22日發(fā)布其最新成果:建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,并利用其訓(xùn)練了Venus(啟明星)系列模型。
肉、蛋、奶,這些食物中含有豐富的蛋白質(zhì),可以提供人類身體所需營(yíng)養(yǎng)。但天然的蛋白質(zhì)難以發(fā)揮這些功能,科研人員需要對(duì)天然蛋白質(zhì)的功能進(jìn)行設(shè)計(jì)和改造,才能使它成為滿足應(yīng)用需求的產(chǎn)品。長(zhǎng)期以來(lái),蛋白質(zhì)設(shè)計(jì)改造一直面臨時(shí)間長(zhǎng)、成本高等難題。
據(jù)介紹,洪亮團(tuán)隊(duì)建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,包含36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列,以及0.6億條病毒蛋白質(zhì)序列。
研究團(tuán)隊(duì)表示,基于該數(shù)據(jù)集訓(xùn)練的模型,可以把蛋白質(zhì)生產(chǎn)從“緩慢的試錯(cuò)”變?yōu)椤案咝实木珳?zhǔn)設(shè)計(jì)”。
研究團(tuán)隊(duì)基于該數(shù)據(jù)集訓(xùn)練了Venus系列模型,該系列模型有“AI定向進(jìn)化”與“AI挖酶”兩大核心功能。
“AI定向進(jìn)化”指 Venus系列模型可以對(duì)一個(gè)不盡如人意的蛋白質(zhì)產(chǎn)品的多種性能進(jìn)行優(yōu)化。
“AI挖酶”則指 Venus系列模型基于該數(shù)據(jù)集可精準(zhǔn)找到具備超常規(guī)功能的蛋白質(zhì),比如極度耐熱、耐酸、耐堿、耐胃腸消化的蛋白質(zhì)等。而這些超常規(guī)功能的蛋白質(zhì)在生物技術(shù)、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中具有可觀的應(yīng)用潛力。(完)


社會(huì)新聞精選:
- 2025年03月25日 17:41:23
- 2025年03月25日 16:58:50
- 2025年03月25日 14:45:22
- 2025年03月25日 14:09:34
- 2025年03月25日 13:23:07