上海高校建立全球最大蛋白質(zhì)序列數(shù)據(jù)集

上海高校建立全球最大蛋白質(zhì)序列數(shù)據(jù)集

  中新社上海3月22日電 (記者 許婧 鄭瑩瑩)上海交通大學(xué)洪亮教授團(tuán)隊(duì)22日發(fā)布其最新成果:建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,并利用其訓(xùn)練了Venus(啟明星)系列模型。

  肉、蛋、奶,這些食物中含有豐富的蛋白質(zhì),可以提供人類身體所需營(yíng)養(yǎng)。但天然的蛋白質(zhì)難以發(fā)揮這些功能,科研人員需要對(duì)天然蛋白質(zhì)的功能進(jìn)行設(shè)計(jì)和改造,才能使它成為滿足應(yīng)用需求的產(chǎn)品。長(zhǎng)期以來(lái),蛋白質(zhì)設(shè)計(jì)改造一直面臨時(shí)間長(zhǎng)、成本高等難題。

  據(jù)介紹,洪亮團(tuán)隊(duì)建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,包含36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列,以及0.6億條病毒蛋白質(zhì)序列。

  研究團(tuán)隊(duì)表示,基于該數(shù)據(jù)集訓(xùn)練的模型,可以把蛋白質(zhì)生產(chǎn)從“緩慢的試錯(cuò)”變?yōu)椤案咝实木珳?zhǔn)設(shè)計(jì)”。

  研究團(tuán)隊(duì)基于該數(shù)據(jù)集訓(xùn)練了Venus系列模型,該系列模型有“AI定向進(jìn)化”與“AI挖酶”兩大核心功能。

  “AI定向進(jìn)化”指 Venus系列模型可以對(duì)一個(gè)不盡如人意的蛋白質(zhì)產(chǎn)品的多種性能進(jìn)行優(yōu)化。

  “AI挖酶”則指 Venus系列模型基于該數(shù)據(jù)集可精準(zhǔn)找到具備超常規(guī)功能的蛋白質(zhì),比如極度耐熱、耐酸、耐堿、耐胃腸消化的蛋白質(zhì)等。而這些超常規(guī)功能的蛋白質(zhì)在生物技術(shù)、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中具有可觀的應(yīng)用潛力。(完)

【編輯:胡寒笑】
發(fā)表評(píng)論 文明上網(wǎng)理性發(fā)言,請(qǐng)遵守新聞評(píng)論服務(wù)協(xié)議
收藏文章
表情删除后不可恢复,是否删除
取消
确定
图片正在上传,请稍后...
评论内容为空!
还没有评论,快来抢沙发吧!
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書(shū)面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
Copyright ©1999-2025 chinanews.com. All Rights Reserved

評(píng)論

頂部