中美科研团队发布生物研究AI新模型,引领科技前沿

   发布时间:2025-02-21 12:05 作者:唐云泽

近日,中美两国在人工智能(AI)驱动的生物科学研究领域取得了重大突破,标志着AI在推动科学进步方面迈出了重要一步。

在美国,科技巨头NVIDIA携手Arc研究所、斯坦福大学、加州大学伯克利分校以及加州大学旧金山分校,共同推出了Evo2,这是一款开源的AI生物模型。该模型拥有惊人的400亿参数,涵盖了128,000个物种的93万亿核苷酸数据。Evo2在分子研究、精准医疗、药物开发以及合成生物学等领域有望发挥关键作用。全球的研究人员现在可以通过网络界面免费访问其源代码、训练数据和参数。

与此同时,在中国,清华大学人工智能产业研究院(AIR)与北京水木分子共同发布了BioMedGPT-R1的升级版,这是一款开源的多模态生物医学AI模型。新版本在原有BioMedGPT模型的基础上,融入了DeepSeek R1模型的精髓,拥有170亿参数。在美国医学执照考试(USMLE)中,BioMedGPT-R1取得了67.1%的准确率,接近人类专家的水平。

清华大学AIR由清华大学智能科学系教授、中国工程院外籍院士张亚勤创立。此次发布的两款模型,彰显了AI在科学(AI4S)研究领域日益增长的重要性,标志着AI在推动生物和医学研究方面取得了显著进展。

NVIDIA首席执行官黄仁勋在2024年GTC大会上强调了AI在生物科学研究中的重要性,认为这是AI发展的三大关键方向之一。他表示:“在人类历史上,生物学首次有机会成为工程学,而不仅仅是科学。”这一观点得到了中国院士王建的呼应,他强调尽管AI还远未解决所有科学问题,但它有潜力通过弥合学科间的鸿沟来彻底改变科学研究。“AI不仅是科学的工具,更是科学革命的工具。”他说。

AI在生物科学领域的影响力日益显著,它能够解决以往难以想象的复杂问题。例如,AlphaFold等预测蛋白质结构的模型已经展示了AI在生物学领域的潜力。如今,Evo2和BioMedGPT-R1等模型进一步推动了AI的作用,为探索基因序列、蛋白质甚至设计新型生物工具提供了新的途径。

Evo2由Arc研究所的生物工程师帕特里克·徐的团队开发,旨在处理编码和非编码DNA,其范围比早期的蛋白质预测模型如AlphaFold更为广泛。Evo2能够预测癌症相关基因(如BRCA1)中的基因突变如何影响人类健康,在区分良性突变与潜在有害突变方面实现了超过90%的准确率。这为实现更快、更准确的遗传分析,加速药物开发和疾病研究开辟了道路。

Evo2处理多基因结构和调控区域的能力进一步增强了其潜力。虽然AlphaFold专注于蛋白质结构,但Evo2将基因组数据与表观基因组学、蛋白质组学和结构预测工具相结合,使其成为遗传研究的更多功能资源。该模型从训练数据中排除了病原体,以解决安全和伦理问题。Evo2能够设计基因修饰、识别突变甚至创造全新的生物系统,预示着AI在生物技术创新中将发挥关键作用。

同一天,清华大学与水木分子推出了BioMedGPT-R1,这是他们开源生物医学AI模型的升级版。BioMedGPT-R1拥有170亿参数,为生物医学应用提供了改进的深度推理能力。该模型能够整合多模态数据(文本和生物数据),在药物发现和医学推理等任务中表现出色。在USMLE中取得的准确率使其跻身人类专家和商业模型之列。BioMedGPT-R1对药物分子进行深入分析并预测药物靶点的能力,使其成为药物研发中的宝贵工具。它在生物医学问答任务中的成功,凸显了其改变医学研究和诊断方法的潜力。

 
 
更多>同类内容
全站最新
热门内容
本栏最新