- 上云资讯 -
2025-06-20 16:33:40 4人关注
阿里云生物基础大模型登上Nature子刊!
阿里云AI for Science团队研发的生物大模型LucaOne登上《Nature Machine Intelligence》期刊,这是业界首个基于DNA、RNA和蛋白质混合训练的基础模型。该模型整合了16万个物种的12亿条核酸序列和6亿条蛋白序列,并引入生物标签信息,能有效挖掘核酸与蛋白质的内在关联。研究采用Transformer-Encoder架构,通过8个半监督学习任务增强模型性能,在中心法则验证等8项任务中表现优于现有模型。目前模型已全面开源,全球已有10余个团队应用。该成果被期刊评价为"对分子生物学中心法则的全新理解",此前阿里云已发表LucaProt、LucaPCycle等多项生命科学领域突破性研究。作为Nature旗下顶级期刊,《Nature Machine Intelligence》在人工智能领域具有重要影响力。
阿里云AI for Science LucaOne生物大模型 DNA RNA蛋白质混合训练模型 Transformer-Encoder架构 半监督学习任务 分子生物学中心法则