免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 机器学习推动蛋白质设计进展:新研究揭示采样与评分的挑战

机器学习推动蛋白质设计进展:新研究揭示采样与评分的挑战

时间:2025-03-15 22:40

小编:小世评选

随着技术的不断演进,机器学习(ML)正迅速成为蛋白质设计领域的颠覆性力量。数据驱动的方法不仅在实验成功率上超越了传统的生物物理学方法,还在许多情况下优化了设计效率。这些新兴方法大多是案例研究,缺乏系统的整合和标准化,导致在性能评估和比较时面临重重困难。

近日,德国莱比锡大学的研究小组发布了一项新研究,展示了他们如何在著名的Rosetta软件框架内构建一个精简而多样化的工具箱,旨在通过预测氨基酸概率的方法实现对不同模型的并排比较。这一创新方法不仅可以用于新型疗法的开发,如抗体和疫苗,还包括了应对未来大流行的关键治疗方案。正如该研究负责人之一Clara Schoeder教授所说:“我们迫切需要制定此类模型的描述和可用性标准,我们的研究为实现这一目标做出了重要贡献。”

该研究特别关注了蛋白质设计领域面临的两个传统挑战:采样和评分。研究发现,机器学习方法在排除采样空间内的有害突变方面表现出色,但在评分方面,与使用Rosetta的传统评分相比,并未显著改善。这一发现表明,机器学习技术现阶段仍然是对生物物理方法的有力补充,而并非其替代品。

本研究以“Self-supervised machine learning methods for protein design improve sampling but not the identification of high-fitness variants”为题,于2025年2月12日发表于《Science Advances》。蛋白质的计算设计与工程是科学界长期以来追求的目标,旨在加速新型蛋白质药物和材料的开发。传统方法凭借序列突变、结构预测和优化等手段成功设计了多种蛋白质。而Rosetta和PyRosetta框架的出现,更加简化了设计协议的开发。尽管已有的工具不断更新,蛋白质序列设计依然面临采样和评分两大核心问题。

近年来,许多机器学习方法在蛋白质结构预测和序列设计方面取得了突破,诸如ProteinMPNN和蛋白质语言模型(PLMs)在纳米材料设计和抗体优化中表现相当优秀。这些新兴模型是否优于经典的生物物理设计算法仍有待研究,复杂的多软件管道也可能引发技术积累债务和可重复性的问题。

鉴于此,研究团队决定将ESM PLM家族嵌入Rosetta,并利用C++的Tensorflow和LibTorch库来优化其接口,以此提升模型的可比性和可移植性。新研究中的实验设计围绕自监督机器学习方法展开,目的是评估其在采样和评分方面的表现。

研究人员通过利用现有的蛋白质适应度景观数据集,针对一些常见任务(例如提高蛋白质结合亲和力或酶活性)进行基因评测。基本过程是生成候选物(采样突变),然后对这些候选物进行排序(评分突变)。研究团队通过在大规模诱变数据集上训练预测模型(称为“预言机”),以分析16种不同方案在采样和评分行为上的差异。

实验表明,尽管机器学习方法在清除序列空间内的有害突变方面表现出色,但在对候选序列进行评分和排序时却遇到了挑战。这表明采样与评分之间存在紧密的相互关系,而评分指标的不完整性可能影响最终结果。尽管使用更精确的评分函数(例如基于AF2的指标)能够在一定程度上缓解这一问题,但在复杂案例(如emibetuzumab设计)中效果仍然有限。

研究团队最终提出了两种策略。第一种是通过低温迭代采样生成少量高适应度变体,适用于实验能力有限的情况;第二种则是提高采样温度生成大量候选序列,适合高通量实验。不同于事后用计算机评分筛选变体的策略,这两种方法展现出更良好的效果。通过微调预训练模型,一些复杂功能(如酶活性)的预测表现出明显优势,而在单点突变(如抗体设计)中,零样本方法依然很有效,例如ESM-2能够以49.6%的准确率预测种系突变。

不过,该研究的局限性在于过度依赖计算机验证,同时,所需的“预言机”模型较为简单,未必能涵盖复杂的突变关系。未来的研究方向可以结合传统方法(如酶工程或抗体设计)进行比较,同时探索监督式机器学习模型直接预测蛋白质适应度的潜力。

尽管机器学习在蛋白质序列采样方面显著提升了效率,但评分和排序仍然面临挑战。研究团队的发现让人充满期待,他们认为,将人工智能与生物物理方法结合,将极大地提高蛋白质设计的效率。这项研究不仅为蛋白质设计领域提供了宝贵的理论支持,也为临床应用奠定了基础。

研究链接:https://www.science.org/doi/10.1126/sciadv.adr7338

相关报道:https://phys.org/news/2025-02-ai-biophysical-protein.html

【免责声明】本稿转载出于非商业性教育与科研目的,版权归原作者所有,若有侵权请及时联系我们。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多