Suppr超能文献

MIT开源BoltzGen:AI设计蛋白质药物,向"不可成药"靶点宣战

学术资讯

MIT开源BoltzGen:AI设计蛋白质药物,向"不可成药"靶点宣战

制药行业有个公开的秘密:人体内约85%的疾病相关蛋白质被视为"不可成药"。这些靶点要么形状诡异得让小分子药物无从下手,要么缺乏明显的结合口袋,传统药物开发方法在它们面前几近失效。一个癌症患者可能因为肿瘤蛋白无法被药物"抓住"而错失治疗机会,一种罕见病可能因为致病蛋白"拒绝"所有已知药物而成为孤儿。

但在2025年10月26日,MIT的一个博士生或许改变了这场游戏。当天,Hannes Stärk和他的导师Regina Barzilay、Tommi Jaakkola发布了BoltzGen1——一个完全开源、可商用的AI蛋白质设计模型。几天后的10月30日,超过300名学术界和产业界人士挤满了MIT Jameel Clinic的报告厅,这个数字本身就是一个信号:某种期待已久的突破正在发生。

这篇发表于MIT官方预印本的研究,标题平淡无奇——《BoltzGen:走向通用结合物设计》。但它做到的事情并不平凡:在26个刻意挑选的"困难靶点"上,BoltzGen设计的蛋白质结合物中有67%达到了纳摩尔级的结合亲和力。更关键的是,这些靶点中许多在蛋白质数据库(PDB)里找不到任何相似的结合物——换句话说,AI在"从零开始"设计药物。

BoltzGen提供灵活的设计接口,让药物开发者对蛋白质结构拥有精确控制 图1:BoltzGen设计界面示意。来源:MIT Jameel Clinic


从AlphaFold的影子里走出来

如果说2024年的诺贝尔化学奖是AI蛋白质科学的加冕时刻,那么BoltzGen代表的是这个领域的下一个问题:预测蛋白质结构很酷,但能不能直接设计出能治病的蛋白质?

DeepMind的AlphaFold因为精准预测蛋白质的三维结构而获得诺奖,但它的创始人Demis Hassabis在2019年就说过:他的目标不是发论文,而是拿诺贝尔奖。五年后他做到了。然而,预测结构和设计功能之间,隔着一道巨大的鸿沟。知道一座桥的形状,不等于你能设计出一座新桥来跨越特定的河流。

MIT团队的野心恰恰在于此。BoltzGen的前身Boltz-1在2024年11月首次发布时,已经在结构预测上追平了AlphaFold 3的精度,但它做的还是"看图说话"。到了2025年夏天的Boltz-2,模型开始能够预测蛋白质之间的结合亲和力——这相当于从"看懂桥的形状"进化到"判断桥能承受多大重量"。

而BoltzGen走得更远:它直接生成蛋白质序列,让这些序列能够折叠成特定形状,并以纳摩尔级的亲和力结合到目标蛋白上。用Barzilay教授的话说:"除非我们能识别不可成药靶点并提出解决方案,否则我们不会改变游戏规则。"2

这里的"游戏规则",指的是制药行业10%的临床成功率,以及每开发一款新药平均26亿美元的天文数字成本。如果AI能让药物开发者直接跳过"大海捞针"的早期筛选阶段,从计算机里"打印"出高质量的候选药物,那么整个产业的效率曲线可能被重新绘制。


通用性的代价:不做"考试机器"

BoltzGen最特别的地方不是它的成功率,而是它的"不挑食"。

目前市面上的蛋白质设计工具大多是"专科医生"——BindCraft专注蛋白质结合物,Chai Discovery的Chai-2擅长抗体,Latent Labs的Latent-X主攻小型环肽。它们在各自领域表现出色,但一旦遇到训练数据里没见过的靶点,性能就会断崖式下跌。用Stärk的比喻,这就像学生在考试时遇到和作业题一模一样的问题——当然能答对,但换个问法就抓瞎。

BoltzGen的设计哲学是做一个"全科医生"。它能设计纳米抗体、微型结合蛋白、二硫键肽,甚至处理有序和无序蛋白、核酸和小分子——所有这些都用同一个模型完成。这种通用性来自一个简单但强大的想法:不要让模型记住特定类型分子的"套路",而是让它学会物理和化学的底层规律。

BoltzGen在8个湿实验室进行的验证结果,涵盖26个挑战性靶点 图2:BoltzGen湿实验验证概览,展示其跨多种分子类型的设计能力。来源:MIT Jameel Clinic

为了验证这一点,研究团队故意不给自己留后路。他们挑选的26个测试靶点中,许多与训练数据的序列相似度低于30%——这意味着PDB数据库里找不到任何"抄袭对象"。更狠的是,这些靶点大多是治疗相关的硬骨头:癌症靶点、抗菌肽设计、抗体工程。

结果呢?在9个最难的靶点上,BoltzGen设计的纳米抗体有6个达到了纳摩尔级结合——这已经是临床前候选药物的门槛。67%的成功率听起来不算惊艳,但考虑到这是在"从未见过"的靶点上"从零开始"设计,这个数字足够让产业界坐起来。

UCSF的蛋白质设计先驱William Degrado和哈佛癌症研究专家Matthew Meyerson都参与了湿实验验证,他们的加入本身就是对这项工作的背书。一个产业合作方Parabilis Medicines直言:"将BoltzGen整合进我们的计算平台,有望加速我们针对重大人类疾病交付变革性药物的进程。"3


开源的博弈:免费午餐还是特洛伊木马?

BoltzGen的MIT许可证允许任何人——包括制药巨头——免费使用模型,甚至用自己的专有数据训练它。这在AI制药领域几乎是一个异类。

当Stärk在社交平台X上宣布BoltzGen开源时,业内人士Justin Grace立刻抛出了一个尖锐的问题:"私有聊天AI模型和开源版本之间的性能差距,现在是7个月,而且还在缩短。在蛋白质领域,差距看起来更短。那些'结合物即服务'的公司还怎么收回投资,如果我们只需等几个月就能拿到免费版?"4

这个问题直击要害。过去两年,至少有十几家创业公司宣称能用AI设计蛋白质结合物,它们的商业模式就是向制药公司出售"定制设计服务"。如果MIT这样的顶级学术机构免费开源一个性能相当甚至更强的工具,这些公司的护城河还剩下什么?

基于结构的药物发现:蛋白质与小分子结合的示意图 图3:结构驱动的药物发现范式——蛋白质(蓝色)与配体分子(绿色)的精确结合是药效的关键。来源:Drug Discovery News

Barzilay的回答很学术但也很现实:"开源模型让更广泛的社区能够共同努力,加速药物设计能力的发展。"2 潜台词是:科学进步比商业利润更重要。但这种理想主义能否持续,还要看产业界的反应。

有意思的是,Hassabis在接受《自然》采访时也承认,DeepMind现在面临着比五年前更激烈的竞争5。ChatGPT的出现让整个AI行业进入"军备竞赛"模式,各家公司几乎每周都发布新产品。在这种环境下,开源可能是学术机构保持影响力的唯一方式——与其被商业公司甩在身后,不如用透明度和可复现性来定义游戏规则。

风险投资公司Zetta Venture Partners的Dylan Reid则看到了更长远的影响:"短期内,能从类似抗体的从头设计中受益的靶点和药物模式范围,将急剧增加。长期来看,我们理解和调控疾病生物学的方式,可能远超今天所谓的'可成药蛋白质组'。"3


AI的边界:当物理学成为瓶颈

不过,BoltzGen也没有解决所有问题。

模型的一个关键限制是:它依赖于湿实验室合作者给出的约束条件。研究团队在设计过程中会明确告诉模型——"不要生成违反物理或化学定律的蛋白质"。这些约束来自经验丰富的生物学家,而非模型自己学会的。换句话说,BoltzGen还不能完全"自主思考"。

另一个挑战是计算成本。虽然BoltzGen比传统实验快几个数量级,但设计一个复杂靶点的结合物仍然需要数小时到数天的GPU时间。对于学术实验室来说,这意味着每个项目都需要仔细权衡"计算预算"。

AI驱动的药物发现流程:从靶点识别到临床开发 图4:现代AI药物研发管线,整合了靶点发现、分子设计、前临床验证等多个环节。来源:NVIDIA Developer

更根本的问题是:26个靶点的成功,能否推广到成千上万个未知疾病靶点?67%的成功率在"不可成药"靶点上已经是突破,但这也意味着三分之一的尝试会失败。对于一个需要数年时间和数亿美元投入的药物开发项目来说,这个容错率可能还不够。

Jaakkola教授对此很清醒:"这些是现实世界中今天还没有已知结合物的靶点。因为它们更难,不是所有都会成功,但我们在推动这些模型应有的使用极限。"3

还有一个更微妙的问题:设计出来的蛋白质能否真正成药?纳摩尔级的体外结合亲和力是好的开始,但从"能结合"到"能治病",中间还隔着药代动力学、毒性、免疫原性、生产成本等一系列障碍。BoltzGen可以帮你跨过第一关,但后面的关卡仍然需要传统药物开发的艰苦工作。


钱和信心的双重赌注

BoltzGen发布的时机,恰好撞上了AI制药投资的分水岭。

根据GlobalData的报告,2025年第三季度生物技术领域的风险投资融资额同比增长了70.9%6。但这些钱的流向正在发生变化——投资者不再满足于"AI能预测蛋白质结构"这样的故事,他们要看到真正的临床候选物,甚至是上市药物。

AI蛋白质设计市场的估值在2025年达到15亿美元,预计到2033年将以22%的年复合增长率增长7。但与此同时,93%的制药高管计划在2025年增加AI投资8——这意味着赛道正在变得拥挤。

BoltzGen的开源策略,可能会加速这个行业的洗牌。那些单纯依靠"黑箱AI"吸引客户的公司,将面临来自免费、透明、社区驱动的工具的直接竞争。而那些能够将AI设计与湿实验验证、临床转化深度整合的公司,则可能借助BoltzGen这样的工具进一步拉开差距。

有个数据值得玩味:AI药物发现市场在2025年的规模是69.3亿美元,但整个制药行业的研发支出每年超过2000亿美元9。这意味着AI目前只占药物开发总成本的3%左右。如果BoltzGen证明自己能显著提高早期药物发现的成功率,这个比例会迅速上升——但前提是,它设计的分子真的能在临床试验中跑出来。


未来的故事,今天能讲多少?

Stärk在BoltzGen的发布会上说:"我想构建工具,帮助我们操纵生物学来解决疾病,或者用分子机器执行我们甚至还没想象过的任务。"2

这话听起来很科幻,但细想又不无道理。AlphaFold当年发布时,很多人也觉得它只是个"学术玩具"。三年后,它的预测被用于改善蜜蜂免疫、筛选抗寄生虫化合物、设计新型材料——应用范围远超最初的设想。

BoltzGen会不会复制这条路径?现在下结论还太早。但有几个信号值得关注:

第一,8个独立湿实验室的参与,说明学术界对这项工作的认可度。这不是一个团队关起门来自嗨的结果,而是经过了多重验证。

第二,产业界的快速响应。BoltzGen发布不到一周,多家生物技术公司就开始测试它的商业潜力。如果明年有哪家公司宣布基于BoltzGen设计的分子进入临床试验,这个故事就会变得更有说服力。

第三,开源社区的反应。目前BoltzGen的代码库已经被fork了数百次,研究者们正在尝试将它用于各种场景——从癌症靶点到农业蛋白,甚至是材料科学。开源的力量在于,一个工具的最佳用途,往往是创造者自己没想到的。

但也有人泼冷水。《自然》杂志的一篇分析文章指出,AlphaFold的成功并不意味着AI能解决所有蛋白质相关问题5。蛋白质与其他分子的相互作用、动态构象变化、细胞内的复杂环境——这些都是静态结构预测或从头设计难以捕捉的。

制药行业有句老话:"In mice, we cure cancer every day."(在小鼠身上,我们每天都能治愈癌症。)意思是,实验室的成功不等于临床的成功。BoltzGen现在的战绩,还停留在"体外结合"和"动物模型"阶段。要证明它真的改变了制药业,可能还需要五年甚至十年。

不过,这或许也是这项工作最迷人的地方:它不是终点,而是起点。Barzilay说:"我的学生经常问我,'AI在哪里能改变治疗的游戏规则?'除非我们识别不可成药靶点并提出解决方案,否则我们不会改变游戏规则。"2

那些曾经被判"死刑"的疾病靶点,现在有了重新被审视的机会。这或许就是BoltzGen最大的意义——不是它已经做到了什么,而是它让人们相信,某些曾经不可能的事情,现在值得再试一次。


参考文献


作者:超能文献团队 | 超能文献

Footnotes

  1. Stärk, H., et al. (2025). BoltzGen: Toward Universal Binder Design. MIT Preprint. https://hannes-stark.com/assets/boltzgen.pdf

  2. MIT News. (2025, November 25). MIT scientists debut a generative AI model that could create molecules addressing hard-to-treat diseases. https://news.mit.edu/2025/mit-scientists-debut-generative-ai-model-that-could-create-molecules-addressing-hard-to-treat-diseases-1125 2 3 4

  3. GEN News. (2025, October 27). BoltzGen Democratizes AI Therapeutic Design, Expands Druggable Universe. https://www.genengnews.com/topics/artificial-intelligence/boltzgen-democratizes-ai-therapeutic-design-expands-druggable-universe/ 2 3

  4. Grace, J. [@jusjosgra]. (2025, October 26). X post on BoltzGen release. https://x.com/jusjosgra/status/1982763802920927252

  5. Nature. (2025, November 18). Google DeepMind won a Nobel prize for AI: can it produce the next big breakthrough? Nature, d41586-025-03713-1. https://www.nature.com/articles/d41586-025-03713-1 2

  6. Pharmaceutical Technology. (2025, October 23). Biotech recovery in Q3 2025 as venture funding grows 70.9% from previous quarter. https://www.pharmaceutical-technology.com/analyst-comment/biotech-recovery-q3-2025-venture-funding/

  7. Data Insights Market. (2025, October 31). AI Protein Design Trends and Forecasts: Comprehensive Insights. https://www.datainsightsmarket.com/reports/ai-protein-design-498616

  8. Biotech Breakthrough Awards. (2025). How AI Will Impact the Biotech Industry In 2025. https://biotechbreakthroughawards.com/how-ai-will-impact-the-biotech-industry-in-2025/

  9. BioSpace. (2025, November 20). Artificial Intelligence (AI) in Drug Discovery Market Size Expected to Reach USD 16.52 Billion by 2034. https://www.biospace.com/press-releases/artificial-intelligence-ai-in-drug-discovery-market-size-expected-to-reach-usd-16-52-billion-by-2034

分享

推荐阅读

Article Cover

CAR-T 疗法治愈狼疮?癌症疗法转战自身免疫病的突破

学术资讯

2024年NEJM发表重磅研究:德国团队用CAR-T细胞疗法治疗15名重症自身免疫病患者,100%达到缓解。从癌症到狼疮,这场医学革命正在改写千万患者的命运。

Article Cover

超加工食品的全球警报:《柳叶刀》揭示人类健康的隐形杀手

学术资讯

覆盖104项研究的综合分析显示,92%的研究证实超加工食品与慢性病相关。这场由跨国食品公司主导的饮食革命,正在成为21世纪最严重的公共卫生威胁之一。

Article Cover

FDA批准阿尔茨海默血液检测:$500测试替代$6000 PET扫描

学术资讯

Article Cover

CRISPR"隐形"细胞:糖尿病患者6个月不打胰岛素

学术资讯

2024年12月,一名1型糖尿病患者接受了经过CRISPR编辑的供体胰岛细胞移植。六个月后,这些细胞依然在他手臂肌肉里稳定工作,无需任何免疫抑制药物。这是细胞治疗领域的分水岭时刻。

Article Cover

GLP-1s不止减重:从胰岛素到神经保护的“超级激素”

学术资讯

Article Cover

Nature专栏——当科研拨款成为政治筹码:特朗普2.0如何改写美国医学研究版图

学术资讯

025年以来,特朗普政府终止了超过3800项NIH和NSF科研拨款,涉及未支付资金约30亿美元。从哈佛大学22亿美元经费被冻结,到RFK Jr叫停5亿美元mRNA疫苗研究,这场史无前例的科研经费削减风暴正在重塑全球医学生物研究格局

Article Cover

Nature Medicine重磅:一次输注,长期治愈?中国血友病B基因疗法交出亮眼答卷

学术资讯

中国医学科学院血液病医院张磊教授团队与Belief Biomed合作,在《Nature Medicine》发表血友病B基因疗法BBM-H901的I/II及III期临床成果,显示一次输注显著降低出血率,提升凝血因子活性,有望实现长期治愈。