当字节跳动开卷AI制药

当字节跳动开卷AI制药

当擅长饱和攻坚的算法巨头闯入生物医药深水区,这套“矛盾”战略背后,藏着互联网跨界AI制药最真实的优势与隐忧。

文 | 氨基观察

字节跳动,高调杀入了AI制药赛道。

它并非国内首个跨界生命科学的互联网巨头,但可能是最“重”的一个。自2020年启动 AI4S 底层技术布局,经过内部多条业务线、多年的奔跑,完成底层平台的搭建,到现在喊出解锁“不可成药”靶点、重塑药物可能的口号,首个AI分子也走到临床前验证阶段。

近期,又传出字节跳动AI制药业务线启动拆分与独立融资的消息,拆分后字节跳动仍将控股新公司,核心团队、算法、技术平台和已有管线资产整体进入新主体。不同于腾讯等大厂赋能新药研发的战略,字节展现出一副亲自下场做药的姿态。

字节在这个时间点拆分独立,既是顺势而为,也是逆势押注。当擅长饱和攻坚的算法巨头闯入生物医药深水区,这套“矛盾”战略背后,藏着互联网跨界AI制药最真实的优势与隐忧。

AI制药的核心竞争力究竟在哪里?字节的短板在哪里,底气又是什么?这些问题,比字节拆分AI制药本身更值得追问。

 01 “原子”武器

3月份,字节跳动AI制药团队发布了两篇论文。

第一个是,其与清华大学合作发布了基于全原子层面的通用分子生成基础模型AnewOmni。号称全球首个跨小分子、多肽、抗体的全模态药物设计大模型。

以往AI药物设计的思路将不同分子类型视为不同的领域,并为每种类型使用专门的生成模型,每个任务的数据、表征、模型架构都不一样。但回到原子层面——碳、氮、氧、氢,在这一层面小分子和多肽没有本质区别。

这就是AnewOmni的出发点,既然底层物理是共通的,那就可以用一套模型统一学习,并且跨模态互相增益。

AnewOmni通过全原子层面的通用分子生成基础模型,在统一生成框架实现跨模态分子的从头设计,并且,已经在KRAS G12D、PCSK9这两大靶点中实现了湿实验验证,证明了跨模态知识迁移在实际任务中的可行性。

显然,这是一种颠覆性叙事。即未来的分子设计,有可能从孤立的单点技术,逐步走向通用的、可编程的、能够进行深度分子推理的整合平台,进一步拓展科学界探索分子空间的能力边界。

更具体而言,比如把抗体“转换”成多肽——保留结合模式,同时获得多肽的细胞穿透性。

第二个则是AnewSampling ,一个想要复现全原子分子动力学的框架。

过去几年,AI彻底改变了蛋白质结构预测的能力,从序列到结构的预测精度达到前所未有的高度。然而,在真实的药物研发中,单一的静态结构远远不够,真正决定药效的,是它如何“动”。

蛋白与配体的结合本质是一个动态过程:构象不断变化,能量状态持续交换,关键相互作用在不同时间尺度上形成与消失。理解动态热力学景观,一直是药物发现中的核心挑战。

而传统分子动力学(MD)模拟要靠飞秒级步长一点点推演,想看清毫秒级的构象变化,动辄需要超算跑上数周,成本高、效率低。

AnewSampling 试图解决这一难题,通过在全原子水平重建分子动力学平衡分布的生成模型,比传统MD快1000倍,能精准捕捉蛋白柔性及配体结合模式。

AI正在理解分子如何运动、如何演化,从静态结构预测到动态分布建模,这似乎也是一个颠覆性叙事。

而以上这两个平台,也意味着,字节的AI制药实现了从靶点机制解析、全新分子创造到成药性优化的全链条布局。

 02 管线迭代

底层平台的集中露出,只是“独立”的开端,真正引得制药行业广泛关注的,是首个AI分子的亮相。

4月25日,字节跳动旗下AI制药子公司Anew Labs在AAI 2026上进行了口头报告,首次公开处于临床前阶段的IL-17小分子抑制剂,利用AI驱动的虚拟筛选技术,结合分子生成算法成功识别而来,首次在小分子层面实现了对IL-17家族(AA/AF/FF)的泛抑制。

以往,由于传统结构设计的局限性,小分子药物只能靶向IL-17AA和AF,而字节实现了对IL-17AA、IL-17AF及极难成药的IL-17FF二聚体的抑制。目前实验室的数据显示了它的高活性表现,成药性验证上在多个物种中也展现出良好的口服暴露特征。

IL-17靶点的自免商业潜力无需多言。2025年,诺华的司库奇尤单抗全球销售额超66亿美元。鉴于自免口服药广阔的市场前景,小分子IL-17抑制剂一直是自免研发领域的热点,礼来、赛诺菲、诺华、艾伯维等头部MNC均有布局。

由此,其背后的主体——Anew Labs也彻底浮出水面,并将自身定位为“AI matters most where conventional drug discovery falls short”。

除了IL-17小分子抑制剂,Anew Labs官网显示,还有一款靶向IL-4R的管线,已完成了靶点的命中识别;还有两个未披露靶点的管线处于苗头化合物发现阶段。

相比底层平台的“原子”颠覆叙事,目前披露的管线则更多是迭代式创新叙事。并非全新靶点的从头开始,而是基于成熟靶点的进一步探索。

当然,这也是极大的突破,且契合当前市场对于AI制药的期待——从早期的效率提升,到临床成功率提升。

AI制药领域有一个常见的叙事:传统方法需要18个月,用AI三个月就完成了。但经历前期种种颠覆性叙事之后,行业正在对AI祛魅,即在药物开发这样一个高风险、高失败率的行业里,药企真正想需要的不只是“快”,而是如何“提高成功率”,在后续的临床开发中更有胜算。这才能构成完整的创新药研发底层范式革命叙事。

Anew Labs这样的管线布局思路,或许也与以刘勇军为首的科学顾问委员会,有着直接关系。

刘勇军曾公开表示过对“追新”持谨慎态度,面对下一代的自免药物开发,他的建议是聚焦成熟靶点的迭代创新,新机制的靶点仍然存在不确定性。

03 大力出奇迹?

目前看,相比腾讯在AI制药领域所强调的“连接”,字节的选择更重,正朝着亲自下场做药、推临床的方向演进。

腾讯健康总裁吴文达说过,腾讯最大的优势是“连接”。腾讯不想做新药,想做的是“赋能者”——为药企提供底层的AI工具和云服务,让专业的人做专业的事。这很符合腾讯一贯的定位:做连接器而不是颠覆者。

字节跳动则向来信奉“大力出奇迹”。

这套方法论在过去十年被反复验证:今日头条、抖音、TikTok,都是以大量资源投入、快速迭代、饱和攻击的策略攻城略地。当这种思维遇上AI制药,字节的选择并不令人意外——要么不做,要么全力做。

从组织动作上可以看得很清楚。字节将原本分散在各处的AI4S团队全部并入刘凯负责的AI制药团队,完成算法模型团队的整合。最新的拆分传闻更是让AI制药业务独立运营,拥有独立决策权。

有意思的是,除了Anew Labs,字节内部还有两条AI制药线,此前顾全全牵头的SeedFold、肖文之的Protenix,且各自训练模型。目前看,被推向前台的是Anew Labs。这或许是近期传出,字节AI大牛集体出走、筹备AI制药创业的原因。

而在海外科技媒体TNW看来,字节的入局具备独特优势:

其AI底层能力源自TikTok推荐系统。推荐算法的核心逻辑,是处理海量用户行为数据、预测内容组合带来的反馈;Anew Labs生成模型逻辑与之同源——处理海量分子数据、预测原子组合对应的生物活性。两者架构虽不完全相同,但底层工程能力高度互通:训练超大模型、海量数据快速迭代、大规模算力部署。支撑15亿TikTok用户的算力集群,如今被用来模拟分子行为,分子结合亲和力成为这套系统的“用户互动指标”。

这话乍一听没错,但关于大语言模型数据管理的经验是否可以转移至生物科技领域,还有不少质疑。

比如上下文先天稀缺。文本数据里,语义上下文天然嵌在句子结构里,而蛋白结合亲和力、后翻译修饰、可成药性这些AI真正需要的标签,只能靠湿实验一个个测出来贴上去;再比如多样性的假象问题,蛋白质数据银行(PDB)等公开数据库看起来数据量很大,但它们提供的是药物研发过程中经过高度筛选和编辑后的结果性数据。

换言之,大语言模型的“大力出奇迹”,并不适用AI制药。

04 数据与闭环之争

业内有一个日渐清晰的共识:在公域数据对所有参与者均等可及、主流算法架构通过论文和开源代码快速扩散的情况下,真正决定AI平台性能上限的,是高质量、标准化且可持续迭代的私域数据。

公开数据虽构成行业共同起点,但其噪声、偏倚和阴性数据缺失等问题,制约了模型的泛化能力。相比之下,药企与CXO积累的SAR过程数据、ADMET实验数据、临床数据,以及AI原生公司通过自动化实验室产出的高通量标准化数据,对模型训练的价值高得多。AI制药的核心竞争,正在从“算法能力”转向“数据资产与闭环能力”。

这也是为什么AI制药企业,都在强调建设自动化湿实验室,将干实验与湿实验相结合。因为,持续运行的湿实验,能够产生大量高质量且标准的专有数据集,用于训练Al模型,而Al模型则能够指导高通量湿实验,再产生新数据用于模型选代,干湿闭环可形成自我强化的数据飞轮。

在这方面,字节的优势与劣势同样一致突出。大模型训练是吞噬算力的怪兽,一般玩家连入场券都拿不到,而字节拥有火山引擎提供的底座支持。这是Anew Labs的绝对长板。

但是,靠无限堆算力并不能解决生物底层规律学习问题。高价值的数据资产,以及现分子生成-测试-实验数据反哺模型的闭环,是Anew Labs的短板所在。

比如,AnewSampling也承认当前框架的局限性。其中,高质量动态训练数据的稀缺仍是制约模型扩展的主要瓶颈。同时,模型在处理复杂复合物时仍较依赖初始模板,仅依赖一级序列的高精度分布预测仍有提升空间。此外,由于当前框架主要在单一固定的热力学环境下学习分布,尚不能完全替代传统分子动力学在不同宏观条件下的灵活模拟。

从分拆动作来看,字节将Anew Labs推出去独立融资,无疑是希望Anew Labs能够完成闭环的,甚至日后有可能与百图生科类似,与创新药企结盟,加速产业化。只不过,庞大的标准化实验数据需要大量时间投入和资本支出,且难以通过捷径复制。

难,才有做的必要与价值。因为这场AI制药的全球竞赛,已经不只是商业层面的竞争,更是一场关于未来十年生命科学战略高地的博弈。

放眼整个赛道,国内有头有脸的互联网大厂都已下场,甚至中国电信也有布局。海外,OpenAI在2026年4月发布了专为生命科学打造的GPT-Rosalind,Anthropic收购了前基因泰克的AI团队Coefficient Bio,谷歌旗下的Isomorphic Labs带着AlphaFold直接做新药管线。

这意味着,AI制药赛道的竞争将愈发激烈,技术迭代速度将持续加快,产业整合将不可避免。

在这场竞争中,字节已经交出了算法的第一张成绩单,但真正的战役,在它离开大厂温室、直面数据壁垒的这一刻,才刚刚开始。

广告等商务合作,请点击这里

本文为转载内容,授权事宜请联系原著作权人。

打开界面新闻APP,查看原文
界面新闻
打开界面新闻,查看更多专业报道

热门评论

打开APP,查看全部评论,抢神评席位

热门推荐

    下载界面APP 订阅更多品牌栏目
      界面新闻
      界面新闻
      只服务于独立思考的人群
      打开