一、技术原理

定义与核心机制:
Profluent 的核心技术逻辑是:用生成式大模型重新设计蛋白质与基因编辑系统。
他们训练了一个名为 ProGen3 的生物语言模型,可以像 GPT 写文章那样,生成具有特定结构和功能的新蛋白质;
并在此基础上,推出了 OpenCRISPR-1 —— 世界上第一个由 AI 生成的、开源的基因编辑酶。

换句话说,Profluent 不仅让 AI “读懂生命”,而是让 AI 参与进化过程本身。

形象化比喻:
如果人类的生物技术是“雕刻基因”,Profluent 就是让 AI 学会“创作生命”。
它不是修补自然,而是在写出“自然的续集”。

一句话本质:
从“理解生命”到“共创生命”。


二、美国谁在做

代表企业:Profluent Bio

成立时间: 2022 年,总部:加州伯克利

创始人: Ali Madani(原 Salesforce AI Research 科学家)

核心产品:

ProGen3: 生物大语言模型,能生成新型蛋白质序列与结构。

OpenCRISPR-1: 世界首个由 AI 生成的 CRISPR 酶,性能优于部分自然变体。

BioForge 平台: 面向外部科学家的蛋白生成 API。

融资情况:

2023 年获 Lux Capital、Insight Partners、NVIDIA Ventures 投资,累计融资超 6000 万美元。

合作方: Berkeley Lab、NVIDIA BioNeMo、AWS GenAI。

象征意义:
Profluent 是“AI×生物学”的真正分水岭公司——它让“生命模型”像开源软件一样被复制、共享、改进。


三、做到哪期

阶段: 已在实验室验证 OpenCRISPR-1 的基因编辑活性;处于临床前阶段。

关键节点:

2024 年 4 月发布 OpenCRISPR-1,并将全部模型权重与序列开源;

与多家科研机构联合验证其编辑效率与脱靶率;

预计 2025 年底将推进首个 AI 生成酶的商业化合作项目。

阶段意义:
从“AI辅助科研”到“AI生成科研成果”的第一次范式跨越。


四、为什么中国这里没做到

技术差距: 国内蛋白生成模型多停留在 AlphaFold 模仿阶段,缺乏真实生成能力。

开源文化: 中国科研体系重成果报批、轻开放共享,难以形成开源协作生态。

伦理监管: AI 生成基因编辑酶涉及生物安全审批,尚无明确政策路径。

算力成本: 训练生物大模型需百亿参数级算力和分子模拟GPU集群,门槛极高。

跨界壁垒: 生物学家与AI工程师尚未形成高效共创团队,缺乏复合型领军人才。


五、中国可以怎么补位 / 投资 / 合作

技术补位: 支持国内研究机构建立“ChinaBioLM”项目,用中文生物序列语料训练本地模型。

临床补位: 与海外开源项目(如OpenCRISPR)联合,在安全监管范围内验证中国特有基因型。

合作方向: 通过与 Profluent/NVIDIA 合作,使用 BioNeMo 框架在国内搭建生物大模型算力节点。

政策建议: 设立“AI生物安全标准体系”,允许AI生成序列在监管沙箱内进行低风险验证。

资本策略: 组建“生物开源创新基金”,投资开源工具、开放数据库与模型共研项目。

长线价值:
AI生成生物体系将成为全球科研的“第二操作系统”——谁掌握了它的生态主权,谁就能定义生命的未来。