过去的一周,是人工智能最为火热的一周。
继 GPT4.0 发布后,百度发布了文心一言,微软发布了 Copilot,同一天 Google 发布了对标 ChatGPT 的 Bard,而英伟达则发布了新的 GPU H100,相对上一代产品,训练性能和预测性能都有数倍到数十倍提高。
人工智能领域风起云涌,而创新药研发领域也迎来了改变。
(资料图片)
2023 年 3 月 24 日,新药研发领域的人工智能基础设施和服务提供商碳硅智慧宣布,公司自主研发的 AI 驱动的新药研发平台—— DrugFlow1.0 正式发布。
据悉,DrugFlow 努力打造覆盖药物研发完整流程的软件平台,基于自动化硬件产生的数据迭代模型,并将专家融合到流程中,最终形成数据驱动人机协同的统一设计平台,显著提高药物研发的确定性。
来自浙江大学、北京大学、华东理工大学、四川大学、中南大学、中科院上海药物所、医科院药物所、广州国家实验室、罗氏中国研发中心、石药集团、和誉生物、华深智药等相关领域的知名学者和企业界专家出席了会议。会议采用了新颖的虚拟直播形式,会议期间浏览人次近万。
AI 驱动的新药研发 SaaS 平台 --DrugFlow1.0 正式发布
杨波发布会开场,由浙江大学科学技术研究院院长、浙江大学智能创新药物研究院常务副院长杨波教授做开场致词。
她谈到,浙江大学智能创新药物研究院正是希望培养一批智能新药创制领域的优秀人才,助推我国原创药物的研发。侯廷军教授本身是研究院的教授,也是计算化学领域的专家,而碳硅智慧 CEO 邓亚峰是 AI 领域的专家,二位都深耕行业多年。本次发布的 DrugFlow1.0,一方面是两位专家及碳硅智慧团队的智慧结晶,另一方面也正是响应了国家开发自主知识产权基础软件的号召,希望未来 DrugFlow 能真正助力我国的新药研发工作。
邓亚峰接着,碳硅智慧 CEO 邓亚峰进行了《突破 AIDD 核心技术,做创新药领域的赋能者》的主题演讲。
他的演讲内容分为五块:新药研发领域面临的挑战和痛点、中国新药研发的巨大市场、AI 的蓬勃发展以及与物理驱动方法的异同、碳硅智慧成立的初衷和愿景,以及 DrugFlow 产品的功能和特色。
邓亚峰详细介绍了 DrugFlow 背后的核心技术,并就关键技术指标与领域已有产品进行了详细比较。
据悉,DrugFlow 涵盖靶标发现,苗头化合物发现和先导化合物优化等环节,集成了世界领先的靶标发现、活性预测、成药性预测、分子生成优化、虚拟筛选、AI 建模等模块,帮助药化专家更高效便捷地找到潜在成药分子。
DrugFlow 努力打造覆盖药物研发完整流程的软件平台,具有 " 准确性高、原创可靠、易用性好、安全灵活 " 四大优势。其基于自动化硬件产生的数据迭代模型,并将专家融合到流程中,最终形成数据驱动人机协同的统一设计平台,必将显著提高药物研发的确定性。
此次发布的 DrugFlow1.0 版本,主要发布了活性预测、成药性预测、分子生成、AI 建模四大功能。
在活性预测上,DrugFlow1.0 包含重打分和对接两个主要功能。一方面,DrugFlow 基于物理对接构象,提供了当前领域最优的重打分函数 RTMScore,能显著提高虚拟筛选能力,帮助用户更好地选择分子。
另一方面,Inno-Docking 模块在集成物理对接模块 AutoDock Vina 的基础上,又集成了自研的 AI 对接程序 CarsiDock。CarsiDock 完全基于 AI 建模,并且考虑了构象合理性,是一种全新方法。在公开的主流评测上,CarsiDock 在预测误差 RMSD 小于等于 2 的条件下,第一次将准确率提高到 90% 以上,达到了 91.2%。在 RMSD 小于等于 1 条件下,CarsiDock 比物理方法和其他 AI 方法成功率高出 26%。此外,DrugFlow1.0 还提供了完整的蛋白预处理、配体预处理、自动智能化设置对接参数能力。
在成药性预测上,DrugFlow1.0 提供了 Inno-ADMET 模块。
该模块支持 17 种物化性质、5 种药化性质、21 种成药性参数、27 种毒性性质的系统性评价。目前该模块提供两种自主知识产权算法,一种是基于多图神经网络的 MGA 方法,不仅可以输出 ADMET 预测性质,还提供了性质与子结构关系的可解释性,另外一种是基于预训练 Transformer 的 MERT 方法,具有更高的预测准确率。总的来说,Inno-ADMET 模块具有 " 预测终点多且准确率高 "、" 速度快 "、" 可解释性 " 的优点。
在分子生成上,DrugFlow1.0 既支持基于活性配体的分子生成方式 ( Ligand-based ) ,也支持基于蛋白口袋结构的分子生成方式 ( Pocket-based ) 。
一方面,Ligand-Based 的分子生成方法是基于活性配体进行分子生成的全新药物设计方法,提供了 MCMG 和 RELATION 两种算法。其中 MCMG 是一种基于配体的多约束分子生成方法,通过知识蒸馏结合条件变换器和基于 QSAR 的强化学习算法来满足多约束条件,可生成具有所需理化和药理学特性的新分子。而 RELATION 则是基于蛋白口袋 - 配体复合物 3D 生成和双向迁移学习结合的分子生成方法,能够生成大量结构有效并且对蛋白具有一定亲和力的化合物。
另一方面,Pocket-based 的分子生成方法只需要提供蛋白蛋白口袋结构,比如这次发布的 ResGen 算法。它是一种基于蛋白口袋的 3D 分子生成算法,通过自回归模型和多尺度建模技术,在保证生成分子多样性的同时,生成具有较好结合亲和力、且具有合理蛋白 - 配体结合姿势的分子。该方法不仅适用于药物从头设计,还支持基于片段的分子生成。
在 AI 建模上,DrugFlow1.0 针对用户希望基于自有数据进行 AI 建模的需求,提供了 AI Modelling 模块。
该模块提供数据预处理、数据批分、计算描述符定义、机器学习算法建模等功能,用户只需在网页输入数据、做好参数设置,就可以建立自有的 AI 模型。为了提高建模效果,系统还采用了 AutoML 做参数和模型选择,并支持 Transformer 和 GNN 预训练技术,相比传统机器学习算法,可显著提高模型精度。此外,在结果页面,AI Modelling 还提供了完整的模型评估指标,并对模型表现作出相应解释。
除了以上模块外,DrugFlow1.0 还提供了一些易用小工具,比如 AI 解核磁谱工具—— NMR Parsing。
它为药化专家合成工作中最常见的解谱场景量身打造,基于 CReSS 和 CMGNet 两种 AI 检索和生成算法来解析未知化合物的结构,用户只需要输入碳谱的化学位移值,就可以快速解析分子结构,大大提高解谱效率。
邓亚峰表示,DrugFlow1.0 产品不仅在分子生成、AI 自动化建模等功能上独具一格,而且在对接和重打分以及成药性预测等传统功能上,具有世界领先的技术能力。成立仅半年多,团队就在 Nature Communication、核酸研究以及药物化学期刊等领域顶级刊物上发表了十多篇文章,证明了团队的技术实力。
随后,邓亚峰就 AIDD 的技术发展和公司规划作出展望。
他表示,目前在新药研发领域踏踏实实做自主知识产权国产化软件的团队并不多,碳硅智慧团队既具有这样的实力,也具有强烈的使命感。
" 碳硅智慧愿做创新药研发领域的赋能者,在推出药物发现 SaaS 平台 DrugFlow 的同时,基于最先进的 AIDD 技术和自动化解决方案,愿与战略合作伙伴一起携手针对重点管线进行合作研发。" 据悉,目前碳硅智慧已在小分子、AAV 设计等领域达成重要战略合作。
最后,邓亚峰表示,我们已经看到了 AI 在分子生成、对接、重打分等方面的突破,随着预训练模型、AIGC、强化学习等新 AI 技术在领域的落地,未来 AIDD 技术的演进会更快。今天 DrugFlow 的发布,仅仅是一个开始,我们未来一定会迎来一个 AI 驱动的生命科学时代。
何浩在产品发布之后,碳硅智慧商务拓展副总裁何浩介绍了 " 星火行动。
DrugFlow 高校支持计划 ",该计划针对现有软件使用成本高、不易用、不适合教学等问题,旨在为高校老师同学提供技术先进、易用且优惠的国产 AIDD 软件,且贴心地支持教学场景,希望以此推动 AIDD 软件在高校的普及,为中国培养更多 AIDD 人才。
目前,已有北京大学、浙江大学、四川大学、中山大学、吉林大学、南开大学、暨南大学、中国药科大学、澳门科技大学、中科院深圳先进技术研究院、广州国家实验室等十余所知名院校加入了星火行动,并给予了积极评价。
在发布会的最后,进行了战略合作伙伴签约仪式。由碳硅智慧 CEO 邓亚峰和石药集团上海翊石医药科技有限公司总经理宋云龙进行了战略合作签约。
在签约仪式上,宋云龙总经理表示:上海翊石作为石药集团全资子公司,一直致力于小分子创新药的研发,碳硅智慧团队在 AIDD 领域具有深厚积累,DrugFlow 产品技术领先,此次和碳硅智慧合作,希望能充分发挥双方优势,尤其是 DrugFlow1.0 在早期分子设计上的优势,期待合作成果早日落地。
AI 如何驱动药物研发?
发布会后,AI 驱动新药研发进展与挑战研讨会正式举行。
侯廷军浙江大学药学院教授,碳硅智慧首席科学家侯廷军,以《基于 Al 的药物发现:机遇与挑战》为题做了分享。
侯廷军认为,当下创新药物发现亟待变革性新模式,创新药物研发周期长、投入高、风险大且源头创新不足,缺乏先导结构发现的关键技术等问题。
而 AI 技术已经应用于药物研发的多个环节,人工智能技术推动了 CADD 方法的发展。深度学习模型的出现,加之硬件和数据的进步,使得训练能建模复杂非线性问题的模型成为可能。
此外,侯廷军还认为 AI 制药面临三大挑战,
挑战一 : 新一代 AI 技术对性质预测并未表现压倒性的优势,要如何有效提升基于 AI 的性质预测方法的预测能力 ?
挑战二 : 基于 AI 的打分函数在虚拟筛选中表现不佳 ,如何有效提升基于 AI 的打分函数在虚拟筛选中的预测能力 ?
挑战三 : 关键成药性参数和毒性终点预测精度较低,如何有效提升关键成药性参数和毒性终点的预测精度 ?
唐赟随后,华东理工大学药学院唐赟教授,以《基于网络的虚拟筛选方法》为题做了分享。
唐教授认为,传统的基于结构虚拟筛选和基于配体虚拟筛选方法,过去 20 多年来在先导化合物发现方面已有许多成功的应用。但是这些方法也有一些局限性,而目前大概只有八分之一的靶标具有已知的三维结构,使得基于结构的虚拟筛选方法对大部分靶标还无法应用;为了对那些没有三维结构的靶标也能使用虚拟筛选方法进行药物发现,必须发展新的方法。
发展基于网络的虚拟筛选方法,不需要已知靶标的三维结构和负样本,从而大大扩展了可进行虚拟筛选的靶标数量。
刘振明北京大学药学院刘振明教授,关于《创新药的新机 - 新技术驱动的候选药物研发》,分享了他的看法。
刘教授看来,AIDD/CADD 是生物医药研究的世界潮流和发展趋势,如何应对和破解创新药研发的困境,在我们的对外合作过程中,已经很高兴的看到中国的一些创新药企业开始关注前端研发,愿意和中国的高等院校一起去做这些之前认为价值低的事情。
AIDD 的最终目标是品种交付,刘振明教授认为,更为明智的选择是遵循和赋能候选药物的发现流程,在某几个环节去提升新药研发的效率。
研讨会进入尾声,一场主题为《AIDD 的未来和挑战》的圆桌论坛顺利进行。圆桌论坛由碳硅智慧首席运营官施慧主持,浙江大学药学院教授,碳硅智慧合伙人谢昌谕、广州国家实验室研究员陈红明、四川大学杨胜勇教授、中科学院上海药物研究所郑明月教授、中南大学药学院教授,碳硅智慧首席算法科学家曹东升、中国医学科学院药物研究所汪小涧教授、上海和誉生物医药科技有限公司联合创始人,生物学 SVP 陈椎、罗氏中国创新中心 AIDD 负责人林翼共同参与讨论。后续,雷峰网 &《医健 AI 掘金志》将推出详细报道。
雷峰网
标签: