复杂化合物的合成一直以来是有机化学、合成化学、药物化学等领域中的重大挑战和难题。近年来,人工智能的引入为逆向合成方法设计化合物的合成路线带来了巨大进步。目前逆向合成方法可分为基于规则的专家系统、基于模板的人工智能方法和无模板人工智能方法三大类。基于规则的专家系统需要大量的人力和经验丰富的专家来总结编写反应规则。基于模板和无模板的人工智能方法均需要对大量反应实例数据进行训练来获得人工智能预测模型,在训练模型时训练集中的稀有反应(如成环反应)由于数据量极小而会被忽略,从而导致其难以预测包含稀有反应合成步骤的化合物合成。这成为人工智能辅助逆向合成中的一个难题。近日,前沿交叉科学青岛研究院-分子科学与工程研究院邓伟侨教授团队为解决这一难题,在传统人工智能辅助逆向合成方法中引入专家知识改善了稀有反应的预测。通过加入吡嗪环的反应模板,专家知识改善的人工智能逆向合成方法可以合理预测包含吡嗪环的化合物的合成路线。
研究团队使用专家知识改善的人工智能逆向合成方法针对6种潜在的抗新冠药物(图1)的合成路线进行了设计,以便找到低成本大规模生产的简单路线。
图1潜在的抗新冠药物
设计出的新合成路线中,法匹拉韦(Favipiravir)的步骤仅为3步,而它已有的合成路线为5步;Molnupiravir的新路线的步骤为2步,已有路线为2步;Sabizabulin的新路线的步骤为4步,已有路线为5步;Fluvoxamine的新路线的步骤为2步,已有路线为3步;Chlorpromazine的新路线的步骤为1步,已有路线为1步;Ritonavir的新路线的步骤为2,已有路线为3步。除了Molnupiravir和Chlorpromazine的已有路线已经很少以外,其他复杂药物分子的新合成路线的步骤均减少了1-2步。为验证新合成路线的合理性,以法匹拉韦为例进行了实验合成验证,经过实验证实了设计的新合成路线有效,且成本相比已有路线便宜了近44倍。
综上,研究团队对人工智能辅助逆向合成方法引入专家知识,改善了包含稀有反应的合成路线的预测。并用专家知识改善的人工智能逆向合成方法设计了6种潜在抗新冠药物的合成路线,通过实验证实了法匹拉韦的合成。相关成果以“Optimized synthesis of anti-COVID-19 drugs aided by retrosynthesis software”为题,发表在RSC Medicinal Chemistry期刊,并被选为封面文章(FrontCover)。前沿交叉科学青岛研究院硕士研究生戚文涛和翟冬助理研究员为该论文的共同第一作者,邓伟侨教授和苏州大学李有勇教授为通讯作者,山东大学为第一完成单位。相关研究得到了国家重点研发计划,国家自然基金委,山东省自然基金等项目的支持。
图2相关发表论文的RSCMedicinalChemistry封面
原文链接:https://doi.org/10.1039/D2MD00444E