专利数据库助力科技“抗疫”
2020年突如其来的新冠肺炎肺炎疫情给中国乃至全世界带来了严峻的考验。到目前为止,病毒的阴霾还没有消散,药物和疫苗的研发仍在如火如荼地进行,各种新药、疫苗和临床研究成果层出不穷。在新药研发过程中,如果研究人员拥有相对完善的药物和化合物数据库,可以在以病原体为研究出发点的基础上,以具有相关或可能疗效的化合物及其结构为出发点,从多个角度快速锁定冠状病毒的目标化合物或类似结构化合物,从而加快药物研发进程,提高药物研发成功率。
本文以现有新冠肺炎药物的研发为例,分析了药物数据库引用规则的制定,并借鉴国内外医学化学数据库的引用内容,为药物专利数据库的建设提供参考。
杂环化合物具有突出的引导作用。
目前,新冠肺炎药物的研发有许多相关成果,如瑞德西韦、法匹拉韦、磷酸氯喹等。今年10月,美国食品药品监督管理局刚刚批准瑞德西韦用于新冠肺炎住院患者的临床治疗,成为美国首个正式批准的新冠肺炎治疗药物。
瑞德西韦的分子结构是典型的多手性中心杂环化合物,也是许多治疗冠状病毒的药物的共同特征。与此同时,几乎所有的药物都含有杂环,包括但不限于心脑血管疾病和代谢疾病、中央神经系统疾病、抗癌、抗炎、抗溃疡、抗病毒感染等。由此可见,杂环化合物不仅在治疗新冠肺炎肺炎,而且在各种常见或罕见疾病的药物发现和药物研究中也发挥着极其重要的作用。因此,在后疫情时代的药物专利数据库建设中,杂环化合物的引导方法必将成为重中之重。
杂环化合物是分子中含有杂环结构的有机化合物。除碳原子外,构成环的原子至少含有一种杂原子,是数量最多的有机化合物。在杂环化合物的引导过程中,应注意分类方法,以便R&D人员在检索过程中快速缩小范围。C07D属于国际专利分类IPC系统中的杂环化合物,包括天然产物和合成化合物。天然杂环化合物包括生物碱、类固醇、信息素或性激素、类黄酮、香豆素、维生素、生物素、嘌呤、嘧啶核酸碱、黄素、木脂素等。制定引用规则时,可以根据杂原子的种类进行分类:最常见的杂原子是氮原子、硫原子和氧原子;可以按照环的类型分类:脂杂环和芳杂环;也可以根据环的大小进行分类:药物中涉及的杂环化合物主要包括五元杂环、六元杂环和七元杂环;也可以根据杂原子的数量进行分类:分为含有一个杂原子和多个杂原子的杂环化合物。
国内数据库标引侧重于物质属性。
目前,在国内药物专利数据库建设过程中,化合物的引用一般包括原文中出现的化合物名称、分子结构、CAS号、分子量等物质属性信息。在药物研发人员检索数据库时,除了检索物质的属性信息外,化合物的制备方法也非常重要。比如药物A是通过三步反应获得的,每一步哪些反应发生什么反应,反应条件是什么,这些信息在引用过程中要注意。例如,五元杂环主要包括吡咯、呋喃、吲哚、二唑等苯并化物和衍生物。五元杂环化合物的合成方法主要是利用含有杂原子的替代基与活性ⅲ基化合物发生缩合反应,直接成环或先缩合后成环。其中,除了引用化合物名称等物质属性信息外,合成反应中反应物的类型和类型应重点引用,以便药物研发人员在检索过程中快速获取化合物的合成方法信息,确定合成策略,加快研发进程。再比如前面提到的瑞德西韦,其分子结构包含多个手动中心。一般来说,只有一种含有手性中心的药物分子具有药理活性,而实验证明,只有S型具有抗病毒活性。因此,合成过程中涉及的映异构体的分离方法和不同异构体的抗病毒活性测试非常重要,在引导过程中应重视。
国外数据库标注重制备方法。
国外重要的医学化学数据库对杂环化合物的引用相当详细和全面。除了引用化合物名称、化学结构、立体结构、CAS注册号等。,还应根据杂环化合物的结构和功能进行详细的分类,并在文献中给出其位置信息。将相关功能符分配给化合物,以表示化合物在文献中的存在形式和作用。也非常重视杂环化合物的制备方法,在引用要点、关键词和摘要中都涉及到化学反应的类型。这些都是我们可以借鉴的做法。
药物专利数据库的建设和完善是一项重要任务。在疫情肆虐全球的背景下,药物专利引导要点应包含药物研发所需的关键信息,更符合R&D人员的检索习惯,以更简单、更有利于药物系统研发为目标,真正成为科研人员和医疗系统的重要助手,提高医疗防控系统应对突发疫情的能力。