中药方剂是中药学中的一个重要研究领域,其基于中医整体观的思想,通过对疾病的辨证施治来构建适用于不同疾病或病情的中药处方,以实现治疗和预防疾病的目的。中药方剂的形成不仅遵循“君臣佐使”的组方原则,还取决于医生个人的诊断和实践经验,因此方剂的有效性很大程度上受到医生经验的影响,这使得方剂研究较为困难。此外,由于病因、病机、中药药味及其组合方式的复杂性,使得单一分析难以准确地获得中药方剂与疾病之间的关系。目前的中药方剂研究主要从传统经验角度和现代科学角度两个方面展开,其中传统经验角度注重探究草药的性味归经、功效特点等方面,现代科学角度则注重从分子水平理解方剂的药效成分和作用机制[1]。近年来,数据挖掘算法在中药领域的科研中得到了广泛应用。采用数据挖掘算法可处理和分析中药方剂中的多层次数据,并对其作用机制提供合理解释[2]。这一方法现已较好地应用于中医药的配伍规律和高频药组的挖掘中[3],提高了临床诊断、靶点筛选和新药研究的可靠性和准确性,为临床精准用药提供了科学参考。本文中,笔者较为全面地论述了数据挖掘算法在中药方剂中的应用现状,旨在为该方法在中药方剂研究中的进一步应用提供参考。1文献检索与整理本研究首先以“方剂”“数据挖掘”“Apriori”“层次聚类”“决策树”“支持向量机”等为关键词,组合查询中国知网、万方数据、维普网和PubMed数据库中2015年1月-2023年6月收录的相关文献,共得到341篇文献。为了保证文献的质量,本研究对检索到的341篇文献进行了筛选整理,选择核心期刊文献以及硕士、博士学位论文,去除无效文献和重复文献后,共纳入有效文献147篇。然后,对纳入文献按照中药方剂研究子领域进行分类,将子领域内文献总数不少于10篇的纳入分析,如子领域里文献数量较少则不做单独讨论,合并归类在“其他应用”项里。对得到的有效文献进行归纳总结后,将纳入文献按照子领域分类并建立了6个文献库,方法流程如图1所示。最后,分析数据挖掘算法在中药方剂研究子领域中的应用现状,并探讨分类任务、聚类任务和关联规则分析中的代表性算法。10.6039/j.issn.1001-0408.2024.01.20.F001图1文献收集与归类分析流程2数据挖掘算法在中药方剂研究子领域的应用与分析由检索到的147篇有效文献可知,数据挖掘算法是中药方剂研究的有力辅助工具。不同类型的数据挖掘算法在中药方剂研究子领域的应用如表1所示。10.6039/j.issn.1001-0408.2024.01.20.T001表1数据挖掘算法在中药方剂研究子领域的应用情况研究子领域文献数量/篇数据挖掘算法中药方剂作用机制研究43复杂网络分析、人工神经网络等中药方剂量效研究98Apriori、K均值聚类、聚类分析、支持向量机、朴素贝叶斯等挖掘核心药对/药组112关联规则、熵聚类、层次聚类等挖掘“方-药-证”间的关系14Apriori、熵聚类、层次聚类等发现新方剂61关联规则、聚类分析、支持向量机、决策树等挖掘配伍规律42关联规则、聚类分析、决策树、回归分析等其他应用8隐含狄利克雷分布主题模型、马尔可夫链、禁忌搜索算法等2.1中药方剂作用机制研究中药具有多靶点、多环节、多途径、整合调节的特点,因而详细阐明其作用机制较为困难。目前多成分干预治疗对于复杂疾病更有优势,如肿瘤的药物治疗已从单一用药向联合用药方向转变。陈恒巍[4]建立了一种协同抗肿瘤多药组合深度学习预测模型,在阐明中药协同抗肿瘤的作用机制方面提供了新的思路和方法。随着医学与生命科学研究进入大数据时代,网络药理学将网络科学和系统生物学方法应用于药物研究,可解释中医药作用机制。研究者利用筛选的药物成分和疾病靶点信息构建药物-靶点-通路生物网络模型,通过找出网络关键节点可揭示目标药物对疾病的作用机制和生物学基础。如复方一枝蒿在治疗流感方面具有确切的效果,但其物质基础及作用机制尚不明确,许律捷等[5]基于贝叶斯模型的组合机器学习方法探索复方一枝蒿的作用机制,得到其通过多成分、多靶点和多通路发挥抗流感作用。2.2中药方剂量效研究中药药量是决定方剂药效的关键因素,挖掘药物在治疗不同疾病方剂中的常用剂型、剂量和用法,有助于发现潜在组方规律,提高中药组方的准确性,确保用药的有效性和安全性。研究者收集含有目标药物的名家医案或经典古方,整理方剂对应的证型、症状和药物的药量、性味、归经等数据,通过关联规则和聚类分析等数据挖掘算法,分析目标药物在不同功效下的常用剂量,可为中药在临床的精准使用提供科学参考。王妍等[6]采用关联规则的算法开展酸枣仁用量与主治病证关系的研究,得出了5种常见病证下酸枣仁的常用剂量。骆宾妃等[7]采用数据挖掘方法分析了《中华医典》中含竹沥的方剂和主治病证,指出针对不同疾病的证型特点不仅应调整药物配伍,还应调整竹沥的剂型和用量。侯王君等[8]通过中医传承辅助平台分析,得出了冠心病心绞痛方剂中使用频次最高的5味中药——川芎、丹参、黄芪、当归和红花的最佳用量。王烨燃等[9]采用Apriori算法对治疗胃火炽盛型消渴病方剂中的药物用量、性味、归经和频次进行了分析,得到了方剂中天花粉、知母、黄连、麦冬的药量,印证了“清泻胃火为主,兼顾滋补肺、肾等脏腑之阴”的治疗原则。2.3挖掘核心药对/药组药对是方剂最小的组成单位。作为一种相对固定的中药配伍形式,药对像桥梁一样将单味中药和方剂联系在一起,其不仅具备方剂的基本主治功能,往往还体现了方剂组成的核心。研究人员常采用Apriori算法挖掘高频药对/药组并分析潜在配伍规律,通过调整置信度和支持度过滤关联性弱的药对/药组,绘制出现频次高的核心药对/药组的网络图,从而直观地展示药对/药组间关联性的强弱。孙世光等[10]采用复杂系统熵聚类算法整理防治失眠的方剂,得到了分别由2味、3味和4味药组成的核心药对/药组。一方面,挖掘核心药对/药组能够表达方剂的处方思路或首选处方结构,反映方剂的整体功效特点;另一方面,关键药对/药组对方剂的组成和疗效具有重要影响。孙志新等[11]通过挖掘治疗心悸的方剂,对比方剂中所有药物和常用药对中的高频药物,将11味重合药物命名为核心用药,发现其多分布在心经和脾经,印证了治疗心悸的方剂具有养心、健脾的功效。鞠康等[12]挖掘《中国方剂数据库》包含“疫”病方剂的药物频次、性味、归经,并通过聚类分析算法对高频药物聚类,得到5类关键药物组合,该结果与方剂的主成分分析结果一致。2.4挖掘“方-药-证”间的关系“方-药-证”的理念体现了中医疗法的整体观念和个体化治疗原则,医生运用辨证施治的方法,根据患者特定的证候特征进行针对性的治疗,在此基础上选择适当的方剂,再确定最终药物组合。研究者可以采用数据挖掘算法,对“方-药-证”之间的关联性进行研究,从更客观的角度阐释中药方剂科学配伍的合理性,为中医药的临床诊治提供参考。在解释目标方剂或药物与中医证型之间的关系方面,胡慧明等[13]采用关联规则及聚类分析算法发现,针对不同病证,山楂皆常配伍理气药、消食药、补虚药进行治疗;陈建国等[14]采用改进的遗传算法提取方证决策表的决策规则,阐释了冠心病方剂与证型间的关联及用药原则;崔一然等[15]构建了方剂中除丹参-红花以外的药物关系网络图,揭示了该药对常与活血、行气之品联用,解释了该药对与中风、血瘀痛证之间的关系。相关研究还关注于药物与主治疾病之间的联系,如赵萱等[16]采用频次统计和关联规则的方法,分别阐明了人参-附子在治疗5种不同疾病时的配伍区别,为解释该药对的核心功效提供了重要参考和科学依据;赵艳青等[17]通过中医传承平台挖掘抑郁症方剂的证型和高频药味,发现常见证型多含“肝郁”,高频药味也多具有疏肝解郁、疏肝理气等功效,揭示了抑郁症与情志失调之间的关联性。2.5发现新方剂发现新的中药方剂具有双重意义:其一,依据现有方剂的高频药物组合生成新处方,丰富了经典古方的内涵;其二,研究评价新处方的方法,判断新处方能否达到更好的疗效。关联规则算法和聚类分析算法在发现新方剂方面的使用频次较高,前者用于在大量药物中挖掘关联度较高的药物组合,然后采用后者将核心或高频药物聚类得到新处方。王嘉欣等[18]依据聚类和排序的思想提出TOPSIS算法,得到的最优新处方与中医传承辅助平台生成的新处方一致,为生成新处方提供了新的思路和方法,使新处方的评价更具有客观性和科学性。朱月[19]通过挖掘治疗泄泻病寒湿内盛证的用药规律,得到支持度最高的药对是甘草-白术,且理气药和补虚药2类药物使用较多,在此基础上自拟了中药处方并通过临床试验证明了其疗效优于蒙脱石散。程立前[20]收集整理了治疗先兆流产的药物及出现频率、归经和常用药组,经聚类分析算法获得了7个能够改善患者临床症状的新组方。鲁可等[21]采用无监督的熵聚类分析算法对两类核心组方进一步聚类,得到了6个治疗咳血的新药物组合,并结合中药理论知识分析了新方的合理性。沈莹等[22]对2015年版《中国药典》中含甘草的止咳方剂进行了挖掘分析,结合中医理论在高频药物的基础上归纳出1组新方剂,并从现代药理学角度阐释了新方剂止咳祛痰的机制,为研发止咳祛痰类药物提供了科学依据。2.6挖掘配伍规律中药配伍规律遵循“七情和合”“四气五味”“君臣佐使”等原则[23]。同一方剂中的不同药物通过配伍,可起到增效、减毒等作用。研究中药方剂的配伍机制不仅对阐释中医理论内涵具有重要意义,还对中药方剂的发展具有推动作用。通过分析目标药物的配伍药物可为研究其配伍规律提供参考,如赵文龙等[24]通过挖掘《中医方剂大辞典》中含有羌活治疗疼痛的方剂,发现羌活配伍的高频药物有防风、甘草、川芎。潘树茂等[25]采用数据挖掘方法发现治疗原发性肝癌的处方中健脾益气药的使用频次最高,该类药物与白术-莪术配伍可健气补脾,加以柴胡-鳖甲可疏肝解郁。切尼项毛等[26]将Apriori算法与“味性化味”矢量模型结合,解释了石榴籽适合与温性药材配伍的原因。郝庆勋等[27]采用数据挖掘算法发现不同结缔组织原发病的治疗药物具有不同的配伍特点,如治疗系统性硬化症选用鸡血藤和大血藤可促进血液循环,而治疗原发性干燥综合征相关间质性肺疾病应该使用当归和甘草这2种具有滋阴健脾、清热养血作用的药物。郑丽等[28]采用聚类分析算法研究治疗肾性贫血的方剂,发现黄芪和当归始终分在同一簇并且处于中心位置,说明黄芪和当归为治疗肾性贫血方剂的关键药物,并且常与白术、茯苓和党参配合使用。2.7其他应用方剂相似度可用于衡量方剂之间的相似性,而成分相似的方剂在功效上具有高相关性。李新龙等[29]基于方剂相似度构建核心方药及其有效人群特征的复杂网络,采用子网挖掘算法和聚类分析算法对目标人群进行模块划分,发现对应方剂可按功效划分为2个模块。朱志鹏等[30]基于隐含狄利克雷分布主题模型将方剂和其组成成分间的关系转换成“方剂-证型”和“证型-组成成分”2个概率模型,表明该方法能够很好地计算方剂间的相似度。郭文龙等[31]采用词频-逆文档频率算法建立了方剂数据挖掘系统,可用于推荐与目标方剂功能和主治相似度高的方剂。对于联合用药产生的不良反应,王淳等[32]采用关联规则算法分析了联合用药对心血管疾病的影响,提出应谨慎使用丹参注射液、参附注射液等。蒋先仲等[33]采用数据挖掘算法并引入“丰度”的概念用于衡量研究中纳入的药品占比,提出“目标调节+整体调节+肠道微生态环境调节”的个体化组方策略,分别对早、中、晚期3个阶段的胃癌患者给出了组方设计建议。3算法应用效果比较3.1分类任务中常用算法的比较分类算法是预测性任务的一种,主要目标是将数据划分为不同的类别。中药方剂领域研究中常采用的分类算法有决策树算法和支持向量机。决策树算法因其易于理解和解释的特点而被用于研究药物与主治病证之间的关系,以及构建配伍决策模型,如构建药物和主治病证关系决策树、方剂配伍决策模型等[34]。支持向量机常用于建立预测模型、分析方剂配伍的可能性等,如金滋力等[35]把方剂看作从药物出发的组合决策问题,采用支持向量机达到了90%的分剂分类准确率。3.2聚类任务中常用算法的比较聚类分析算法将未被标记的数据分为具有相似特征的簇,从而发现数据集中的内在结构和规律,在方剂研究中可实现筛选核心药物的目的,以K均值聚类算法、层次聚类算法、熵聚类算法为代表。K均值聚类算法适用于大规模方剂数据分析,其关键点在于选择合适的聚类个数K。赵凌霄等[36]在3次聚类中分别比较了不同K值下的药物聚类结果,得到了不同K值下的药物关系图以及核心组合。层次聚类算法适合小规模数据集,如数据量有限的自身免疫性肝炎的研究[37],可依据药物性味特征进行聚类,用以挖掘药物的核心组合或生成新处方。熵聚类算法在处理噪声和异常值方面表现较佳,如肖红等[38]采用复杂系统熵聚类算法分析药物关联规则,并对聚类结果进行再次提取,通过演化得到了新的处方。3.3关联规则分析中常用算法的比较关联规则分析揭示的是数据之间的潜在关系[2],通常包括2个步骤:先查找所有频繁项集,然后基于高频项生成频繁关联规则。如果其满足最小置信度并基于第一步找到的频繁项集,则该规则被视为关联规则。Apriori算法和FP-growth算法都是关联规则分析的经典算法,前者基于先验知识,后者基于树结构。上述2种算法均有助于识别多种属性之间的关系并生成关联规则,例如挖掘高频药物的配方规律等,从而有助于分析用药原则、验证配伍规律 [39]。如李德琳等[40]通过FP-growth算法对靶点-通路网络进行了数据挖掘分析,得到34组靶点-通路频繁项集,验证了方剂具有多成分和多靶点的特征。4总结与讨论本文对147篇中药方剂研究中运用数据挖掘算法的文献进行了整理与分析,结果表明,数据挖掘算法已在中药方剂的研究中广泛应用,主要应用的子领域为:中药方剂作用机制研究、中药方剂量效研究、挖掘核心药对/药组、发现新方剂和挖掘配伍规律。常用的数据挖掘算法包括:关联规则、聚类分析、分类分析、复杂网络分析等。虽然数据挖掘算法具有较广泛的应用范围,但其对中药方剂的研究还有待进一步改进。首先,数据集规模是制约数据挖掘算法在中药方剂研究中应用的重要因素。现有的中药方剂领域数据集规模较小,这对于数据挖掘算法的应用和效果都带来了一定程度的限制。因此,需要采集更多的规范化数据,包括临床试验数据和基础实验数据,以扩大数据集规模,从而提高数据挖掘算法的精度和效果。其次,中药方剂研究中使用的算法比较单一,缺乏针对性的算法选择。尽管部分数据挖掘算法有规范的流程,例如关联规则和聚类分析,但其对于中药方剂研究存在一定的局限性和适用范围,需要根据具体问题和数据特征的选择进行调整。第三,目前数据挖掘算法在中药方剂研究中的应用主要集中在方剂用药规律的分析中,而对于疗效预测、“毒-效”评价、药物禁忌、方剂中药物的炮制等方面的研究相对较少,需要更加关注并大力开展相关领域的研究工作。随着中医病历数字化的不断推进,必将产生大量复杂、多维度的数据。相关研究人员可专注于构建结构合理的中医临床数据库,以应对研究中提出的问题。为了实现对传统中药方剂多层次、全方位的数据挖掘,除了进一步拓宽方剂研究新领域以外,研究者还应灵活地组合使用不同算法以提高结果的准确性,避免不必要的数据处理内耗。中药方剂研究若能更进一步结合数据挖掘等现代科学技术,必将进一步提高临床疗效,促进中医的传承和发展。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读