国内或国外 期刊或论文

您当前的位置:发表学术论文网电子论文》 机器学习在抗生素的鉴定识别、微生物作用机制以及去除效果评估中的应用研究进展> 正文

机器学习在抗生素的鉴定识别、微生物作用机制以及去除效果评估中的应用研究进展

所属分类:电子论文 阅读次 时间:2022-05-25 14:14

本文摘要:摘 要 抗生素在医疗卫生、养殖业等领域的广泛应用导致其随着医疗废弃物、废水等进入到自然环境并对人体健康和生态环境造成不利影响,而系统分析环境中残留抗生素的种类、明确其与微生物的作用机制以及开展不同处理方法的效果分析,对于准确评估抗生素的风险和控制其不

  摘 要 抗生素在医疗卫生、养殖业等领域的广泛应用导致其随着医疗废弃物、废水等进入到自然环境并对人体健康和生态环境造成不利影响,而系统分析环境中残留抗生素的种类、明确其与微生物的作用机制以及开展不同处理方法的效果分析,对于准确评估抗生素的风险和控制其不利影响具有重要意义.作为一种辅助手段,机器学习算法在大量数据解析的基础上可进行结果评估和预测,因此可高效、低成本分析环境污染物的行为特征. 基于此,本文综述了机器学习算法在抗生素鉴定识别、微生物作用机制和去除效果评估预测方面的应用现状,并概括了不同算法的应用特点和局限性. 鉴于机器学习当前在抗生素研究中的重要作用,为其未来研究方向和发展提出展望,如在其它新兴污染物的环境行为、效应及控制等方面的应用.

  关键词 机器学习,抗生素,鉴定识别,作用机制,去除效果评估.

机器学习

  抗生素是由微生物(包括细菌、真菌、放线菌属)或高等动植物所产生的,能干扰其他生物细胞发育功能的化学物质[1]. 常见的抗生素有青霉素类、四环素类、头孢类、喹诺酮类等,其抑菌性被广泛应用于医疗卫生、畜牧业和水产养殖业[2]. 然而进入生物体内的抗生素不能被完全代谢,残留的抗生素可能会通过市政污水、牲畜粪便、农田径流等多种途径排入环境中[3 − 5]. 近年来,已经在地表水、污水处理厂、土壤和大气中检测到抗生素的存在[6 − 9]. 环境中抗生素的存在会对人体健康和环境产生不利影响,如增加环境中微生物群落的选择压力,临床抗生素使用效率降低等[5, 10].

  系统分析环境中残留抗生素的种类、明确其与微生物的作用机制以及开展不同处理方法的效果分析,对于准确评估抗生素的风险和控制其不利影响具有重要意义.目前抗生素的定性和定量分析方法较多,包括分光光度法、化学荧光、化学磷光、液相色谱法和毛细管电泳法等,这些方法耗时长、检测过程复杂[11],对大量检测数据进行有效的分析显得尤为重要.环境中残留的抗生素与微生物的作用机制复杂,高效的数据处理方法如机器学习算法有助于深入揭示作用机制. 鉴于环境中残留抗生素的潜在风险,研究者发现膜过滤、高级氧化技术、生物处理、吸附[12, 13]、光催化等技术均可实现抗生素的去除[14 − 16].

  然而多种处理方法对于不同环境介质中不同种类抗生素去除效果的评估、优化以及预测都有待进一步探究,建立相关的模型来分析去除方法、目标污染物和去除率之间的关系对于抗生素的污染控制具有指导意义.机器学习是一种旨在使计算机具有获取知识和处理大数据的能力,同时建立学习理论计算方法,构建各种学习系统并将其投入到实际应用中的一种技术[17]. 其核心是“使用算法解析数据,从中学习,然后对新数据做出决定或预测”. 机器学习算法可以分为有监督、无监督和半监督[18],主要包括决策树学习、朴素贝叶斯、支持向量机、随机森林、k-均值算法、主成分分析、人工神经网络、k-近邻分析和遗传算法等[19].

  鉴于机器学习可以处理大量样本数据,并且能进行图像识别和语言识别,目前在大气污染物的检测和评估以及医疗中抗生素的选择和适用中已得到较为成熟的发展[20 − 22]. 在抗生素的相关研究中,传统分析方法与机器学习的结合可以更加快速的识别抗生素的种类并进行定量分析[23],并且利用机器学习优化模型有助于最佳去除条件的获取.基于此,本文主要综述了:(1)机器学习作为一种辅助手段在抗生素鉴定识别中的应用,主要包括食品和环境中抗生素的定性和定量分析以及新型抗生素的发现;(2)机器学习在抗生素与微生物作用机制研究中的应用;(3)机器学习模型用于抗生素去除效果评估. 本文主要通过综述机器学习算法在抗生素鉴定识别、微生物作用机制和去除效果评估预测方面的应用现状,针对不同算法的特点和局限性,为今后的研究方向和发展提出展望.

  1 机器学习在抗生素鉴定识别分析中的应用( Application of machine learning in identification andanalysis of antibiotics)

  1.1 抗生素的定性定量分析抗生素的种类繁多,稳定性较好,因此残留抗生素较难降解,食物及环境中残留的抗生素过高会对微生物和人体健康产生不利影响(如毒性作用、细菌耐药性形成和过敏反应等)[24]. 根据不同抗生素对微生物的毒性作用及抗生素耐药性影响的不同,医疗产品评估机构对食品中很多抗生素的残留量做了规定,例如:欧洲医疗产品评估机构规定牛奶中庆大霉素的最大残留量为 100 ng·mL−1[25]. 准确鉴定食品和环境中抗生素的种类并进行定量分析是评估其暴露风险的重要前提. 传统的定性定量方法无法对大量未知样本进行快速分析,而在此基础上结合机器学习可以进行多组分和大量样本的高效分析.

  Yehia 等在利用主成分回归(Principal component regression,PCR,又称 Fisher 判别分析)、偏最小二乘法(Partial least squares,PLS)、多元曲线分辨-交替最小二乘方法(Multivariate curve resolution - alternatingleast squares,MCR-ALS)、人工神经网络(Artificial neural network ,ANN)对光谱数据分析来追踪废水样品中的头孢菌素的残留量,结果表明 ANN 误差最小且具有良好的回收率,MCR-ALS 既可以定性又可以定量分析废水样品中的复杂混合物,分析性能优于色谱技术[26]. 但 Zhong 等对食品中氟喹诺酮类抗生素残留量进行分析时却发现 PLS 和 PCR 回收率良好,具有更好的预测结果[24]. 类似地,Long 等的研究表明了最小二乘法、朴素贝叶斯、马氏距离等方法对饲料中低浓度和混合氟喹诺酮类抗生素检测方面的局限性[27].

  由此看来,机器学习作为一种辅助数据分析手段,检测方法和样品来源的不同都会导致其分析性能的差异. 例如,对牛奶和自制生物溶液中的四环素采用人工神经网络辅助分析时,发现方波伏安法相对于比色法更适宜低浓度抗生素的检测[28 − 29]. 主成分回归相对于多元线性回归可以实现食品样品中多种氟喹诺酮类抗生素的同时测定,并且结合差分脉冲溶出伏安这一微量分析方法更有助于提高样品的回收率[24, 27]. 另外,在对四环素的检测中发现支持向量机(Support vector machine,SVM)、PCR 和线性判别分析(Linear Discriminant Analysis,LDA)可以区分两种不同的四环素类混合物,并且 LDA 这种有监督的学习方式可以克服 PCR 所面临的不良分类问题,而人工神经网络对四环素定量分析的相对准确度达到了 91.9%—105%[28, 30]. 遗传算法(Genetic algorithm,GA)是基于达尔文进化论,通过模拟自然进化来搜索最优解的算法,主要应用于机器学习的前处理利用变量选择以提取最相关的变量并删除不相关的变量来优化模型. 用遗传算法对这些模型进行优化可以提高灵敏度和召回率—即抗生素的识别率[31].

  偏最小二乘法、浓度残留经典古典最小二乘法和人工神经网络可用于阿莫西林和氟氯西林的定性定量分析,R2 均大于 0.99,Attia 等利用遗传算法对其进行优化后,除 GA-ANN 外,在二者的预测中R2 均增大[31]. 除此之外,Ding 等还发现了使用 Fisher 判别分析和多层感知神经网络还能对电子鼻检测羊乳中青霉素残留量这一新方法的可行性和准确性进行评估,为之后新方法实施的有效性提供了数据支撑[32]. 类似地,依赖于机器学习对磺胺噻唑、乙酰螺旋霉素等其它抗生素的定量分析也早有研究[11, 33 − 34].对于不同机器学习方式的性能评判指标主要有准确率、灵敏度、特异性、精度、召回率、ROS 曲线和鲁棒性等. 现将不同机器学习方式对抗生素定量分析的相关性能指标进行整理.

  机器学习提高了各种检测方法对抗生素的定量分析的效率,可实现大样本量的检测,降低时间成本,使用遗传算法对数据进行预处理会增大预测数据与定值的拟合度,但所有的学习方式都需要大量的数据集和图像集,并且至今还没有一种方式可以实现 100% 的准确率和回收率,在有大量数据支撑的检测方法的基础上应用机器学习才会获得最佳的鲁棒性.

  1.2 新型抗生素的发现

  抗生素耐药性是细菌在抵抗抗生素时所产生的防御能力. 当抗生素连续释放到环境中,可能会增大细菌的选择性压力,从而使其产生抗性致使抗生素失效,需要发现和设计新型抗生素来解决大量抗生素失效的问题[35 − 36]. 目前,新型抗生素的开发主要集中在两大类,一是在与已有抗生素结构相似的化合物库中筛选可疑化合物进行验证,二是从天然产物中挑选新的有效抗菌肽. 其中,抗菌肽作为一种先天免疫的天然成分[37],对细菌有很强的杀伤作用,尤其是其对某些耐药性病原菌的杀灭作用更引起了人们的重视,被认为是目前最有前景的一种新型抗生素. 除此之外,人们还发现,某些抗菌肽对部分病毒、真菌、原虫和癌细胞等有杀灭作用,甚至能提高免疫力、加速伤口愈合过程[38]. 抗菌肽作为一种小分子肽,其氨基酸序列和结构与其生物活性有相关性,获得相应的抗菌肽段需要对它的序列和活性进行分析[39]. 传统的抗菌肽的发现方式主要包括利用细菌进行筛选和基因组测序两种[40].

  利用细菌进行筛选的特异性较强,不同菌的敏感性不同,而基因组测序仅能输出已知的生物合成簇家族. 相比较传统方法,借助于机器学习对抗菌肽进行识别和活性分析可以更加高效的找到适宜的抗菌肽序列并根据序列按照结构相似性和同源性发现未知的抗菌肽[40]. 目前已有研究表明,随机森林、卷积神经网络等方法通过探索肽序列空间来发现抗菌肽可以提高抗菌肽的识别率[37].Morales 等将机器学习与分子荧光光谱法和电子鼻等技术相结合用于抗菌肽(AMP)的发现和生物活性预测[34, 37, 41 − 43]. 人工神经网络中应用长期短期记忆网络可以表征高度复杂的顺序,将肽序列转换为均匀的数字矢量作为神经网络的输入层,这种方法可以帮助识别出可能隐藏在全面数据集中所代表 AMP 的不同家族的可疑序列[44].

  同样,Lata 等也应用人工神经网络、定量矩阵和支持向量机分析氨基酸 N 末端残基和 C 端残基以预测抗菌肽,结果表明支持向量机对 N 和 C 端残基同时分析时的准确度最高[43]. 另外,在 Gull 等的研究还表明采用支持向量机和极端梯度增强树既可以预测肽序列是否为抗菌肽,又可以通过 AMAP 分数来评价其生物学活性及序列突变对活性的影响[45].利用敏感性、特异性、准确度、马斯修相关系数和 ROC 曲线可以评估不同机器学习算法识别抗菌肽的性能.

  不同的机器学习算法包括基于长期短期记忆网络的神经网络、基于序列最小优化(Sequential Minimal Optimization, SMO)算法的支持向量机、基于 N 端和 C 端残基的支持向量机、定量矩阵及卷积神经网络的准确率都在 90% 以上,可以有效用于抗菌肽的识别[46]. 除此之外,可使用支持向量机、逻辑回归、随机森林、Blast 和深度递归神经网络,以蛋白质序列作为输入层来区分抗菌肽和非抗菌肽序列[47]. 通过绘制这些模型的平均精确召回曲线可以发现,深度递归神经网络的效果最好,精度可达 0.958[47].

  近年来,也有不少研究者利用机器学习从大量的化学文库中筛选可行的抗菌分子,Stokes 等利用深度神经网络训练分子结构对大肠杆菌生长抑制的关系模型,并将其应用于多个化学文库中,根据预测分数来确定候选抗生素进行验证,发现了 8 种新型抗菌分子[48]. 此外,利用半自动化细菌表型指纹(BPF)分析平台来指导化学结构和生物活性的优化,结合随机森林算法分析,不仅可以从分子的物化特性来揭示抗生素分子,还可以实现跨物种的新型抗生素的开发应用[49]. 我们发现目前关于开发新型抗菌化合物分子的研究远不及抗菌肽的识别成熟,而且对于大数据文库的分析,更加依赖于随机森林、卷积神经网络和深度神经网络这类深度学习算法.

  2 机器学习对抗生素与微生物作用机制的预测分析(Predictive analysis of the mechanism of actionbetween antibiotics and microorganisms by machine learning)抗生素对微生物的主要作用机制包括:抑制细胞壁的合成(青霉素类和头孢菌素类),与细胞膜相互作用(多粘菌素和短杆菌素直接破坏细胞外膜和内膜),干扰蛋白质的合成使一些酶失去作用(福霉素类、氨基糖苷类、四环素类和氯霉素),抑制核酸的转录和复制,阻止细胞分裂和所需酶的合成(萘啶酸和二氯基吖啶). 尽管抗生素的主要靶向作用和机理已经有了充分研究[50],但对于抗生素诱导代谢改变的生物学机制尚不清楚,分析抗生素与细菌的作用形式有利于更深入地阐述抗生素的作用机制. 同时,抗生素要想对细胞具有一定的活性就必须穿透细胞的保护屏障,不同种抗生素采用相同方式与细菌接触时会有共同的氨基酸序列或者分子结构,研究这些序列和结构与细胞作用形式之间的关系,有利于研究影响细菌抗生素耐药性出现的关键因子[51- 52]. 而将生化筛选,网络建模和机器学习结合对于深入解析抗生素的作用机制具有重要意义[53].

  Lu 和 Yang 等也利用机器学习预测抗生素与 DNA 的相互作用并分析其影响核酸复制和合成的机理,发现多元分析和人工神经网络可以预测抗生素与 DNA 相互作用的影响因素并预测未知抗生素与DNA 的结合方式[52, 54]. 研究者将层次聚类、回归分析和超几何通路识别应用于解析抗生素作用下的代谢机制,发现氨苄青霉素限制了腺嘌呤的合成,增加了 ATP 的需求,从而导致中央碳代谢活性和耗氧量增加 [54 − 55].

  除此之外,抗生素还能够与细胞膜相互作用,Lee 等基于 α-螺旋抗菌肽序列训练的支持向量机可鉴定与细菌脂质膜相互作用的不同环状抗生素作用机制的共同点,以不同的序列和结构作为输入变量,利用经验膜活性进行训练来预测结构-膜活性关系[51]. 发现不同种类抗生素与生物作用存在共同之处,找出这部分的氨基酸序列就可以预知未知抗生素对微生物的作用方式. 此外,抗生素在投入使用之前都要进行抗生素药敏性测试,来确定它对细菌的半致死量及作用方式[44, 55]. Iriya 等基于以往相关问题的大量数据集,来建立不同菌株的抗生素的敏感性,得出卷积神经网络和长短期记忆神经网络对多粘菌素 B、氨苄青霉素和庆大霉素的准确度极高,但对链霉素、环丙沙星的准确度较差[44].Budak 等还发现概率神经网络在抗生素对微生物的最小抑菌浓度的研究上表现出较好的特异性和灵敏性[56].

  3 机器学习

  用于环境中抗生素去除效果的预测分析(Predictive analysis of antibiotic removal in theenvironment using machine learning)抗生素通过生活污水、养殖废水、医疗废弃物等途径进入到水体、土壤和空气等环境中[57]. 残留在环境中的抗生素不仅会引起抗生素耐药性的增强和抗性基因的传播,而且威胁人体健康,如引起皮肤过敏反应、损害肾脏和听觉神经和导致肝损伤等[58]. 因此,环境中残留抗生素的去除对于减缓其生态环境的不利影响至关重要. 而抗生素种类多、环境影响因素复杂等问题导致在不同环境介质中的去除条件差异较大,从而增加了抗生素去除效果分析的难度. 机器学习可在对不同抗生素去除方法的数据分析的基础上,探究最佳去除条件,并建立合适的模型用于评价方法的可行性和有效性,目前已经被广泛应用于水环境中抗生素的去除研究[59].目前抗生素去除研究中应用的机器学习算法以神经网络模型为主,主要包括人工神经网络、反向传播人工神经网络、半径基函数神经网络、遗传算法人工神经网络和一般回归神经网络.

  除此之外,也有少量研究应用了响应曲面法、随机森林和梯度增强树. Zhu 等在分析碳基材料对四环素和磺胺甲恶唑吸附的研究中发现,随机森林的预测精度比梯度增强树和人工神经网络高,且通过不同机器学习算法证实了材料表面积、溶液 pH 和抗生素与碳基材料的初始比例是决定去除效率的主要因素[60]. 相反,在工业造纸污泥活性炭吸附恩诺沙星的研究中,人工神经网络预测的拟合度要优于响应曲面法. 光催化技术因其高效的抗生素去除效率得到快速发展,且人工神经网络对光催化法处理结果的分析较响应面法、增强回归树应用更加广泛,所拟合的模型相关性较好[61 − 63]. 此外,Zhou 等的研究也表明半径基函数神经网络在模拟和预测水溶液中苏云金素的非生物降解过程中也表现出了较高的相关性[59].

  大量研究表明,机器学习算法、去除方法和目标抗生素种类的差异都会导致模型与实际结果的拟合效果的不同,比较机器学习算法在四环素去除中的应用发现,人工神经网络与生物吸附去除技术相结合,及增强回归树应用于纳米复合材料吸附技术时的相关系数均可以达到 0.999 以上[61, 64]. 对比这些研究我们发现样品的形态也可能是影响拟合效果的一种因素,相对于采用堆肥去除四环素时对固体样品进行分析,人工神经网络在水环境体系中四环素的去除效果分析中具有更好的拟合和预测效果[64 − 66]. 相比其他方法,人工神经网络因其较强的适用性应用最为广泛,但传统的人工神经网络并不能满足多组分复杂体系的研究. 采用不同算法对纳米复合材料吸附四环素的研究中发现,增强回归树的拟合性要优于一般回归神经网络,使用遗传算法优化的人工神经网络对于光催化去除硝唑类抗生素性能要更好[61, 63, 67]. 而对于去除最佳条件这种多因素实验条件探究时,随机森林有助于我们快速筛选出最优条件[60].

  4 总结与展望(Conclusion and prospect)

  本文阐述了机器学习在抗生素的鉴定识别和抗生素作用机制的研究以及水环境中抗生素的去除上的相关应用. 综上所述,机器学习在抗生素的鉴定识别、抗生素与微生物作用机制分析和抗生素去除效果的预测方面已有大量应用,而人工神经网络是应用最为广泛的机器学习算法,并且在水环境中抗生素去除的模型建立表现出更优越的性能. 在抗生素的鉴别方面,判别分析主要应用于抗生素的定量分析,而神经网络系统和半监督学习方式-支持向量机等一些分类算法则被用于抗生素预测如抗菌肽的发现.尽管机器学习在抗生素的定量定性分析及新型抗生素的发现上发挥了重要作用,但目前在多种抗生素混合物的定性分析上仍有很大的局限性,且不能准确预测较低浓度的抗生素. 此外,抗生素作用机制的特异性和复杂性限制了机器学习的应用,因而应当在最佳样本数量、模型优化和预处理方面进行深入研究,提高算法的准确率和灵敏度. 同时,采用遗传算法等对数据和算法进行优化可提高模型的适应性和稳定性. 鉴于其特点及当前在抗生素研究中的重要作用,机器学习在未来研究其他新兴污染物的环境行为、效应及控制等方面可发挥重要作用.

  参考文献 (References)

  张晓蕾. 对antibiotics由抗菌素到抗生素之分析 [J]. 临床医药文献电子杂志, 2014, 1(11): 2061-2062.ZHANG X L. Analysis of antibiotics from antimicrobial to antibiotics [J]. Journal of Clinical Medical Literature, 2014, 1(11): 2061-2062(in Chinese).[ 1 ]廖洋, 鲁金凤, 曹轶群, 等. 光催化降解对抗生素藻类毒性效应影响研究进展 [J]. 环境化学, 2021, 40(1): 111-120.LIAO Y, LU J F, CAO Y Q, et al. Research progress on the effects of photocatalytic degradation on the algae toxicity of antibiotics [J].Environmental Chemistry, 2021, 40(1): 111-120(in Chinese).

  [ 2 ]LACH J, STĘPNIAK L, OCIEPA-KUBICKA A. Antibiotics in the environment as one of the barriers to sustainable development [J].Problemy Ekorozwoju, 2018, 13(1): 197-207.

  [ 3 ]REINTHALER F F, POSCH J, FEIERL G, et al. Antibiotic resistance of E. coli in sewage and sludge [J]. Water Research, 2003,37(8): 1685-1690.

  [ 4 ]BEN Y J, FU C X, HU M, et al. Human health risk assessment of antibiotic resistance associated with antibiotic residues in theenvironment: A review [J]. Environmental Research, 2019, 169: 483-493.

  [ 5 ]ANIKA T, NOMAN Z, FERDOUS M, et al. Time dependent screening of antibiotic residues in milk of antibiotics treated cows [J].Journal of Advanced Veterinary and Animal Research, 2019, 6(4): 516.

  [ 6 ]CHEN J, YING G G, DENG W J. Antibiotic residues in food: Extraction, analysis, and human health concerns [J]. Journal ofAgricultural and Food Chemistry, 2019, 67(27): 7569-7586.

  [ 7 ]BERGERON S, RAJ B, NATHANIEL R, et al. Presence of antibiotic resistance genes in raw source water of a drinking water treatmentplant in a rural community of USA [J]. International Biodeterioration & Biodegradation, 2017, 124: 3-9.

  [ 8 ]CHEN C Q, LI J, CHEN P P, et al. Occurrence of antibiotics and antibiotic resistances in soils from wastewater irrigation areas inBeijing and Tianjin, China [J]. Environmental Pollution, 2014, 193: 94-101.

  作者:庞蕊蕊1,2 邵博群1,2 李 烨1,2 谢 冰1,2 苏应龙1,2

转载请注明来自发表学术论文网:http://www.fbxslw.com/dzlw/30248.html