一、背景介绍
帕金森病(PD)是常见的老年疾病,目前随人口老龄化显著增加,它的病理机制是中枢神经突触蛋白错误折叠累计导致,其临床表现为震颤、僵硬、迟缓等障碍,且伴随多种胃肠道功能紊乱,如肠炎、便秘等,这些胃肠道症状或可能早于运动症状出现,提示疾病发展可能在早期就已涉及肠道。目前越来越多的证据表明肠道微生物组与帕金森病之间存在密切的联系,因此开展相关研究,不仅有助于为早期诊断提供标志物,而且可以填补发病机制相关空白,为患者治疗提供新的干预策略。
二、材料方法
研究主要目标是通过大规模机器学习方法来评估肠道菌群特征在帕金森病诊断中的潜力,其假设是患者肠道菌群与健康对照存在显著差异,足以作为疾病相关标志物。研究数据整合了不同地区来源的数据,涵盖了11个国家22个研究中的4489个样本,数据类型包括了16S rRNA基因扩增测序(16S)数据和宏基因组测序(SMG)数据,这些数据可于公共数据库中查询,如ENA、GSA、DDBJ等。机器学习模型测试了多种机器学习算法,包括随机森林、岭回归、LASSO等,通过差异丰度分析和机器学习算法内部的特征选择,确定与疾病相关的菌群特征,相关模型验证采用了10倍交叉验证(CV)、留一法验证(LOSO)等评估模型性能。对于菌群数据进行了差异丰度分析,并通过随机效应元分析整合多个研究的结果,对差异菌群进行功能富集分析以识别与疾病相关的代谢途径,统计学方法使用PERMANOVA来评估样本聚类的显著性,相关性分析使用Pearson相关来评估样本量与模型性能之间的关系,多重检验校正使用Benjamini-Hochberg方法以控制假阳性率,此外还将模型应用于其他神经退行性疾病(如阿尔茨海默病和多发性硬化症)进行跨病种验证以评估模型特异性。
三、结果讨论
研究揭示了帕金森病与肠道菌群之间的联系,患者肠道菌群变化可用于诊断,数据显示基于菌群数据的机器学习模型能够准确区分患者和对照,平均AUC为71.9%,表明肠道菌群特征具有作为标志物潜力,但在跨病种验证中AUC降至61%,表明模型的泛化能力有限或具有研究特异性,进一步优化后得到多个数据集的训练模型,AUC达到68%表明模型泛化能力得到改善。基于肠道菌群的数据分析显示,相关通路会影响肠道健康和肠-脑轴功能,例如涉及农药生物转化的通路,三氯乙烯(TCE)降解相关的基因(K03268、K18089等),会在患者组显著富集,而TCE是一种已知的环境毒素,这与流行病学证据一致,表明接触这些物质会增加帕金森风险。研究发现患者肠道中某些有益菌(如短链脂肪酸产生菌)的丰度显著降低,而潜在致病菌(如鲁斯尼杆菌)的丰度增加,与碳水化合物降解相关的显著减少,而与氨基酸代谢(如酪氨酸和色氨酸代谢)相关的显著增加。另外对于菌群潜在病原体分析发现,患者肠道菌群中与细菌分泌系统(如III型、IV型和VI型分泌系统)相关的基因显著富集,而这些系统是病原菌用来诱发宿主免疫和增加肠道通透性的关键。
四、研究结论
研究通过大规模机器学习提示了帕金森与肠道菌群之间关系,为临床提供了重要的工具,鉴于疾病的复杂发病机制,这项研究揭示了患者肠道菌群在分类功能层面的变化,为病理分析提供了新的视角。研究荟萃了不同国家研究的4489个样本,采用多数据集整合策略,这种大规模的数据整合策略使得研究结果更具普遍性,为临床应用提供了更可靠的依据。研究利用了多种机器学习算法,证明了机器学习能够自动识别和利用复杂数据,提高诊断的准确性和效率,有望在临床实践中得到更广泛的应用。
五、结果展开
图一. 帕金森病(PD)患者和对照组(CTR)的肠道微生物组组成存在显著差异。对16S(a, c)和宏基因组(SMG)数据(b, d)计算了Bray-Curtis差异性,并进行了基于距离的冗余分析(dbRDA),图中坐标轴上标注了解释的方差百分比。图中展示了原始距离(a, b)以及经过研究来源调整以去除研究特异性(批次)效应的距离(c, d)。箱线图描绘了样本在两个成分上的分布,并根据所使用的不同数据集(e, f)或疾病状态(g, h)进行区分。
图二. 显示机器学习(ML)模型性能,图中主要显示16S(a)和宏基因组(SMG)数据集(b)进行机器学习的AUC(Area Under the Curve,曲线下面积)值(y轴)。小提琴图描绘了跨研究验证(CSV)中ML模型性能(AUC值)的分布情况,蓝色圆圈和黄色三角形分别表示内部研究交叉验证(CV)和留一法验证(LOSO)的AUC值,水平阴影区域和线条分别表示LOSO(黄色)和CV(蓝色)的AUC值的标准差和平均值。灰色虚线标记了50%的AUC阈值,表示随机猜测的水平。
图三. 显示分类准确率保持稳定。在宏基因组(SMG)数据集中,针对用于留一法验证(LOSO)的7个训练集,基于训练集的差异丰度分析进行特征选择,挑选出具有最大绝对效应的20个特征,并用它们构建了新的岭回归模型,以检测数据集进行测试。图a显示了LOSO模型的准确率;图b为热图显示数据集中被选的特征集合,其中平均相对权重以颜色编码来表示,根据组别不同进行富集情况分类。
图四. 显示在整合多项研究数据后显著提升了帕金森分类模型的特异性。根据训练方法把模型分为岭回归(橙色)与LOSO(紫色),在其他疾病(AD=阿尔茨海默病;MS=多发性硬化症)数据集进行了假阳性评估(帕金森为10%,虚线),数据显示LOSO模型特异性相对较高(18.7%,紫线),而橙色水平线约为35.1%。
图五. 显示机器学习模型基于分类特征的表现优于基于功能特征,小提琴图显示不同机器学习方法所得AUC值分布密度(基于CSV、CV或LOSO),灰色虚线为50%阈值表示随机猜测。
图六. 显示帕金森与对照组之间存在显著差异的菌群。图a显示使用‘GOR’对16S和SMG数据进行单变量差异丰度检验,并通过随机效应分析汇总检验结果;图b显示不同来源数据中两组之间差异;图c则展示基于各数据集所构建模型计算出的平均岭回归系数及标准差。
图七. 显示帕金森与对照之间KEGG功能分析的差异。图a显示通路、模块和同源基因之间网络图,节点大小代表富集程度,条纹热图表示差异基因所占比例,其中TIISS等表示分泌系统。图b显示患者组富集的代表性代谢通路,矩形方框代表相应的代谢反应,圆形表示代谢物或外源物,当同源基因在患者中显示富集时标为红色。
参考文献:
Romano S, Wirbel J, Ansorge R, Schudoma C, Ducarmon QR, Narbad A, Zeller G. Machine learning-based meta-analysis reveals gut microbiome alterations associated with Parkinson's disease. Nat Commun. 2025 May 7;16(1):4227.
CTI华测检测荣获NHF营养与健康食品产业发展大会年度影响力品牌奖!
4月24日-26日,NHF营养与健康食品产业发展大会在济南成功举办,本次会议以“创新融合-推动全民营养健康高质量发展”为主题,汇聚行业专家、企业代表及科研机构,共同探讨特殊食品政策解读、营养与健康、肠道微生态、精准营养与抗衰老、体重管理、药食同源产等版块热点议题,为产业创新与融合发展提供前沿思路。
2025-05-14 02:05:09
CTI华测检测参与起草的《改善肠道健康功效测试方法》团体标准获批发布
肠道健康作为人类健康的基础,近年来逐渐受到社会各界的广泛关注。随着肠道健康问题的逐渐加剧,消费者对改善肠道健康的食品需求日益增长。然而,如何科学评估和验证相关实际效果,成为了行业亟待解决的难题。
2025-01-28 02:15:13
公益活动| 童心飞扬,探索科学之美——第二季“小小研究员”科学探索夏令营圆满落幕
今日,灏图品测再一次携手一群怀揣科学梦想的小朋友们,共同开启第二季“小小研究员——科学探索夏令营”的奇妙旅程。
2024-08-17 08:08:17