类风湿关节炎(RA)是慢性自身免疫性疾病,典型特征是对称性关节炎症,可导致不可逆的关节破坏和功能丧失,目前尚无根治方法,因此早期诊断对于防止关节损伤至关重要。目前RA的临床诊断主要依据侧重于类风湿因子(RF),然而约30%的RA患者为血清阴性,往往难以早期确诊,此外RA与骨关节炎(OA)早期临床表现上存在重叠,这进一步增加了鉴别诊断的难度。鉴于此,基于代谢研究来开发血清阴性RA的诊断模型,可以从复杂的代谢数据中提取稳健的诊断信号,有望突破现有诊断瓶颈,为临床提供一种可靠、可推广的辅助诊断策略。
研究划分为探索性队列90人,发现队列1,350人,5个独立验证队列共1,423人,样本主要为静脉血,同步收集血清学等临床指标。对探索队列样本开展非靶向代谢研究;对发现与验证队列进行靶向代谢研究,使用稳定同位素内标进行绝对定量,质谱采样使用MRM模式;原始数据进行峰提取、保留时间对齐、信号积分,进行质控过滤、缺失填补、归一化处理;靶向数据使用绝对浓度值,进行对数转换处理以稳定方差。多元统计采用主成分分析以评估整体代谢谱差异与质控稳定性,正交偏最小二乘判别分析监督建模并计算VIP值;差异分析基于t检验,靶向基于秩和检验;排除外源性代谢物基于HMDB注释,代谢物集富集分基于MetaboAnalyst;综合标准来进行标志物筛选;机器学习模型包括了逻辑回归、LASSO回归、随机森林、SVM、XGBoost;统一使用caret实现10折交叉验证与超参数调优,仅使用最终确定的6种MSI Level-1代谢物,防止过拟合,评估指标为ROC曲线下面积(AUC)、95%置信区间;对稳健性检验进行了跨平台、跨样本类型验证;对血清阴性亚组进行了专项分析,并使批次效应可视化。
研究发现类风湿关节炎患者的血浆代谢谱区别于健康对照和骨关节炎,差异代谢物筛选与通路富集分析均证明了RA的代谢紊乱状态,比如RA对比HC存在磷脂酰胆碱合成等变化,RA对比OA存在多胺合成等变化。研究初筛确定了11种候选标志物,并在靶向平台验证了其表达趋势,在三组样本间的浓度分布存在差异,比如麦角硫因、DHEA-S等,进一步优化后,确定了6种临床可测性强的代谢物用于建模。基于6种代谢物,研究采用了多种机器学习模型来构建RA诊断分类器,比如XGBoost、随机森林等,分类器功能表现稳健,且在多个独立队列中验证有效,交叉验证与外部验证表明其稳定性与泛化能力;模型分析显示,所构建的分类器不依赖RF/-CCP血清状态,能准确识别血清阴性RA患者,表明此分类器对血清阴性RA有效,突破了传统诊断瓶颈;进一步验证显示,分类器在应对不同生物样本,如血浆对比血清,以及不同质谱平台来源的数据,均能保持稳定性能,表明该代谢物组合及其分类逻辑具有良好的鲁棒性和室间可重复性。
研究通过代谢检测方法,挖掘了一组代谢标志物,利用机器学习建模,实现了优化RA诊断方法的目的,尤其适用于血清学检测阴性的RA,此发现不仅有可能提升早期与血清阴性RA的诊断准确率,还可以辅助RA与OA的鉴别诊断,具备临床落地现实可行性。研究充分证明了,结合代谢检测的多维数据整合,具有高重复性与跨平台稳定性,能区别不同亚型并及早实现药物治疗效果的预测,有望转化为RA筛查或鉴别诊断工具。

图1. 显示研究流程与队列概述。
研究从五个医学中心的七个队列中招募了2,863名参与者,构建了探索性队列,进行非靶向代谢组学分析,以识别潜在生物标志物;这些标志物随后在发现队列中通过靶向代谢组学进行验证;基于这些生物标志物构建了分类器,进一步在验证队列1–5中进行评估。
缩写:RA,类风湿关节炎;OA,骨关节炎;HC,健康对照。

图2. 显示RA、OA和HC三组样本的血浆代谢谱。
A. 正负离子模式整合后的非靶向代谢组学数据的主成分分析(PCA)结果。
B. 正离子模式的非靶向代谢组学数据的主成分分析(PCA)结果。
C. 负离子模式的非靶向代谢组学数据的主成分分析(PCA)结果。
D. 基于27种代谢物构建的代谢分类器,对C反应蛋白(CRP)阳性或阴性亚组的PCA谱型进行比较。
E. 基于27种代谢物构建的代谢分类器,对红细胞沉降率(ESR)阳性或阴性亚组的PCA谱型进行比较。
F. RA对比HC组的正交偏最小二乘判别分析(OPLS-DA)。
G. RA对比OA组的正交偏最小二乘判别分析(OPLS-DA)。
H RA对比HC组的差异代谢物火山图。
I. RA对比OA组的差异代谢物火山图。
J. RA对比HC组的代谢物集富集分析(MSEA)。
K. RA对比OA组的代谢物集富集分析(MSEA)。

图3. 显示潜在代谢生物标志物的鉴定与验证。
A. UpSet图显示通过探索性队列的非靶向代谢组学分析所鉴定出的潜在生物标志物之间的重叠情况。
B. 探索性队列中11种代谢物在RA vs. HC组和RA vs. OA组比较中的log₂倍数变化及其95%置信区间(CI)。
C. 发现队列中11种代谢物在RA vs. HC组和RA vs. OA组比较中的log₂倍数变化及其95%置信区间(CI)。
D. 小提琴图显示发现队列中RA、OA和HC三组间咪唑乙酸的绝对定量水平。
E. 小提琴图显示发现队列中RA、OA和HC三组间1H-咪唑-1-乙酸的绝对定量水平。
F. 小提琴图显示发现队列中RA、OA和HC三组间麦角硫因的绝对定量水平。
G. 小提琴图显示发现队列中RA、OA和HC三组间赖氨酸的绝对定量水平。
H. 小提琴图显示发现队列中RA、OA和HC三组间N-乙酰-L-甲硫氨酸的绝对定量水平。
I. 小提琴图显示发现队列中RA、OA和HC三组间PI的绝对定量水平。
J. 小提琴图显示发现队列中RA、OA和HC三组间2-酮-3-脱氧-D-葡萄糖酸的绝对定量水平。
K. 小提琴图显示发现队列中RA、OA和HC三组间α-酮异戊酸的绝对定量水平。
L. 小提琴图显示发现队列中RA、OA和HC三组间1-甲基烟酰胺的绝对定量水平。
M. 小提琴图显示发现队列中RA、OA和HC三组间GlcCer的绝对定量水平。
N. 小提琴图显示发现队列中RA、OA和HC三组间DHEA-S的绝对定量水平。

图4. 显示基于代谢物的类风湿关节炎(RA)诊断分类器的开发与验证。
A. 在发现队列中,用于区分RA与健康对照(HC)的五种机器学习模型(LASSO、逻辑回归、SVM、随机森林、XGBoost)的受试者工作特征(ROC)曲线。
B. 在发现队列中,上述五种机器学习模型通过十折交叉验证评估RA与HC区分性能所得的曲线下面积(AUC)及其95%置信区间(CI)。
C. 在验证队列1中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与HC的ROC曲线。
D. 在验证队列2中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与HC的ROC曲线。
E. 在验证队列3中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与HC的ROC曲线。
F. 在发现队列中,用于区分RA与骨关节炎(OA)的五种机器学习模型(LASSO、逻辑回归、SVM、随机森林、XGBoost)的ROC曲线。
G. 在发现队列中,上述五种机器学习模型通过十折交叉验证评估RA与OA区分性能所得的AUC及其95%置信区间(CI)。
H. 在验证队列1中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与OA的ROC曲线。
I. 在验证队列2中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与OA的ROC曲线。
J. 在验证队列3中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与OA的ROC曲线。

图5. 显示基于代谢物的分类器在血清阴性类风湿关节炎(seronegative RA)中的诊断性能评估。
A. 在发现队列中,原始训练模型用于区分血清阴性RA与健康对照(HC)的受试者工作特征(ROC)曲线。
B. 在发现队列中,对血清阴性RA vs. HC进行100次类别匹配的下采样后,应用原始模型(未重新训练)所得的分类性能ROC曲线。
C. 在发现队列中,基于100次类别匹配的下采样数据重新训练模型后,用于区分血清阴性RA vs. HC的ROC曲线。
D. 在合并的验证队列1–3中,应用原始模型(未经重新校准)区分血清阴性RA与健康对照(HC)的ROC曲线。
E. 在发现队列中,原始训练模型用于区分血清阴性RA与骨关节炎(OA)的ROC曲线。
F. 在发现队列中,对血清阴性RA vs. OA进行100次类别匹配的下采样后,应用原始模型(未重新训练)所得的分类性能ROC曲线。
G. 在发现队列中,基于100次类别匹配的下采样数据重新训练模型后,用于区分血清阴性RA vs. OA的ROC曲线。
H. 在合并的验证队列1–3中,应用原始模型(未经重新校准)区分血清阴性RA与骨关节炎(OA)的ROC曲线。

图6. 显示基于代谢物的分类器的稳健性评估。
A. 在验证队列4中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与HC的受试者工作特征(ROC)曲线。
B. 在验证队列5中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与HC的ROC曲线。
C. 热图及层次聚类结果,展示发现队列与验证队列4中RA与HC之间六种关键代谢物的表达模式。
D. 热图及层次聚类结果,展示发现队列与验证队列5中RA与HC之间六种关键代谢物的表达模式。
E. 在验证队列4中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与OA的ROC曲线。
F. 在验证队列5中,三种机器学习模型(逻辑回归、随机森林、XGBoost)用于区分RA与OA的ROC曲线。
G. 热图及层次聚类结果,展示发现队列与验证队列4中RA与OA之间六种关键代谢物的表达模式。
H. 热图及层次聚类结果,展示发现队列与验证队列5中RA与OA之间六种关键代谢物的表达模式。
参考文献:
Tang, J., Jiang, R., Gao, H. et al. Development and multi-center validation of machine learning models based on targeted metabolomics for rheumatoid arthritis. J Transl Med 23, 1257 (2025).
CTI华测检测参与起草的《生物刺激素 微生物功能性代谢物 通则》正式发布!
我国农业微生物市场发展势头迅猛,市场空间巨大。国家《“十四五”生物经济发展规划》《关于加快农业发展全面绿色转型促进乡村生态振兴的指导意见》及中央一号文件等均将生物农业列为重点发展领域,极大推动生物肥料、生物农药为代表的农业微生物产业的迭代升级,农业微生物产业的标准化建设成为行业发展的关键议题。今日,由 CTI 华测检测积极参与起草的团体标准《生物刺激素 微生物功能性代谢物 通则》在ABS2025 第九届生物刺激剂与农业绿色发展大会上正式发布。
2025-05-23 06:48:40
华测多组学科研服务AI+靶向代谢组学智能临床转化平台亮相第二届多组学科研大会
2024年3月30日至31日,第二届多组学科研与临床应用大会在上海丽昂豪生大酒店盛大开幕,大会以“聚焦多组学,从科研到临床”为主题,吸引了国内外众多专家学者相关的基础研究、临床应用、产业从业者参与,全场座无虚席。
2024-04-02 00:59:15
低GI饮食,营养减重第一步
《中国超重/肥胖医学营养治疗指南(2021)》近日在北京正式发布,对于我国超重/肥胖医学营养治疗具有里程碑式的意义。该指南集合了循证医学、公共卫生、营养与代谢研究领域工作的学者以及涵盖外科、内分泌、心血管、肾脏科、妇产科、儿科等多学科的专家共同合作完成。
2021-11-29 21:50:55