【目的】子宫内膜异位症是一种常见的妇科疾病,与痛经、盆腔疼痛、和不孕症有关,主要见于育龄妇女。有研究报道异常的B细胞免疫反应对异位子宫内膜细胞的粘附、侵袭和血管生成至关重要,因此,迫切需要探索潜在的分子机制、新的诊断生物标志物和治疗靶点。【方法】从GEO数据库下载GSE51981数据集,在77例子宫内膜异位症样本和34例非子宫内膜异位症样本中鉴定差异表达基因(differentially expressed genes,DEGs),使用“limma”包以|log_2(Fold Change)|值>1,FDR<0.05筛选差异表达基因。通过x Cell算法确定GSE51981数据集中富集的免疫细胞种类,选取B细胞相关表型进行下一步分析。通过加权基因共表达网络(weighted gene co-expression network,WGCNA)算法分析建立加权基因共表达网络,并识别B细胞相关核心模块。使用“cluster Profiler”包对B细胞相关模块中的基因进行GO和KEGG富集分析,阈值设置为FDR<0.05。运用机器学习算法最小绝对收缩和选择算子(least absolute shrinkage and selection operator regression method,LASSO)和支持向量机-递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)进行基因筛选,筛选出与B细胞浸润相关的关键基因,并通过外部数据集GSE7305进行验证。最后通过基因集富集分析(Gene Set Enrichment Analysis,GSEA)探讨生物标志物参与调控的通路。为了进一步探讨生物标志物的功能,构建了生物标志物的竞争性内源RNA(competing endogenous RNA,ce RNA)网络,并进行了药物预测。【结果】对GSE51981数据集进行差异表达分析,筛选出4341个DEGs。其中,2561个DEGs上调,1780个DEGs下调。使用x Cell算法在77个子宫内膜异位症和34个非子宫内膜异位症样本中分析了64种免疫细胞和基质细胞浸润的丰度,选择B细胞和初始B细胞作为表型进行WGCNA分析,鉴定出B细胞相关的关键模块,包含349个基因。对模块中的基因进行GO富集分析,生物学过程主要与脂多糖反应、中性粒细胞活化和免疫介导调节相关。细胞成分主要集中于分泌颗粒膜和含有胶原的细胞外基质。分子功能富集在细胞因子活性、免疫受体活性和趋化因子受体结合。KEGG富集分析的信号通路主要包括白细胞介素-17(interleukin-17,IL-17)、趋化因子、核因子-κB(nuclear factor-kappa B,NF-κB)、肿瘤坏死因子、B细胞受体、C型凝集素受体信号通路。使用venn图分析4341个DEGs和349个关AG-221化学结构键模块基因,鉴定出25个重叠基因用于后续分析。使用LASSO和SVM-RFE算法分别筛选出12个和21个特征基因,取交集得到12个重叠基因作为潜在的核心基因。在GSE7305数据集中对12个重叠基因进行验证,其中CMPK2、NR4A1、MMP2、RASGRP1、TNS1和ZNF521的表达水平与正常对照组相比,差异具有统计学意义(p<0.05)。此外,用受试者功能曲线(immune tissueReceiver Operating Characteristic Curve,ROC)分析验证了这些基因的诊断意义,发现CMPK2、NR4A1、TNS1和ZNF521的曲线下面积(area under the ROC curve,AUC)值大于0.85。因此,这四个核心基因被确定为selleck产品子宫内膜异位症B细胞浸润相关的诊断性生物标志物。这四个诊断基因在子宫内膜异位症组中表达均上调。Pearson相关分析显示,四个诊断基因,尤其是TNS1和ZNF521的表达与B细胞marker基因之间有很强的相关性。且诊断基因表达水平与许多免疫检查点分子高度相关(p<0.05),这表明诊断基因是子宫内膜异位症免疫检查点的潜在共同调节因子。在四个诊断基因的高表达组和低表达组之间分别进行了GSEA,我们得到了四个诊断基因在子宫内膜异位症中高表达组显著相关的通路。CMPK2参与的通路主要包括自然杀伤细胞(Natural killer cell,NK)介导的细胞毒性、抗原加工提呈、补体及凝血级联、细胞因子与细胞因子受体相互作用。NR4A1主要参与IL-17信号通路、类风湿关节炎、TNF信号通路、NF-κB信号通路。TNS1参与的通路主要有Ig A产生的肠道免疫网络、Th1和Th2细胞分化、NK细胞介导的细胞毒性、趋化因子信号通路。ZNF521参与的通路主要包括细胞外基质受体相互作用、Hippo信号通路、局灶性粘连、磷脂酰肌醇3(phosphatidylinositol 3-kinase,PI3K)激酶(protein kinase B,AKT)信号通路。为了进一步研究诊断基因的调控机制,我们构建了ce RNA调控网络。最后,我们通过Comparative Toxicogenomics Database数据库预测了以诊断基因为靶点的潜在药物,为药物治疗子宫内膜异位症提供了参考。【结论】本研究通过生物信息学方法和机器学习算法筛选并验证了子宫内膜异位症中四种潜在的B细胞浸润相关生物标志物,分别是CMPK2、NR4A1、TNS1和ZNF521。并探讨了这四种生物标志物在子宫内膜异位症B细胞浸润中可能参与的作用,为子宫内内膜异位的诊断和治疗在免疫和分子水平上提供了新的见解。