目的:运用临床指标建立Ig A肾病(Ig AN)无创诊断预测模型及Ig AN预后模型,分析并筛选最优预测模型,发现Ig AN诊断及预后的敏感指标,为临床Ig AN的无创诊断及预后判断提供依据。方法:(1Javanese medaka)采用历史资料分析方法,收集2018年2月至2022年6月甘肃某市三甲医院肾脏穿刺活检确诊肾脏疾病患者的全部病例数据进行分析。(2)根据肾活检的病理结果,分析该地区肾脏疾病的患病情况,描述Ig AN患者和非Ig AN患者的一般情况并进行比较。通过临床医生建议、组间比较和相关性分析筛选诊断预测变量,采用Lasso-logistic回归、BP神经网络(BPNN)和极端梯度提升(XGBoost)三种方式建立无创诊断预测模型,同时采用ROC曲线、混淆矩阵和Calibration校准曲线评价诊断预测模型的效能,最后通过ROC曲线遴选出Ig AN诊断的敏感指标。(3)采用随访研究方法,对上述肾脏疾病患者中确诊为Ig AN的患者进行随访研究,随访至2022年10月31日。基于基线及随访数据计算Ig AN患者预后不良结局的发病密度;通过临床医生建议、组间比较和相关性分析筛选预后预测变量,通过Cox比例风险回归模型、BPNN和XGBoost三种方式建立预后预测模型,评价预后预测模型的效能,并遴选出Ig AN预后的敏感指标。结果:(1)共收集到603名肾脏疾病患者的病例数据,514名患者纳入诊断预测研究,主要表现为12种肾脏疾病类型,Ig AN、膜性肾病、肾小球硬化症、糖尿病肾病和微小病变性肾病的检出率较高,分别为25.88%、23.15%、17.70%、16.93%和8.37%;其中原发性肾小球疾病共394例,Ig AN占比为33.76%。研究对象中,年龄中位数为49(35,58)岁,男女比为2.13:1。Ig AN患者和非Ig AN患者在性别、职业、水肿、糖尿病和低蛋白血症、尿液生化检查和血液生化检查等方面存在统计学差异。(2)Ig AN诊断预测研究中,最终纳入45个变量用于构建诊断预测模型。将数据按7:3的比例随机分为训练集和测试集,在训练集中构建模型并进行内部验证,将模型应用于测试集进行外部验证。其结果显示,在训练集中,Lasso-logistic、BPNN和XGBoost模型的AUC(95%CI)分别为0.894(0.857-0.924)、0.888(0.851-0.919)和0.999(0.989-1.000);在测试集中其AUC分别为0.831(0.763-0.886)、0.699(0.620-0.770)和0.853(0.787-0.904)。在训练集中XGBoost的准确率、精确率、召回率和F1分数均最高,性能最优,BPNN次之,Lassologistic最差;测试集中各模型的准确率、精确率、召回率和F1分数排序与训练集一致。绘制Calibration校准曲线,Xselleck合成GBoost模型较为稳定,在训练集和测试集中表现均较好,BPNN则在训练集中的表现较差,Lasso-logistic在测试集中的表现较差。(3)Lasso-logistic回归模型中的主要变量为糖尿病、蛋白质(PRO)、潜血(BLD)、尿红细胞(URBC)、红细胞、颗粒管型和免疫球蛋白A(Ig A);BPNN模型中特征重要性排名前5的变量为24小时尿蛋白总量(24HUTP)、总蛋白(TP)、BLD、白蛋白(Alb)和直接胆红素(D-Bil);XGBoost模型中特征重要性排名前5的变量为24HUTP、肌钙蛋白Ⅰ(CTn I)、URBC、红细胞分布宽度-SD(RDW-SD)和Alb。其中,24HUTP、Alb和TP三个指标诊断价值较大,其AUC(95%CI)分别为0.720(00.679-0.759)、0.716(0.675-0.754)和0.713(0.672-0.752),灵敏度分别为74.44%、80.45%和68.42%,特异度分别为62.73%、56.69%和68.50%。(4)对确诊为Ig AN的133名患者进行随访,共104Gefitinib核磁人纳入预后研究,中位随访时间为14.00(6.75,26.25)个月,有8人出现不良预后结局,发病密度为54.83/千人年。(5)Ig AN预后研究中,最终纳入17个变量用于构建预后模型。在整体中构建模型并进行效能比较,结果显示,Cox、BPNN和XGBoost模型的AUC(95%CI)分别为0.852(0.760-0.919)、0.921(0.843-0.968)和0.949(0.880-0.984);BPNN的F1分数最高,XGBoost次之;绘制Calibration校准曲线,XGBoost拟合效果最好,BPNN次之。(6)Cox回归模型的主要变量为蛋白尿、N-酰-β-D-氨基葡萄糖苷酶(NAG)、平均动脉压(MAP)、尿素/肌酐(Urea/Crea)和尿酸(UA),BPNN模型中特征重要性排名前5的变量为Urea/Crea、NAG、补体C4(C4)、PA和蛋白尿;XGBoost模型中特征重要性排名前5的变量为C4、蛋白尿、NAG、Urea/Crea和纤维蛋白(原)降解产物(FDP)。其中,蛋白尿、NAG、Urea/Crea、C4、FDP、PA和MAP在预后研究中预测价值较大,其AUC(95%CI)分别为0.849(0.765-0.912),0.820(0.733-0.889)、0.754(0.660-0.833)、0.723(0.626-0.806)、0.715(0.619-0.800)、0.711(0.614-0.796)和0.710(0.613-0.795),灵敏度分别为87.50%、100.00%、87.50%、75.00%、62.50%、62.50%和87.50%,特异度分别为82.29%、73.96%、70.83%、79.17%、73.96%、76.04%和65.62%。结论:(1)本研究在514例肾脏疾病患者中Ig AN的检出率为25.88%,占原发性肾小球疾病的33.76%;在中位随访14个月的104例Ig AN患者中出现预后不良结局的发病密度为54.83/千人年。(2)Ig AN诊断预测研究和预后研究中,XGBoost模型表现均最好,为最优的诊断预测和预后预测模型。(3)24HUTP、Alb和TP在Ig AN的临床诊断中较为敏感,蛋白尿、NAG、Urea/Crea、C4、FDP、PA和MAP在Ig AN预后判断中较为敏感。