您所在的位置: 首页 >>新闻中心 >>医院新闻

医院新闻

骨病中心五部团队发布大语言模型与机器学习在经皮后凸成形术后并发症预测中的性能比较研究成果

发布时间:2026-04-22 浏览次数:
字号: + -

  近日,北京朝阳医院骨科疾病诊疗中心学科主任藏磊作为单一通讯作者,博士王天艺,硕士陈睿源、梁明辉为同一单位共同第一作者开展了大语言模型(LLMs)与机器学习在经皮后凸成形术后并发症预测中的性能比较研究,相关成果发表于Nature旗下数字医学权威期刊npj Digital Medicine(影响因子IF=15.1)。该研究首次系统评估了GPT-5、DeepSeek R1等前沿LLMs在预测骨水泥渗漏和新发椎体骨折方面的能力,并与传统机器学习模型及脊柱外科医生进行了头对头对比。

1.jpg

期刊截图

  骨质疏松性椎体压缩骨折(OVCF)是全球50岁以上人群中最常见的骨质疏松性骨折,患病率高达30%-50%。经皮后凸成形术(PKP)是治疗OVCF的有效手段,但术后骨水泥渗漏(BCL)和新发椎体骨折(NVF)这两种并发症发生率较高,严重影响患者预后。尽管传统机器学习(TML)模型已在此类并发症预测领域取得一定进展,但仍存在诸多不足。近期,迅猛发展的LLMs在该领域的表现尚未得到系统评估,其能否凭借强大的文本理解与推理能力,超越数据驱动的传统模型,藏磊团队的这项研究对此展开了系统对比与探索。

  研究团队基于北京朝阳医院2016年至2024年的回顾性与前瞻性数据,研究结果显示,当前主流LLMs在预测PKP术后并发症方面表现出“任务依赖性”——对骨水泥渗漏的预测性能可接受,但对新发椎体骨折的预测能力仍显著落后于传统机器学习模型。LLMs的临床决策支持价值高度依赖于其在该任务上的基础准确性。少样本提示策略虽能使模型更为审慎,但总体性能提升有限。现阶段LLMs尚不适合独立应用于此类预后预测任务,未来需通过领域微调、多模态融合(整合影像数据)及串联传统深度学习模型等策略进一步提升。该研究为理解大语言模型在骨科这一专业医疗领域的预测性能、局限性及未来改进方向,提供了重要的初步证据。

  骨病中心五部