• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于患者图谱分析和机器学习构建用于鼻咽癌筛查的实用风险预测模型。

Building Practical Risk Prediction Models for Nasopharyngeal Carcinoma Screening with Patient Graph Analysis and Machine Learning.

机构信息

Guilin Medical University, Guilin, Guangxi, China.

West China Hospital, Chengdu, Sichuan, China.

出版信息

Cancer Epidemiol Biomarkers Prev. 2023 Feb 6;32(2):274-280. doi: 10.1158/1055-9965.EPI-22-0792.

DOI:10.1158/1055-9965.EPI-22-0792
PMID:36480263
Abstract

BACKGROUND

To expand nasopharyngeal carcinoma (NPC) screening to larger populations, more practical NPC risk prediction models independent of Epstein-Barr virus (EBV) and other lab tests are necessary.

METHODS

Patient data before diagnosis of NPC were collected from hospital electronic medical records (EMR) and used to develop machine learning (ML) models for NPC risk prediction using XGBoost. NPC risk factor distributions were generated through connection delta ratio (CDR) analysis of patient graphs. By combining EMR-wide ML with patient graph analysis, the number of variables in these risk models was reduced, allowing for more practical NPC risk prediction ML models.

RESULTS

Using data collected from 1,357 patients with NPC and 1,448 patients with control, an optimal set of 100 variables (ov100) was determined for building NPC risk prediction ML models that had, the following performance metrics: 0.93-0.96 recall, 0.80-0.92 precision, and 0.83-0.94 AUC. Aided by the analysis of top CDR-ranked risk factors, the models were further refined to contain only 20 practical variables (pv20), excluding EBV. The pv20 NPC risk XGBoost model achieved 0.79 recall, 0.94 precision, 0.96 specificity, and 0.87 AUC.

CONCLUSIONS

This study demonstrated the feasibility of developing practical NPC risk prediction models using EMR-wide ML and patient graph CDR analysis, without requiring EBV data. These models could enable broader implementation of NPC risk evaluation and screening recommendations for larger populations in urban community health centers and rural clinics.

IMPACT

These more practical NPC risk models could help increase NPC screening rate and identify more patients with early-stage NPC.

摘要

背景

为了将鼻咽癌(NPC)筛查扩大到更大的人群,有必要建立更多实用的、不依赖于 EBV 及其他实验室检测的 NPC 风险预测模型。

方法

从医院电子病历(EMR)中收集 NPC 患者确诊前的临床数据,通过 XGBoost 建立 NPC 风险预测机器学习(ML)模型。通过患者图谱的连接差异比(CDR)分析,生成 NPC 风险因素分布。通过将 EMR 范围的 ML 与患者图谱分析相结合,减少了这些风险模型中的变量数量,从而建立了更实用的 NPC 风险预测 ML 模型。

结果

使用 1357 例 NPC 患者和 1448 例对照患者的数据,确定了一个最佳的 100 个变量集(ov100),用于构建 NPC 风险预测 ML 模型,这些模型的性能指标如下:召回率为 0.93-0.96,精准率为 0.80-0.92,AUC 为 0.83-0.94。通过对排名靠前的 CDR 风险因素的分析,进一步将模型细化,仅包含 20 个实用变量(pv20),不包括 EBV。pv20 NPC 风险 XGBoost 模型的召回率为 0.79,精准率为 0.94,特异性为 0.96,AUC 为 0.87。

结论

本研究证明了使用 EMR 范围的 ML 和患者图谱 CDR 分析开发实用的 NPC 风险预测模型的可行性,而无需 EBV 数据。这些模型可在城市社区卫生中心和农村诊所为更大的人群实施 NPC 风险评估和筛查建议提供依据。

意义

这些更实用的 NPC 风险模型可以帮助提高 NPC 筛查率,识别更多早期 NPC 患者。

相似文献

1
Building Practical Risk Prediction Models for Nasopharyngeal Carcinoma Screening with Patient Graph Analysis and Machine Learning.基于患者图谱分析和机器学习构建用于鼻咽癌筛查的实用风险预测模型。
Cancer Epidemiol Biomarkers Prev. 2023 Feb 6;32(2):274-280. doi: 10.1158/1055-9965.EPI-22-0792.
2
Multiplex Epstein-Barr virus BALF2 genotyping detects high-risk variants in plasma for population screening of nasopharyngeal carcinoma.多重 Epstein-Barr 病毒 BALF2 基因分型可在血浆中检测到高危变异体,用于鼻咽癌的人群筛查。
Mol Cancer. 2022 Jul 28;21(1):154. doi: 10.1186/s12943-022-01625-6.
3
Comparison of Epstein-Barr Virus Serological Tools for the Screening and Risk Assessment of Nasopharyngeal Carcinoma: a Large Population-based Study.用于鼻咽癌筛查和风险评估的 Epstein-Barr 病毒血清学工具的比较:一项大型基于人群的研究。
Pathol Oncol Res. 2020 Oct;26(4):2185-2190. doi: 10.1007/s12253-020-00808-0. Epub 2020 Mar 28.
4
Detection of methylation status of Epstein-Barr virus DNA C promoter in the diagnosis of nasopharyngeal carcinoma.检测 Epstein-Barr 病毒 DNA C 启动子的甲基化状态在鼻咽癌诊断中的应用。
Cancer Sci. 2020 Feb;111(2):592-600. doi: 10.1111/cas.14281. Epub 2020 Feb 5.
5
Exosomal cyclophilin A as a novel noninvasive biomarker for Epstein-Barr virus associated nasopharyngeal carcinoma.外泌体亲环素 A 作为一种新型的非侵入性生物标志物用于 EBV 相关鼻咽癌。
Cancer Med. 2019 Jun;8(6):3142-3151. doi: 10.1002/cam4.2185. Epub 2019 May 7.
6
A Randomized Controlled Trial on Evaluation of Plasma Epstein-Barr Virus Biomarker for Early Diagnosis in Patients With Nasopharyngeal Carcinoma.一项评估血浆 Epstein-Barr 病毒标志物用于鼻咽癌患者早期诊断的随机对照试验。
Adv Ther. 2020 Oct;37(10):4280-4290. doi: 10.1007/s12325-020-01461-4. Epub 2020 Aug 11.
7
A comparison of EBV serology and serum cell-free DNA as screening tools for nasopharyngeal cancer: Results of the Singapore NPC screening cohort.EBV 血清学与血清游离细胞 DNA 作为鼻咽癌筛查工具的比较:新加坡鼻咽癌筛查队列研究结果。
Int J Cancer. 2020 May 15;146(10):2923-2931. doi: 10.1002/ijc.32774. Epub 2020 Jan 8.
8
Complementary determination of Epstein-Barr virus DNA load and serum markers for nasopharyngeal carcinoma screening and early detection in individuals at risk in Tunisia.在突尼斯,对高危人群进行鼻咽癌筛查和早期检测时,互补性地测定 Epstein-Barr 病毒 DNA 载量和血清标志物。
Eur Arch Otorhinolaryngol. 2012 Mar;269(3):1005-11. doi: 10.1007/s00405-011-1717-5. Epub 2011 Jul 30.
9
Sequencing Analysis of Plasma Epstein-Barr Virus DNA Reveals Nasopharyngeal Carcinoma-Associated Single Nucleotide Variant Profiles.血浆 Epstein-Barr 病毒 DNA 测序分析揭示与鼻咽癌相关的单核苷酸变异特征。
Clin Chem. 2020 Apr 1;66(4):598-605. doi: 10.1093/clinchem/hvaa027.
10
Identification of a Novel, EBV-Based Antibody Risk Stratification Signature for Early Detection of Nasopharyngeal Carcinoma in Taiwan.鉴定新型 EBV 相关抗体风险分层标志物,用于早期检测台湾地区的鼻咽癌。
Clin Cancer Res. 2018 Mar 15;24(6):1305-1314. doi: 10.1158/1078-0432.CCR-17-1929. Epub 2018 Jan 4.

引用本文的文献

1
Development of transient ischemic attack risk prediction model suitable for initializing a learning health system unit using electronic medical records.开发适用于使用电子病历初始化学习健康系统单元的短暂性脑缺血发作风险预测模型。
BMC Med Inform Decis Mak. 2024 Dec 18;24(1):392. doi: 10.1186/s12911-024-02767-x.
2
Development of Lung Cancer Risk Prediction Machine Learning Models for Equitable Learning Health System: Retrospective Study.用于公平学习健康系统的肺癌风险预测机器学习模型的开发:回顾性研究
JMIR AI. 2024 Sep 11;3:e56590. doi: 10.2196/56590.
3
Early detection of nasopharyngeal carcinoma through machine-learning-driven prediction model in a population-based healthcare record database.
基于人群医疗记录数据库的机器学习驱动预测模型进行鼻咽癌的早期检测。
Cancer Med. 2024 Apr;13(7):e7144. doi: 10.1002/cam4.7144.