• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用主题模型发现诊断组之间的关联。

Discovering associations among diagnosis groups using topic modeling.

作者信息

Li Ding Cheng, Thermeau Terry, Chute Christopher, Liu Hongfang

机构信息

Mayo Clinic, Rochester, MN 55901, USA.

出版信息

AMIA Jt Summits Transl Sci Proc. 2014 Apr 7;2014:43-9. eCollection 2014.

PMID:25954576
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4419765/
Abstract

With the rapid growth of electronic medical records (EMR), there is an increasing need of automatically extract patterns or rules from EMR data with machine learning and data mining technqiues. In this work, we applied unsupervised statistical model, latent Dirichlet allocations (LDA), to cluster patient diagnoics groups from Rochester Epidemiology Projects (REP). The initial results show that LDA holds the potential for broad application in epidemiogloy as well as other biomedical studies due to its unsupervised nature and great interpretive power.

摘要

随着电子病历(EMR)的迅速增长,利用机器学习和数据挖掘技术从EMR数据中自动提取模式或规则的需求日益增加。在这项工作中,我们应用无监督统计模型——潜在狄利克雷分配(LDA),对罗切斯特流行病学项目(REP)中的患者诊断组进行聚类。初步结果表明,由于其无监督性质和强大的解释能力,LDA在流行病学以及其他生物医学研究中具有广泛应用的潜力。

相似文献

1
Discovering associations among diagnosis groups using topic modeling.使用主题模型发现诊断组之间的关联。
AMIA Jt Summits Transl Sci Proc. 2014 Apr 7;2014:43-9. eCollection 2014.
2
Unsupervised machine learning for the discovery of latent disease clusters and patient subgroups using electronic health records.使用电子健康记录进行无监督机器学习以发现潜在疾病集群和患者亚组。
J Biomed Inform. 2020 Feb;102:103364. doi: 10.1016/j.jbi.2019.103364. Epub 2019 Dec 28.
3
An integrated clustering and BERT framework for improved topic modeling.一种用于改进主题建模的集成聚类和BERT框架。
Int J Inf Technol. 2023;15(4):2187-2195. doi: 10.1007/s41870-023-01268-w. Epub 2023 May 6.
4
Mining FDA drug labels using an unsupervised learning technique--topic modeling.利用无监督学习技术——主题建模挖掘 FDA 药物标签。
BMC Bioinformatics. 2011 Oct 18;12 Suppl 10(Suppl 10):S11. doi: 10.1186/1471-2105-12-S10-S11.
5
Results and Methodological Implications of the Digital Epidemiology of Prescription Drug References Among Twitter Users: Latent Dirichlet Allocation (LDA) Analyses.社交媒体中文药物信息的数字流行病学研究结果与方法学启示:潜在狄利克雷分配模型(LDA)分析。
J Med Internet Res. 2023 Jul 28;25:e48405. doi: 10.2196/48405.
6
Assessing the Heterogeneity of Complaints Related to Tinnitus and Hyperacusis from an Unsupervised Machine Learning Approach: An Exploratory Study.基于无监督机器学习方法评估耳鸣和听觉过敏相关主诉的异质性:一项探索性研究。
Audiol Neurootol. 2020;25(4):174-189. doi: 10.1159/000504741. Epub 2020 Feb 14.
7
Evaluation of clustering and topic modeling methods over health-related tweets and emails.健康相关推文和电子邮件的聚类和主题建模方法评估。
Artif Intell Med. 2021 Jul;117:102096. doi: 10.1016/j.artmed.2021.102096. Epub 2021 May 7.
8
Cardiology record multi-label classification using latent Dirichlet allocation.使用潜在狄利克雷分配进行心脏病学记录的多标签分类。
Comput Methods Programs Biomed. 2018 Oct;164:111-119. doi: 10.1016/j.cmpb.2018.07.002. Epub 2018 Jul 17.
9
Identifying Medication-Related Intents From a Bidirectional Text Messaging Platform for Hypertension Management Using an Unsupervised Learning Approach: Retrospective Observational Pilot Study.利用无监督学习方法从双向短信平台识别高血压管理相关药物意向:回顾性观察性试点研究。
J Med Internet Res. 2022 Jun 29;24(6):e36151. doi: 10.2196/36151.
10
Supporting systematic reviews using LDA-based document representations.使用基于潜在狄利克雷分配(LDA)的文档表示法支持系统评价。
Syst Rev. 2015 Nov 26;4:172. doi: 10.1186/s13643-015-0117-0.

引用本文的文献

1
Identifying Comorbidity Patterns in People with and without Alzheimer's Disease Using Latent Dirichlet Allocation.使用潜在狄利克雷分配法识别阿尔茨海默病患者和非阿尔茨海默病患者的共病模式。
J Alzheimers Dis. 2024;101(4):1393-1403. doi: 10.3233/JAD-240490.
2
Integrating unsupervised and supervised learning techniques to predict traumatic brain injury: A population-based study.整合无监督和监督学习技术以预测创伤性脑损伤:一项基于人群的研究。
Intell Based Med. 2023;8. doi: 10.1016/j.ibmed.2023.100118. Epub 2023 Nov 8.
3
Towards a practical use of text mining approaches in electrodiagnostic data.朝着在电诊断数据中文本挖掘方法的实际应用迈进。
Sci Rep. 2023 Nov 9;13(1):19483. doi: 10.1038/s41598-023-45758-0.
4
Methodologically grounded semantic analysis of large volume of chilean medical literature data applied to the analysis of medical research funding efficiency in Chile.基于方法学的智利大量医学文献数据语义分析应用于智利医学研究经费效率分析。
J Biomed Semantics. 2020 Sep 29;11(1):12. doi: 10.1186/s13326-020-00226-w.
5
A Multiview Model for Detecting the Inappropriate Use of Prescription Medication: Machine Learning Approach.一种用于检测处方药不当使用的多视图模型:机器学习方法。
JMIR Med Inform. 2020 Jul 6;8(7):e16312. doi: 10.2196/16312.
6
Unsupervised machine learning for the discovery of latent disease clusters and patient subgroups using electronic health records.使用电子健康记录进行无监督机器学习以发现潜在疾病集群和患者亚组。
J Biomed Inform. 2020 Feb;102:103364. doi: 10.1016/j.jbi.2019.103364. Epub 2019 Dec 28.
7
Co-occurrence of medical conditions: Exposing patterns through probabilistic topic modeling of snomed codes.医疗条件共现:通过 SNOMED 编码的概率主题建模揭示模式。
J Biomed Inform. 2018 Jun;82:31-40. doi: 10.1016/j.jbi.2018.04.008. Epub 2018 Apr 12.
8
A Text-Mining Framework for Supporting Systematic Reviews.一个支持系统评价的文本挖掘框架。
Am J Inf Manag. 2016 Nov;1(1):1-9. Epub 2016 Aug 31.

本文引用的文献

1
Data resource profile: the Rochester Epidemiology Project (REP) medical records-linkage system.数据资源简介:罗切斯特流行病学项目(REP)医疗记录链接系统。
Int J Epidemiol. 2012 Dec;41(6):1614-24. doi: 10.1093/ije/dys195. Epub 2012 Nov 18.
2
Investigating drug repositioning opportunities in FDA drug labels through topic modeling.通过主题建模研究 FDA 药物标签中的药物重新定位机会。
BMC Bioinformatics. 2012;13 Suppl 15(Suppl 15):S6. doi: 10.1186/1471-2105-13-S15-S6. Epub 2012 Sep 11.
3
A LDA-based approach to promoting ranking diversity for genomics information retrieval.基于 LDA 的方法提高基因组信息检索的排名多样性。
BMC Genomics. 2012 Jun 11;13 Suppl 3(Suppl 3):S2. doi: 10.1186/1471-2164-13-S3-S2.
4
Generalizability of epidemiological findings and public health decisions: an illustration from the Rochester Epidemiology Project.流行病学研究结果和公共卫生决策的可推广性:罗切斯特流行病学项目的一个实例。
Mayo Clin Proc. 2012 Feb;87(2):151-60. doi: 10.1016/j.mayocp.2011.11.009.
5
Mining FDA drug labels using an unsupervised learning technique--topic modeling.利用无监督学习技术——主题建模挖掘 FDA 药物标签。
BMC Bioinformatics. 2011 Oct 18;12 Suppl 10(Suppl 10):S11. doi: 10.1186/1471-2105-12-S10-S11.
6
Finding complex biological relationships in recent PubMed articles using Bio-LDA.利用 Bio-LDA 在最近的 PubMed 文章中发现复杂的生物学关系。
PLoS One. 2011 Mar 23;6(3):e17243. doi: 10.1371/journal.pone.0017243.
7
Use of a medical records linkage system to enumerate a dynamic population over time: the Rochester epidemiology project.利用病历链接系统对动态人群进行随时间的计数:罗切斯特流行病学项目。
Am J Epidemiol. 2011 May 1;173(9):1059-68. doi: 10.1093/aje/kwq482. Epub 2011 Mar 23.
8
A comparative analysis of retrieval features used in the TREC 2006 Genomics Track passage retrieval task.2006年TREC基因组学跟踪段落检索任务中使用的检索特征的比较分析。
AMIA Annu Symp Proc. 2007 Oct 11;2007:620-4.
9
Human disease classification in the postgenomic era: a complex systems approach to human pathobiology.后基因组时代的人类疾病分类:人类病理生物学的复杂系统方法
Mol Syst Biol. 2007;3:124. doi: 10.1038/msb4100163. Epub 2007 Jul 10.
10
Early prediction of drug metabolism and toxicity: systems biology approach and modeling.药物代谢与毒性的早期预测:系统生物学方法与建模
Drug Discov Today. 2004 Feb 1;9(3):127-35. doi: 10.1016/S1359-6446(03)02971-4.