• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

寻找科学主题。

Finding scientific topics.

作者信息

Griffiths Thomas L, Steyvers Mark

机构信息

Department of Psychology, Stanford University, Stanford, CA 94305, USA.

出版信息

Proc Natl Acad Sci U S A. 2004 Apr 6;101 Suppl 1(Suppl 1):5228-35. doi: 10.1073/pnas.0307752101. Epub 2004 Feb 10.

DOI:10.1073/pnas.0307752101
PMID:14872004
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC387300/
Abstract

A first step in identifying the content of a document is determining which topics that document addresses. We describe a generative model for documents, introduced by Blei, Ng, and Jordan [Blei, D. M., Ng, A. Y. & Jordan, M. I. (2003) J. Machine Learn. Res. 3, 993-1022], in which each document is generated by choosing a distribution over topics and then choosing each word in the document from a topic selected according to this distribution. We then present a Markov chain Monte Carlo algorithm for inference in this model. We use this algorithm to analyze abstracts from PNAS by using Bayesian model selection to establish the number of topics. We show that the extracted topics capture meaningful structure in the data, consistent with the class designations provided by the authors of the articles, and outline further applications of this analysis, including identifying "hot topics" by examining temporal dynamics and tagging abstracts to illustrate semantic content.

摘要

识别文档内容的第一步是确定该文档涉及哪些主题。我们描述了一种由Blei、Ng和Jordan [Blei, D. M., Ng, A. Y. & Jordan, M. I. (2003) J. Machine Learn. Res. 3, 993 - 1022] 提出的文档生成模型,其中每个文档通过选择主题上的分布,然后根据此分布从所选主题中选择文档中的每个单词来生成。然后,我们提出一种马尔可夫链蒙特卡罗算法用于此模型的推理。我们使用该算法通过贝叶斯模型选择来确定主题数量,从而分析美国国家科学院院刊(PNAS)的摘要。我们表明,提取的主题捕捉到了数据中有意义的结构,与文章作者提供的类别指定一致,并概述了此分析的进一步应用,包括通过检查时间动态来识别“热门话题”以及为摘要添加标签以说明语义内容。

相似文献

1
Finding scientific topics.寻找科学主题。
Proc Natl Acad Sci U S A. 2004 Apr 6;101 Suppl 1(Suppl 1):5228-35. doi: 10.1073/pnas.0307752101. Epub 2004 Feb 10.
2
Mapping topics and topic bursts in PNAS.绘制《美国国家科学院院刊》中的主题及主题爆发情况。
Proc Natl Acad Sci U S A. 2004 Apr 6;101 Suppl 1(Suppl 1):5287-90. doi: 10.1073/pnas.0307626100. Epub 2004 Feb 20.
3
The simultaneous evolution of author and paper networks.作者网络与论文网络的同步演化。
Proc Natl Acad Sci U S A. 2004 Apr 6;101 Suppl 1(Suppl 1):5266-73. doi: 10.1073/pnas.0307625100. Epub 2004 Feb 19.
4
Mixed-membership models of scientific publications.科学出版物的混合成员模型。
Proc Natl Acad Sci U S A. 2004 Apr 6;101 Suppl 1(Suppl 1):5220-7. doi: 10.1073/pnas.0307760101. Epub 2004 Mar 12.
5
Mapping knowledge domains: characterizing PNAS.绘制知识领域:描绘《美国国家科学院院刊》
Proc Natl Acad Sci U S A. 2004 Apr 6;101 Suppl 1(Suppl 1):5192-9. doi: 10.1073/pnas.0307509100. Epub 2004 Feb 12.
6
Scientific publishing. PNAS nixes special privileges for (most) papers.科学出版。《美国国家科学院院刊》取消了(大多数)论文的特殊待遇。
Science. 2009 Sep 18;325(5947):1486-7. doi: 10.1126/science.325_1486b.
7
Link-topic model for biomedical abbreviation disambiguation.用于生物医学缩写词消歧的链接主题模型
J Biomed Inform. 2015 Feb;53:367-80. doi: 10.1016/j.jbi.2014.12.013. Epub 2014 Dec 30.
8
Spatiotemporal Bayesian inference dipole analysis for MEG neuroimaging data.用于脑磁图神经成像数据的时空贝叶斯推理偶极子分析
Neuroimage. 2005 Oct 15;28(1):84-98. doi: 10.1016/j.neuroimage.2005.06.003. Epub 2005 Jul 15.
9
PNAS joins peer-reviewed PubMed Central. Proceedings of the National Academy of Sciences.《美国国家科学院院刊》加入同行评审的美国国立医学图书馆生物医学与健康科学期刊数据库。《美国国家科学院院刊》。
Nature. 1999 Oct 21;401(6755):733. doi: 10.1038/44427.
10
Connecting the latent multinomial.连接潜在多项式。
Biometrics. 2015 Dec;71(4):1070-80. doi: 10.1111/biom.12333. Epub 2015 Jun 1.

引用本文的文献

1
Uncovering the Professional Landscape of Clinical Research Nursing: A Scoping Review with Data Mining Approach.揭示临床研究护理的专业领域:采用数据挖掘方法的范围综述
Nurs Rep. 2025 Jul 24;15(8):266. doi: 10.3390/nursrep15080266.
2
Microbes Under Climate Refugia: Equable Subcommunity Rank Dynamics in Large-River Deltaic Estuaries.气候避难所中的微生物:大河三角洲河口稳定的亚群落等级动态
Ecol Evol. 2025 Aug 15;15(8):e72014. doi: 10.1002/ece3.72014. eCollection 2025 Aug.
3
Scalable topic modelling decodes spatial tissue architecture for large-scale multiplexed imaging analysis.可扩展主题建模为大规模多重成像分析解码空间组织结构。
Nat Commun. 2025 Jul 18;16(1):6619. doi: 10.1038/s41467-025-61821-y.
4
Sentiment analysis and topic modeling of social media data to explore public discourse on irritable bowel syndrome.社交媒体数据的情感分析与主题建模,以探究关于肠易激综合征的公众讨论。
Sci Rep. 2025 Jul 1;15(1):21550. doi: 10.1038/s41598-025-08599-7.
5
A Japanese LDA model for automatic clustering analysis of semantic verbal fluency tests.一种用于语义言语流畅性测试自动聚类分析的日语潜在狄利克雷分配模型。
Behav Res Methods. 2025 Jun 30;57(8):209. doi: 10.3758/s13428-025-02696-1.
6
Toward the Patient Participation Pathway: A Mixed Methods Study of Patients With Cancer and Other Chronic Diseases.迈向患者参与路径:一项针对癌症和其他慢性病患者的混合方法研究。
Cancer Rep (Hoboken). 2025 Jul;8(7):e70258. doi: 10.1002/cnr2.70258.
7
How online public opinion evolves before and after policy adjustments in response to major public health emergencies.重大突发公共卫生事件应对政策调整前后网络舆情的演变
Front Public Health. 2025 Jun 9;13:1438854. doi: 10.3389/fpubh.2025.1438854. eCollection 2025.
8
Virtual reality in undergraduate and postgraduate nursing education: a scoping review protocol integrating data mining for topic discovery.本科及研究生护理教育中的虚拟现实:一项整合数据挖掘以发现主题的范围综述方案
MethodsX. 2025 May 24;14:103391. doi: 10.1016/j.mex.2025.103391. eCollection 2025 Jun.
9
30 years of climate related phenological research: themes and trends.30年的气候相关物候学研究:主题与趋势
Int J Biometeorol. 2025 Jun;69(6):1459-1473. doi: 10.1007/s00484-025-02903-w. Epub 2025 May 12.
10
Concept of digital health literacy revisited: Using text network and topic model analysis.重新审视数字健康素养的概念:运用文本网络和主题模型分析
Digit Health. 2025 May 5;11:20552076251334537. doi: 10.1177/20552076251334537. eCollection 2025 Jan-Dec.

本文引用的文献

1
Stochastic relaxation, gibbs distributions, and the bayesian restoration of images.随机松弛,吉布斯分布,以及贝叶斯图像恢复。
IEEE Trans Pattern Anal Mach Intell. 1984 Jun;6(6):721-41. doi: 10.1109/tpami.1984.4767596.
2
Fundamental theorem of natural selection under gene-culture transmission.基因-文化传递下自然选择的基本定理
Proc Natl Acad Sci U S A. 1991 Jun 1;88(11):4874-6. doi: 10.1073/pnas.88.11.4874.