• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

层次主题和话题建模。

Hierarchical Theme and Topic Modeling.

出版信息

IEEE Trans Neural Netw Learn Syst. 2016 Mar;27(3):565-78. doi: 10.1109/TNNLS.2015.2414658. Epub 2015 Mar 30.

DOI:10.1109/TNNLS.2015.2414658
PMID:25838529
Abstract

Considering the hierarchical data groupings in text corpus, e.g., words, sentences, and documents, we conduct the structural learning and infer the latent themes and topics for sentences and words from a collection of documents, respectively. The relation between themes and topics under different data groupings is explored through an unsupervised procedure without limiting the number of clusters. A tree stick-breaking process is presented to draw theme proportions for different sentences. We build a hierarchical theme and topic model, which flexibly represents the heterogeneous documents using Bayesian nonparametrics. Thematic sentences and topical words are extracted. In the experiments, the proposed method is evaluated to be effective to build semantic tree structure for sentences and the corresponding words. The superiority of using tree model for selection of expressive sentences for document summarization is illustrated.

摘要

考虑到文本语料库中的层次数据分组,例如单词、句子和文档,我们分别对句子和单词进行结构学习,并从文档集合中推断潜在主题和主题。通过无监督过程探索不同数据分组下主题和主题之间的关系,而不限制聚类的数量。提出了一种树状折断过程来为不同的句子绘制主题比例。我们构建了一个层次主题和主题模型,该模型使用贝叶斯非参数技术灵活地表示异构文档。提取主题句和主题词。在实验中,评估了所提出的方法在为句子和相应单词构建语义树结构方面的有效性。说明了使用树模型选择有表现力的句子进行文档摘要的优越性。

相似文献

1
Hierarchical Theme and Topic Modeling.层次主题和话题建模。
IEEE Trans Neural Netw Learn Syst. 2016 Mar;27(3):565-78. doi: 10.1109/TNNLS.2015.2414658. Epub 2015 Mar 30.
2
Exploring supervised and unsupervised methods to detect topics in biomedical text.探索用于检测生物医学文本主题的监督和无监督方法。
BMC Bioinformatics. 2006 Mar 16;7:140. doi: 10.1186/1471-2105-7-140.
3
[The hierarchical clustering analysis of hyperspectral image based on probabilistic latent semantic analysis].基于概率潜在语义分析的高光谱图像层次聚类分析
Guang Pu Xue Yu Guang Pu Fen Xi. 2011 Sep;31(9):2471-5.
4
An Automatic Multidocument Text Summarization Approach Based on Naïve Bayesian Classifier Using Timestamp Strategy.一种基于朴素贝叶斯分类器并采用时间戳策略的自动多文档文本摘要方法。
ScientificWorldJournal. 2016;2016:1784827. doi: 10.1155/2016/1784827. Epub 2016 Feb 29.
5
Trends in anesthesiology research: a machine learning approach to theme discovery and summarization.麻醉学研究趋势:一种用于主题发现与总结的机器学习方法
JAMIA Open. 2018 Oct;1(2):283-293. doi: 10.1093/jamiaopen/ooy009. Epub 2018 Sep 4.
6
FLDA: Latent Dirichlet Allocation Based Unsteady Flow Analysis.FLDA:基于潜在狄利克雷分配的非定常流分析。
IEEE Trans Vis Comput Graph. 2014 Dec;20(12):2545-54. doi: 10.1109/TVCG.2014.2346416.
7
"Hybrid Topics" - Facilitating the Interpretation of Topics Through the Addition of MeSH Descriptors to Bags of Words.“混合主题”——通过向词袋中添加医学主题词描述符来促进主题解释
Stud Health Technol Inform. 2017;245:662-666.
8
Combining background knowledge and learned topics.结合背景知识和所学主题。
Top Cogn Sci. 2011 Jan;3(1):18-47. doi: 10.1111/j.1756-8765.2010.01097.x. Epub 2010 May 27.
9
Topic-based automatic summarization algorithm for Chinese short text.基于主题的中文短文本自动摘要算法。
Math Biosci Eng. 2020 May 12;17(4):3582-3600. doi: 10.3934/mbe.2020202.
10
Link-topic model for biomedical abbreviation disambiguation.用于生物医学缩写词消歧的链接主题模型
J Biomed Inform. 2015 Feb;53:367-80. doi: 10.1016/j.jbi.2014.12.013. Epub 2014 Dec 30.