• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过主题对齐对计数数据进行多尺度分析。

Multiscale analysis of count data through topic alignment.

作者信息

Fukuyama Julia, Sankaran Kris, Symul Laura

机构信息

Department of Statistics, Indiana University Bloomington, 919 E 10th Street, Bloomington, IN 47408, USA.

Department of Statistics, University of Wisconsin - Madison, 1300 University Ave, Madison, WI 53706, USA.

出版信息

Biostatistics. 2023 Oct 18;24(4):1045-1065. doi: 10.1093/biostatistics/kxac018.

DOI:10.1093/biostatistics/kxac018
PMID:35657012
Abstract

Topic modeling is a popular method used to describe biological count data. With topic models, the user must specify the number of topics $K$. Since there is no definitive way to choose $K$ and since a true value might not exist, we develop a method, which we call topic alignment, to study the relationships across models with different $K$. In addition, we present three diagnostics based on the alignment. These techniques can show how many topics are consistently present across different models, if a topic is only transiently present, or if a topic splits into more topics when $K$ increases. This strategy gives more insight into the process of generating the data than choosing a single value of $K$ would. We design a visual representation of these cross-model relationships, show the effectiveness of these tools for interpreting the topics on simulated and real data, and release an accompanying R package, alto.

摘要

主题建模是一种用于描述生物计数数据的常用方法。使用主题模型时,用户必须指定主题数量(K)。由于没有确定的方法来选择(K),而且可能不存在真实值,我们开发了一种方法,称为主题对齐,用于研究不同(K)值的模型之间的关系。此外,我们基于这种对齐方式提出了三种诊断方法。这些技术可以显示在不同模型中始终存在的主题数量、某个主题是否只是短暂出现,或者当(K)增加时一个主题是否会分裂成更多主题。与选择单一的(K)值相比,这种策略能让我们更深入地了解数据生成过程。我们设计了这些跨模型关系的可视化表示,展示了这些工具在解释模拟数据和真实数据主题方面的有效性,并发布了一个配套的R包alto。

相似文献

1
Multiscale analysis of count data through topic alignment.通过主题对齐对计数数据进行多尺度分析。
Biostatistics. 2023 Oct 18;24(4):1045-1065. doi: 10.1093/biostatistics/kxac018.
2
Multi-grained alignment method based on stable topics in cross-social networks.跨社交网络中基于稳定主题的多粒度对齐方法
PeerJ Comput Sci. 2024 Feb 28;10:e1892. doi: 10.7717/peerj-cs.1892. eCollection 2024.
3
Using topic-noise models to generate domain-specific topics across data sources.使用主题-噪声模型跨数据源生成特定领域的主题。
Knowl Inf Syst. 2023;65(5):2159-2186. doi: 10.1007/s10115-022-01805-2. Epub 2023 Jan 16.
4
Characterizing Twitter Discussions About HPV Vaccines Using Topic Modeling and Community Detection.使用主题建模和社区检测来刻画关于HPV疫苗的推特讨论。
J Med Internet Res. 2016 Aug 29;18(8):e232. doi: 10.2196/jmir.6045.
5
Response to letter to the editor from Dr Rahman Shiri: The challenging topic of suicide across occupational groups.回复拉赫曼·希里博士的来信:职业群体中的自杀这一具有挑战性的话题。
Scand J Work Environ Health. 2018 Jan 1;44(1):108-110. doi: 10.5271/sjweh.3698. Epub 2017 Dec 8.
6
Improved Parsimonious Topic Modeling Based on the Bayesian Information Criterion.基于贝叶斯信息准则的改进简约主题模型
Entropy (Basel). 2020 Mar 12;22(3):326. doi: 10.3390/e22030326.
7
The future of Cochrane Neonatal.考克兰新生儿协作网的未来。
Early Hum Dev. 2020 Nov;150:105191. doi: 10.1016/j.earlhumdev.2020.105191. Epub 2020 Sep 12.
8
GoM DE: interpreting structure in sequence count data with differential expression analysis allowing for grades of membership.等级隶属度的差异表达分析在序列计数数据中解释结构的等级隶属度差异表达分析方法
bioRxiv. 2023 Sep 14:2023.03.03.531029. doi: 10.1101/2023.03.03.531029.
9
Investigating the Efficient Use of Word Embedding with Neural-Topic Models for Interpretable Topics from Short Texts.研究基于神经主题模型的词向量有效利用,以实现短文本的可解释主题。
Sensors (Basel). 2022 Jan 23;22(3):852. doi: 10.3390/s22030852.
10
A heuristic approach to determine an appropriate number of topics in topic modeling.一种用于确定主题建模中合适主题数量的启发式方法。
BMC Bioinformatics. 2015;16 Suppl 13(Suppl 13):S8. doi: 10.1186/1471-2105-16-S13-S8. Epub 2015 Sep 25.

引用本文的文献

1
Microbiota effects and predictors of s colonization after treatment with a vaginal live biotherapeutic: results from a randomized, double-blinded, placebo-controlled trial.阴道用活生物疗法治疗后微生物群的影响及s定植的预测因素:一项随机、双盲、安慰剂对照试验的结果
medRxiv. 2025 Aug 30:2025.08.18.25333897. doi: 10.1101/2025.08.18.25333897.
2
The role of the oral microbiota in the causal effect of adjunctive antibiotics on clinical outcomes in stage III-IV periodontitis patients.口腔微生物群在辅助抗生素对 III-IV 期牙周炎患者临床结局的因果效应中的作用。
Microbiome. 2024 Oct 26;12(1):220. doi: 10.1186/s40168-024-01945-3.
3
Sub-communities of the vaginal microbiota in pregnant and non-pregnant women.
孕妇和非孕妇阴道微生物群的亚群。
Proc Biol Sci. 2023 Nov 29;290(2011):20231461. doi: 10.1098/rspb.2023.1461.
4
Microbiome subcommunity learning with logistic-tree normal latent Dirichlet allocation.基于逻辑树正态潜在狄利克雷分配的微生物亚群落学习。
Biometrics. 2023 Sep;79(3):2321-2332. doi: 10.1111/biom.13772. Epub 2022 Oct 28.