• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用N元语法语言模型对PubMed用户的行为进行建模。

Modeling Actions of PubMed Users with N-Gram Language Models.

作者信息

Lin Jimmy, Wilbur W John

机构信息

The iSchool, College of Information Studies, University of Maryland, College Park, Maryland, USA,

出版信息

Inf Retr Boston. 2008 Sep 12;12:487-503. doi: 10.1007/s10791-008-9067-7.

DOI:10.1007/s10791-008-9067-7
PMID:19684883
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2727615/
Abstract

Transaction logs from online search engines are valuable for two reasons: First, they provide insight into human information-seeking behavior. Second, log data can be used to train user models, which can then be applied to improve retrieval systems. This article presents a study of logs from PubMed((R)), the public gateway to the MEDLINE((R)) database of bibliographic records from the medical and biomedical primary literature. Unlike most previous studies on general Web search, our work examines user activities with a highly-specialized search engine. We encode user actions as string sequences and model these sequences using n-gram language models. The models are evaluated in terms of perplexity and in a sequence prediction task. They help us better understand how PubMed users search for information and provide an enabler for improving users' search experience.

摘要

在线搜索引擎的交易日志之所以有价值,有两个原因:第一,它们能让我们深入了解人类的信息寻求行为。第二,日志数据可用于训练用户模型,然后将其应用于改进检索系统。本文介绍了一项对PubMed(R)日志的研究,PubMed是获取医学和生物医学原始文献书目记录的MEDLINE(R)数据库的公共网关。与之前大多数关于通用网络搜索的研究不同,我们的工作使用一个高度专业化的搜索引擎来检查用户活动。我们将用户操作编码为字符串序列,并使用n元语法语言模型对这些序列进行建模。这些模型通过困惑度和序列预测任务进行评估。它们帮助我们更好地理解PubMed用户如何搜索信息,并为改善用户的搜索体验提供了一种手段。

相似文献

1
Modeling Actions of PubMed Users with N-Gram Language Models.使用N元语法语言模型对PubMed用户的行为进行建模。
Inf Retr Boston. 2008 Sep 12;12:487-503. doi: 10.1007/s10791-008-9067-7.
2
Understanding PubMed user search behavior through log analysis.通过日志分析了解PubMed用户的搜索行为。
Database (Oxford). 2009;2009:bap018. doi: 10.1093/database/bap018. Epub 2009 Nov 27.
3
Comparing image search behaviour in the ARRS GoldMiner search engine and a clinical PACS/RIS.比较ARRS GoldMiner搜索引擎与临床PACS/RIS中的图像搜索行为。
J Biomed Inform. 2015 Aug;56:57-64. doi: 10.1016/j.jbi.2015.04.013. Epub 2015 May 19.
4
Query log analysis of an electronic health record search engine.电子健康记录搜索引擎的查询日志分析
AMIA Annu Symp Proc. 2011;2011:915-24. Epub 2011 Oct 22.
5
G-Bean: an ontology-graph based web tool for biomedical literature retrieval.G-Bean:基于本体图的生物医学文献检索网络工具。
BMC Bioinformatics. 2014;15 Suppl 12(Suppl 12):S1. doi: 10.1186/1471-2105-15-S12-S1. Epub 2014 Nov 6.
6
Searching for cancer information on the internet: analyzing natural language search queries.在互联网上搜索癌症信息:分析自然语言搜索查询
J Med Internet Res. 2003 Dec 11;5(4):e31. doi: 10.2196/jmir.5.4.e31.
7
Evaluating the Acceptance and Usability of an Independent, Noncommercial Search Engine for Medical Information: Cross-Sectional Questionnaire Study and User Behavior Tracking Analysis.评估一个独立的非商业性医学信息搜索引擎的可接受性和可用性:横断面问卷调查研究及用户行为跟踪分析
JMIR Hum Factors. 2025 Jan 23;12:e56941. doi: 10.2196/56941.
8
The impact of search engine selection and sorting criteria on vaccination beliefs and attitudes: two experiments manipulating Google output.搜索引擎选择和排序标准对疫苗接种观念及态度的影响:两项操纵谷歌搜索结果的实验
J Med Internet Res. 2014 Apr 2;16(4):e100. doi: 10.2196/jmir.2642.
9
Efficacy improvement in searching MEDLINE database using a novel PubMed visual analytic system: EEEvis.利用新型 PubMed 可视化分析系统 EEEvis 提高 MEDLINE 数据库检索的效果。
PLoS One. 2023 Feb 9;18(2):e0281422. doi: 10.1371/journal.pone.0281422. eCollection 2023.
10
Investigating COVID-19-Related query logs of Chinese search engine users.调查中文搜索引擎用户与新冠疫情相关的查询日志。
Proc Assoc Inf Sci Technol. 2020;57(1):e424. doi: 10.1002/pra2.424. Epub 2020 Oct 22.

引用本文的文献

1
Harnessing PubMed User Query Logs for Post Hoc Explanations of Recommended Similar Articles.利用PubMed用户查询日志对推荐的相似文章进行事后解释。
ArXiv. 2024 Feb 5:arXiv:2402.03484v1.
2
How user intelligence is improving PubMed.用户智能如何提升PubMed。
Nat Biotechnol. 2018 Oct 1. doi: 10.1038/nbt.4267.
3
Effects of individual health topic familiarity on activity patterns during health information searches.个体健康主题熟悉度对健康信息搜索活动模式的影响。
JMIR Med Inform. 2015 Mar 17;3(1):e16. doi: 10.2196/medinform.3803.
4
Studying PubMed usages in the field for complex problem solving: Implications for tool design.研究PubMed在复杂问题解决领域的应用:对工具设计的启示。
J Am Soc Inf Sci Technol. 2013 May 1;64(5):874-92. doi: 10.1002/asi.22796.
5
Understanding PubMed user search behavior through log analysis.通过日志分析了解PubMed用户的搜索行为。
Database (Oxford). 2009;2009:bap018. doi: 10.1093/database/bap018. Epub 2009 Nov 27.

本文引用的文献

1
PubMed related articles: a probabilistic topic-based model for content similarity.与PubMed相关的文章:一种基于概率主题的内容相似度模型。
BMC Bioinformatics. 2007 Oct 30;8:423. doi: 10.1186/1471-2105-8-423.
2
A day in the life of PubMed: analysis of a typical day's query log.《医学期刊数据库(PubMed)一天的使用情况:典型一天的查询日志分析》
J Am Med Inform Assoc. 2007 Mar-Apr;14(2):212-20. doi: 10.1197/jamia.M2191. Epub 2007 Jan 9.
3
Measuring use patterns of online journals and databases.衡量在线期刊和数据库的使用模式。
J Med Libr Assoc. 2003 Apr;91(2):231-40.
4
GRATEFUL MED: a tool for studying searching behavior.GRATEFUL MED:一种用于研究搜索行为的工具。
Med Ref Serv Q. 1989 Winter;8(4):61-79. doi: 10.1300/J115v08n01_07.
5
Developing optimal search strategies for detecting clinically sound studies in MEDLINE.制定用于在医学文献数据库(MEDLINE)中检索临床合理研究的最佳检索策略。
J Am Med Inform Assoc. 1994 Nov-Dec;1(6):447-58. doi: 10.1136/jamia.1994.95153434.
6
PaperChase. Self-service bibliographic retrieval.文献追踪。自助式文献检索。
JAMA. 1983 Nov 11;250(18):2494-9. doi: 10.1001/jama.250.18.2494.