• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于记录链接的缩放方法。

A scaling approach to record linkage.

作者信息

Goldstein Harvey, Harron Katie, Cortina-Borja Mario

机构信息

University of Bristol, Bristol, U.K.

University College London, London, U.K.

出版信息

Stat Med. 2017 Jul 20;36(16):2514-2521. doi: 10.1002/sim.7287. Epub 2017 Mar 16.

DOI:10.1002/sim.7287
PMID:28303597
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6205620/
Abstract

With increasing availability of large datasets derived from administrative and other sources, there is an increasing demand for the successful linking of these to provide rich sources of data for further analysis. Variation in the quality of identifiers used to carry out linkage means that existing approaches are often based upon 'probabilistic' models, which are based on a number of assumptions, and can make heavy computational demands. In this paper, we suggest a new approach to classifying record pairs in linkage, based upon weights (scores) derived using a scaling algorithm. The proposed method does not rely on training data, is computationally fast, requires only moderate amounts of storage and has intuitive appeal. Copyright © 2017 John Wiley & Sons, Ltd.

摘要

随着从行政及其他来源获得的大型数据集越来越多,人们对成功链接这些数据集以提供丰富数据来源用于进一步分析的需求也日益增加。用于进行链接的标识符质量存在差异,这意味着现有方法通常基于“概率”模型,这些模型基于一些假设,并且可能需要大量计算。在本文中,我们提出了一种基于使用缩放算法得出的权重(分数)对链接中的记录对进行分类的新方法。所提出的方法不依赖训练数据,计算速度快,只需要适度的存储量,并且具有直观的吸引力。版权所有© 2017约翰·威利父子有限公司。

相似文献

1
A scaling approach to record linkage.一种用于记录链接的缩放方法。
Stat Med. 2017 Jul 20;36(16):2514-2521. doi: 10.1002/sim.7287. Epub 2017 Mar 16.
2
Comparing record linkage software programs and algorithms using real-world data.使用真实世界的数据比较记录链接软件程序和算法。
PLoS One. 2019 Sep 24;14(9):e0221459. doi: 10.1371/journal.pone.0221459. eCollection 2019.
3
Utilising identifier error variation in linkage of large administrative data sources.利用大型行政数据源链接中的标识符错误变异。
BMC Med Res Methodol. 2017 Feb 7;17(1):23. doi: 10.1186/s12874-017-0306-8.
4
A new computationally efficient algorithm for record linkage with field dependency and missing data imputation.一种新的具有字段依赖性和缺失数据插补功能的计算效率高的记录链接算法。
Int J Med Inform. 2018 Jan;109:70-75. doi: 10.1016/j.ijmedinf.2017.10.021. Epub 2017 Nov 6.
5
A mixture model for the analysis of data derived from record linkage.一种用于分析记录链接所获数据的混合模型。
Stat Med. 2015 Jan 15;34(1):74-92. doi: 10.1002/sim.6315. Epub 2014 Oct 2.
6
Probabilistic record linkage.概率性记录链接
Int J Epidemiol. 2016 Jun;45(3):954-64. doi: 10.1093/ije/dyv322. Epub 2015 Dec 20.
7
An empiric modification to the probabilistic record linkage algorithm using frequency-based weight scaling.基于频率的权重缩放的概率记录链接算法的经验修正。
J Am Med Inform Assoc. 2009 Sep-Oct;16(5):738-45. doi: 10.1197/jamia.M3186. Epub 2009 Jun 30.
8
Record linkage: making the most out of errors in linking variables.记录链接:充分利用链接变量中的错误。
AMIA Annu Symp Proc. 2006;2006:779-83.
9
[Reclink: an application for database linkage implementing the probabilistic record linkage method].[Reclink:一种用于数据库链接的应用程序,实施概率性记录链接方法]
Cad Saude Publica. 2000 Apr-Jun;16(2):439-47. doi: 10.1590/s0102-311x2000000200014.
10
Probabilistic linkage without personal information successfully linked national clinical datasets.无需个人信息的概率链接成功链接了国家临床数据集。
J Clin Epidemiol. 2021 Aug;136:136-145. doi: 10.1016/j.jclinepi.2021.04.015. Epub 2021 Apr 28.

引用本文的文献

1
Synthetic data in health care: A narrative review.医疗保健中的合成数据:一篇叙述性综述。
PLOS Digit Health. 2023 Jan 6;2(1):e0000082. doi: 10.1371/journal.pdig.0000082. eCollection 2023 Jan.
2
A Bayesian MultiLayer Record Linkage Procedure to Analyze Post-Acute Care Recovery of Patients with Traumatic Brain Injury.贝叶斯多层记录链接程序分析创伤性脑损伤患者康复后的护理情况。
Biostatistics. 2023 Jul 14;24(3):743-759. doi: 10.1093/biostatistics/kxac016.
3
Linkage of Hospital Records and Death Certificates by a Search Engine and Machine Learning.通过搜索引擎和机器学习实现医院记录与死亡证明的关联
JAMIA Open. 2021 Mar 1;4(1):ooab005. doi: 10.1093/jamiaopen/ooab005. eCollection 2021 Jan.
4
Assessing data linkage quality in cohort studies.评估队列研究中的数据链接质量。
Ann Hum Biol. 2020 Mar;47(2):218-226. doi: 10.1080/03014460.2020.1742379.
5
Demystifying probabilistic linkage: Common myths and misconceptions.揭开概率关联的神秘面纱:常见的误解与错误观念。
Int J Popul Data Sci. 2018 Jan 10;3(1):410. doi: 10.23889/ijpds.v3i1.410.
6
On the Accuracy and Scalability of Probabilistic Data Linkage Over the Brazilian 114 Million Cohort.基于巴西 1.14 亿队列的概率数据链接的准确性和可扩展性研究
IEEE J Biomed Health Inform. 2018 Mar;22(2):346-353. doi: 10.1109/JBHI.2018.2796941.
7
A guide to evaluating linkage quality for the analysis of linked data.用于分析关联数据的链接质量评估指南。
Int J Epidemiol. 2017 Oct 1;46(5):1699-1710. doi: 10.1093/ije/dyx177.

本文引用的文献

1
Multifile Partitioning for Record Linkage and Duplicate Detection.用于记录链接和重复检测的多文件分区
J Am Stat Assoc. 2023;118(543):1786-1795. doi: 10.1080/01621459.2021.2013242. Epub 2022 Jan 28.
2
Linkage, evaluation and analysis of national electronic healthcare data: application to providing enhanced blood-stream infection surveillance in paediatric intensive care.国家电子医疗数据的关联、评估与分析:在儿科重症监护中用于加强血流感染监测的应用
PLoS One. 2013 Dec 20;8(12):e85278. doi: 10.1371/journal.pone.0085278. eCollection 2013.
3
The analysis of record-linked data using multiple imputation with data value priors.使用带有数据值先验的多重插补对记录链接数据进行分析。
Stat Med. 2012 Dec 10;31(28):3481-93. doi: 10.1002/sim.5508. Epub 2012 Jul 17.
4
Ignoring dependency between linking variables and its impact on the outcome of probabilistic record linkage studies.忽略链接变量之间的依赖性及其对概率记录链接研究结果的影响。
J Am Med Inform Assoc. 2008 Sep-Oct;15(5):654-60. doi: 10.1197/jamia.M2265. Epub 2008 Jun 25.
5
Record linkage: statistical models for matching computer records.记录链接:用于匹配计算机记录的统计模型。
J R Stat Soc Ser A Stat Soc. 1990;153(3):287-320.