• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于姓名的人口统计推断与错误识别的不平等分布。

Name-based demographic inference and the unequal distribution of misrecognition.

机构信息

Department of Sociology, University of Chicago, Chicago, IL, USA.

Department of Sociology, Santa Clara University, Santa Clara, CA, USA.

出版信息

Nat Hum Behav. 2023 Jul;7(7):1084-1095. doi: 10.1038/s41562-023-01587-9. Epub 2023 Apr 17.

DOI:10.1038/s41562-023-01587-9
PMID:37069295
Abstract

Academics and companies increasingly draw on large datasets to understand the social world, and name-based demographic ascription tools are widespread for imputing information that is often missing from these large datasets. These approaches have drawn criticism on ethical, empirical and theoretical grounds. Using a survey of all authors listed on articles in sociology, economics and communication journals in Web of Science between 2015 and 2020, we compared self-identified demographics with name-based imputations of gender and race/ethnicity for 19,924 scholars across four gender ascription tools and four race/ethnicity ascription tools. We found substantial inequalities in how these tools misgender and misrecognize the race/ethnicity of authors, distributing erroneous ascriptions unevenly among other demographic traits. Because of the empirical and ethical consequences of these errors, scholars need to be cautious with the use of demographic imputation. We recommend five principles for the responsible use of name-based demographic inference.

摘要

学者和公司越来越多地利用大型数据集来了解社会世界,基于姓名的人口统计学归因工具也被广泛用于推断这些大型数据集中经常缺失的信息。这些方法在伦理、经验和理论方面都受到了批评。我们利用 2015 年至 2020 年期间在 Web of Science 上收录的社会学、经济学和传播学期刊上所有作者的调查,比较了 19924 名学者在四个性别归因工具和四个种族/族裔归因工具中自我认定的人口统计学数据与基于姓名的性别和种族/族裔推断。我们发现,这些工具在错误性别和错误识别作者种族/族裔方面存在很大差异,将错误的归因在其他人口统计学特征之间分配不均。由于这些错误的经验和伦理后果,学者们在使用人口统计学推断时需要谨慎。我们建议了五条负责任地使用基于姓名的人口统计学推断的原则。

相似文献

1
Name-based demographic inference and the unequal distribution of misrecognition.基于姓名的人口统计推断与错误识别的不平等分布。
Nat Hum Behav. 2023 Jul;7(7):1084-1095. doi: 10.1038/s41562-023-01587-9. Epub 2023 Apr 17.
2
Avoiding bias when inferring race using name-based approaches.避免基于姓名的方法推断种族时的偏见。
PLoS One. 2022 Mar 1;17(3):e0264270. doi: 10.1371/journal.pone.0264270. eCollection 2022.
3
Validated names for experimental studies on race and ethnicity.种族和民族实验研究的有效名称。
Sci Data. 2023 Mar 10;10(1):130. doi: 10.1038/s41597-023-01947-0.
4
Use of name recognition software, census data and multiple imputation to predict missing data on ethnicity: application to cancer registry records.使用姓名识别软件、人口普查数据和多重插补法预测种族缺失数据:在癌症登记记录中的应用。
BMC Med Inform Decis Mak. 2012 Jan 23;12:3. doi: 10.1186/1472-6947-12-3.
5
Imputing Missing Race/Ethnicity in Pediatric Electronic Health Records: Reducing Bias with Use of U.S. Census Location and Surname Data.推算儿科电子健康记录中缺失的种族/民族信息:利用美国人口普查地点和姓氏数据减少偏差
Health Serv Res. 2015 Aug;50(4):946-60. doi: 10.1111/1475-6773.12295. Epub 2015 Mar 11.
6
Using name lists to infer Asian racial/ethnic subgroups in the healthcare setting.在医疗保健环境中使用姓名列表推断亚裔种族/民族亚群。
Med Care. 2010 Jun;48(6):540-6. doi: 10.1097/MLR.0b013e3181d559e9.
7
Indirect Estimation of Race/Ethnicity for Survey Respondents Who Do Not Report Race/Ethnicity.对于不报告种族/族裔的调查受访者,间接估计其种族/族裔。
Med Care. 2019 May;57(5):e28-e33. doi: 10.1097/MLR.0000000000001011.
8
Imputation of Race and Ethnicity in Health Insurance Marketplace Enrollment Data, 2015-2022 Open Enrollment Periods.2015 - 2022年开放注册期医疗保险市场注册数据中的种族和族裔推算
Rand Health Q. 2022 Nov 14;10(1):4. eCollection 2022 Nov.
9
A "Roziah" by any other name: a simple Bayesian method for determining ethnicity from names.从名字判断种族:一种简单的贝叶斯方法
Am J Epidemiol. 2014 Aug 1;180(3):325-9. doi: 10.1093/aje/kwu129. Epub 2014 Jun 18.
10
The representation of authors of color in schizophrenia research articles published in high-impact psychiatric journals.高影响力精神病学期刊发表的精神分裂症研究文章中有色人种作者的代表性。
Schizophr Res. 2023 Mar;253:75-78. doi: 10.1016/j.schres.2022.08.021. Epub 2022 Oct 8.

引用本文的文献

1
The gender gap in scholarly self-promotion on social media.社交媒体上学术自我推广中的性别差距。
Nat Commun. 2025 Jul 1;16(1):5552. doi: 10.1038/s41467-025-60590-y.
2
Quantifying behavior-based gender discrimination on collaborative platforms.量化协作平台上基于行为的性别歧视。
PNAS Nexus. 2025 Jan 27;4(2):pgaf026. doi: 10.1093/pnasnexus/pgaf026. eCollection 2025 Feb.
3
Capitalizing on a crisis: a computational analysis of all five million British firms during the Covid-19 pandemic.利用危机:对新冠疫情期间英国所有五百万家公司的计算分析。

本文引用的文献

1
Paradigms of Sex Research and Women in STEM.性研究范式与科学、技术、工程和数学领域的女性
Gend Soc. 2021 Jun;35(3):449-475. doi: 10.1177/08912432211001384. Epub 2021 Mar 19.
2
Avoiding bias when inferring race using name-based approaches.避免基于姓名的方法推断种族时的偏见。
PLoS One. 2022 Mar 1;17(3):e0264270. doi: 10.1371/journal.pone.0264270. eCollection 2022.
3
Using genderize.io to infer the gender of first names: how to improve the accuracy of the inference.使用 genderize.io 推断名字的性别:如何提高推断的准确性。
J Comput Soc Sci. 2025;8(2):29. doi: 10.1007/s42001-025-00360-4. Epub 2025 Feb 7.
4
Gender rating gap in online reviews.在线评论中的性别评分差距。
Nat Hum Behav. 2025 Mar;9(3):507-520. doi: 10.1038/s41562-024-02003-6. Epub 2024 Oct 7.
5
The Black Lives Matter movement mitigates bias against racial minority actors.“黑人的命也是命”运动减轻了对少数族裔演员的偏见。
Proc Natl Acad Sci U S A. 2024 Jul 16;121(29):e2307726121. doi: 10.1073/pnas.2307726121. Epub 2024 Jul 8.
6
The gender agency gap in fiction writing (1850 to 2010).小说创作中的性别代理差距(1850 年至 2010 年)。
Proc Natl Acad Sci U S A. 2024 Jul 16;121(29):e2319514121. doi: 10.1073/pnas.2319514121. Epub 2024 Jul 8.
7
Book bans in political context: Evidence from US schools.政治背景下的书籍禁令:来自美国学校的证据。
PNAS Nexus. 2024 Jun 11;3(6):pgae197. doi: 10.1093/pnasnexus/pgae197. eCollection 2024 Jun.
8
Analysis of NIH K99/R00 awards and the career progression of awardees.分析 NIH K99/R00 奖和获奖者的职业发展。
Elife. 2024 Jan 19;12:RP88984. doi: 10.7554/eLife.88984.
9
Junior scientists spotlight social bonds in seminars for diversity, equity, and inclusion in STEM.青年科学家在科学、技术、工程和数学领域多样性、公平性和包容性研讨会上聚焦社会关系。
PLoS One. 2023 Nov 2;18(11):e0293322. doi: 10.1371/journal.pone.0293322. eCollection 2023.
10
Gender and retention patterns among U.S. faculty.美国教职员工中的性别与留任模式。
Sci Adv. 2023 Oct 20;9(42):eadi2205. doi: 10.1126/sciadv.adi2205.
J Med Libr Assoc. 2021 Oct 1;109(4):609-612. doi: 10.5195/jmla.2021.1252.
4
Comparison and benchmark of name-to-gender inference services.姓名到性别的推理服务的比较与基准测试
PeerJ Comput Sci. 2018 Jul 16;4:e156. doi: 10.7717/peerj-cs.156. eCollection 2018.
5
Demographic aspects of first names.名字的人口统计学方面。
Sci Data. 2018 Mar 6;5:180025. doi: 10.1038/sdata.2018.25.
6
Semantics derived automatically from language corpora contain human-like biases.从语言语料库中自动推导出来的语义包含类人偏见。
Science. 2017 Apr 14;356(6334):183-186. doi: 10.1126/science.aal4230.
7
Publish (in English) or perish: The effect on citation rate of using languages other than English in scientific publications.不发表(英文论文)就出局:科学出版物中使用英语以外的语言对引用率的影响。
Ambio. 2017 Feb;46(1):121-127. doi: 10.1007/s13280-016-0820-7. Epub 2016 Sep 29.