• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

多语言词汇表中借用词的自动识别。

Automated identification of borrowings in multilingual wordlists.

作者信息

List Johann-Mattis, Forkel Robert

机构信息

Department of Linguistic and Cultural Evolution, Max Planck Institute for Evolutionary Anthropology, Leipzig, Thüringen, 04103, Germany.

出版信息

Open Res Eur. 2022 Mar 23;1:79. doi: 10.12688/openreseurope.13843.3. eCollection 2021.

DOI:10.12688/openreseurope.13843.3
PMID:37645101
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10445856/
Abstract

Although lexical borrowing is an important aspect of language evolution, there have been few attempts to automate the identification of borrowings in lexical datasets. Moreover, none of the solutions which have been proposed so far identify borrowings across multiple languages. This study proposes a new method for the task and tests it on a newly compiled large comparative dataset of 48 South-East Asian languages from Southern China. The method yields very promising results, while it is conceptually straightforward and easy to apply. This makes the approach a perfect candidate for computer-assisted exploratory studies on lexical borrowing in contact areas.

摘要

虽然词汇借用是语言演变的一个重要方面,但很少有人尝试在词汇数据集中自动识别借用词。此外,到目前为止提出的所有解决方案都无法识别多种语言中的借用词。本研究针对该任务提出了一种新方法,并在一个新编制的来自中国南方的48种东南亚语言的大型比较数据集上进行了测试。该方法产生了非常有前景的结果,而且在概念上简单易懂且易于应用。这使得该方法成为接触地区词汇借用的计算机辅助探索性研究的理想选择。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/f45b93fbd47b/openreseurope-1-15214-g0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/c589e6de55ad/openreseurope-1-15214-g0000.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/63eb253374c6/openreseurope-1-15214-g0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/6c8aeb0d6a60/openreseurope-1-15214-g0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/63167e93e328/openreseurope-1-15214-g0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/d842eb7c9199/openreseurope-1-15214-g0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/a01d9780673e/openreseurope-1-15214-g0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/a0bedef5b177/openreseurope-1-15214-g0006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/f45b93fbd47b/openreseurope-1-15214-g0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/c589e6de55ad/openreseurope-1-15214-g0000.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/63eb253374c6/openreseurope-1-15214-g0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/6c8aeb0d6a60/openreseurope-1-15214-g0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/63167e93e328/openreseurope-1-15214-g0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/d842eb7c9199/openreseurope-1-15214-g0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/a01d9780673e/openreseurope-1-15214-g0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/a0bedef5b177/openreseurope-1-15214-g0006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/31d8/10446408/f45b93fbd47b/openreseurope-1-15214-g0007.jpg

相似文献

1
Automated identification of borrowings in multilingual wordlists.多语言词汇表中借用词的自动识别。
Open Res Eur. 2022 Mar 23;1:79. doi: 10.12688/openreseurope.13843.3. eCollection 2021.
2
Using lexical language models to detect borrowings in monolingual wordlists.使用词汇语言模型检测单语词汇表中的外来词。
PLoS One. 2020 Dec 9;15(12):e0242709. doi: 10.1371/journal.pone.0242709. eCollection 2020.
3
Networks uncover hidden lexical borrowing in Indo-European language evolution.网络揭示印欧语系语言演变中的隐性词汇借用。
Proc Biol Sci. 2011 Jun 22;278(1713):1794-803. doi: 10.1098/rspb.2010.1917. Epub 2010 Nov 24.
4
Using hybridization networks to retrace the evolution of Indo-European languages.利用杂交网络追溯印欧语系语言的演变。
BMC Evol Biol. 2016 Sep 6;16(1):180. doi: 10.1186/s12862-016-0745-6.
5
Inference of partial colexifications from multilingual wordlists.从多语言词表推断部分共词化现象
Front Psychol. 2023 Jun 16;14:1156540. doi: 10.3389/fpsyg.2023.1156540. eCollection 2023.
6
A comparative wordlist for the languages of The Gran Chaco, South America.南美洲大查科地区语言的比较词汇表。
Open Res Eur. 2022 Dec 6;2:90. doi: 10.12688/openreseurope.14922.2. eCollection 2022.
7
The causality of borrowing: Lexical loans in Eurasian languages.借贷的因果关系:欧亚语言中的词汇借贷。
PLoS One. 2019 Oct 30;14(10):e0223588. doi: 10.1371/journal.pone.0223588. eCollection 2019.
8
Lexical borrowings from classical languages in the english and french medical terminologies: a comparative study.英语和法语医学术语中源自古典语言的词汇借用:一项比较研究。
Wiad Lek. 2018;71(5):1080-1083.
9
Cross-Dialectal Novel Word Learning and Borrowing.跨方言新词汇学习与借用
Front Psychol. 2021 Sep 30;12:734527. doi: 10.3389/fpsyg.2021.734527. eCollection 2021.
10
Lexical diversity in kinship across languages and dialects.跨语言和方言的亲属关系中的词汇多样性。
Front Psychol. 2023 Nov 20;14:1229697. doi: 10.3389/fpsyg.2023.1229697. eCollection 2023.

引用本文的文献

1
Open Problems in Computational Historical Linguistics.计算历史语言学中的开放性问题。
Open Res Eur. 2024 May 29;3:201. doi: 10.12688/openreseurope.16804.1. eCollection 2023.

本文引用的文献

1
First steps towards the detection of contact layers in Bangime: a multi-disciplinary, computer-assisted approach.在班吉姆检测接触层的初步步骤:一种多学科的计算机辅助方法。
Open Res Eur. 2022 Apr 22;2:10. doi: 10.12688/openreseurope.14339.2. eCollection 2022.
2
Dated language phylogenies shed light on the ancestry of Sino-Tibetan.年代语言谱系揭示了汉藏语系的起源。
Proc Natl Acad Sci U S A. 2019 May 21;116(21):10317-10322. doi: 10.1073/pnas.1817972116. Epub 2019 May 6.
3
Cross-Linguistic Data Formats, advancing data sharing and re-use in comparative linguistics.
跨语言数据格式,促进比较语言学中的数据共享和再利用。
Sci Data. 2018 Oct 16;5:180205. doi: 10.1038/sdata.2018.205.
4
The Potential of Automatic Word Comparison for Historical Linguistics.自动词比较在历史语言学中的潜力
PLoS One. 2017 Jan 27;12(1):e0170046. doi: 10.1371/journal.pone.0170046. eCollection 2017.
5
Networks of lexical borrowing and lateral gene transfer in language and genome evolution.词汇借用和侧向基因转移在语言和基因组进化中的网络。
Bioessays. 2014 Feb;36(2):141-50. doi: 10.1002/bies.201300096. Epub 2013 Dec 27.
6
Networks uncover hidden lexical borrowing in Indo-European language evolution.网络揭示印欧语系语言演变中的隐性词汇借用。
Proc Biol Sci. 2011 Jun 22;278(1713):1794-803. doi: 10.1098/rspb.2010.1917. Epub 2010 Nov 24.
7
Inference of population structure using multilocus genotype data.利用多位点基因型数据推断群体结构。
Genetics. 2000 Jun;155(2):945-59. doi: 10.1093/genetics/155.2.945.