• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
Patterns of text reuse in a scientific corpus.科学语料库中的文本复用模式。
Proc Natl Acad Sci U S A. 2015 Jan 6;112(1):25-30. doi: 10.1073/pnas.1415135111. Epub 2014 Dec 8.
2
Re-using text from one's own previously published papers: an exploratory study of potential self-plagiarism.重复使用自己先前发表论文中的文本:对潜在自我剽窃行为的探索性研究。
Psychol Rep. 2005 Aug;97(1):43-9. doi: 10.2466/pr0.97.1.43-49.
3
Text recycling in STEM: A text-analytic study of recently published research articles.STEM领域中的文本复用:对近期发表的研究文章的文本分析研究
Account Res. 2021 Aug;28(6):349-371. doi: 10.1080/08989621.2020.1850284. Epub 2020 Nov 24.
4
A large dataset of scientific text reuse in Open-Access publications.大量科学文本在开放获取出版物中的重复使用数据集。
Sci Data. 2023 Jan 26;10(1):58. doi: 10.1038/s41597-022-01908-z.
5
APPS's stance on self-plagiarism: Just say no.APPS 对自我剽窃的立场:坚决说不。
Appl Plant Sci. 2014 Jul 11;2(7). doi: 10.3732/apps.1400055. eCollection 2014 Jul.
6
Comment on Cary Moskovitz' "Text Recycling in Health Sciences Literature: A Rhetorical Perspective".评卡里·莫斯科维茨的《健康科学文献中的文本循环利用:修辞学视角》。
Res Integr Peer Rev. 2017 Feb 16;2:2. doi: 10.1186/s41073-017-0026-y. eCollection 2017.
7
Using text mining techniques to extract phenotypic information from the PhenoCHF corpus.使用文本挖掘技术从PhenoCHF语料库中提取表型信息。
BMC Med Inform Decis Mak. 2015;15 Suppl 2(Suppl 2):S3. doi: 10.1186/1472-6947-15-S2-S3. Epub 2015 Jun 15.
8
Knowledge based word-concept model estimation and refinement for biomedical text mining.用于生物医学文本挖掘的基于知识的词概念模型估计与优化。
J Biomed Inform. 2015 Feb;53:300-7. doi: 10.1016/j.jbi.2014.11.015. Epub 2014 Dec 12.
9
Déjà vu--a study of duplicate citations in Medline.似曾相识——对医学在线数据库(Medline)中重复引用的一项研究。
Bioinformatics. 2008 Jan 15;24(2):243-9. doi: 10.1093/bioinformatics/btm574. Epub 2007 Dec 1.
10
Text mining in livestock animal science: introducing the potential of text mining to animal sciences.文本挖掘在畜牧动物科学中的应用:介绍文本挖掘在动物科学中的应用潜力。
J Anim Sci. 2012 Oct;90(10):3666-76. doi: 10.2527/jas.2011-4841. Epub 2012 Jun 4.

引用本文的文献

1
Ambiguity in Ethical Standards: Global Versus Local Science in Explaining Academic Plagiarism.伦理标准的模糊性:从全球科学与本地科学角度解释学术抄袭。
Sci Eng Ethics. 2024 Feb 12;30(1):4. doi: 10.1007/s11948-024-00464-6.
2
A large dataset of scientific text reuse in Open-Access publications.大量科学文本在开放获取出版物中的重复使用数据集。
Sci Data. 2023 Jan 26;10(1):58. doi: 10.1038/s41597-022-01908-z.
3
A comparative study of postgraduate theses in pedagogy and preschool education in Austria and Turkey.奥地利和土耳其教育学与学前教育专业研究生论文的比较研究。
Front Psychol. 2023 Jan 6;13:1051923. doi: 10.3389/fpsyg.2022.1051923. eCollection 2022.
4
Estimating the prevalence of text overlap in biomedical conference abstracts.估算生物医学会议摘要中文本重叠的发生率。
Res Integr Peer Rev. 2021 Feb 1;6(1):2. doi: 10.1186/s41073-020-00106-y.
5
Semi-automated fact-checking of nucleotide sequence reagents in biomedical research publications: The Seek & Blastn tool.生物医学研究出版物中核苷酸序列试剂的半自动事实核查:Seek & Blastn 工具。
PLoS One. 2019 Mar 1;14(3):e0213266. doi: 10.1371/journal.pone.0213266. eCollection 2019.
6
A Cross-Sectional Survey Study to Assess Prevalence and Attitudes Regarding Research Misconduct among Investigators in the Middle East.一项横断面调查研究,旨在评估中东地区研究人员中科研不端行为的发生率及态度。
J Acad Ethics. 2018 Mar;16(1):71-87. doi: 10.1007/s10805-017-9295-9. Epub 2017 Oct 13.
7
Encouraging Editorial Flexibility in Cases of Textual Reuse.鼓励在文本复用情况下的编辑灵活性。
J Korean Med Sci. 2017 Apr;32(4):557-560. doi: 10.3346/jkms.2017.32.4.557.
8
Preprint Déjà Vu.预印本似曾相识。
EMBO J. 2016 Dec 15;35(24):2620-2625. doi: 10.15252/embj.201695531. Epub 2016 Oct 19.
9
Ethics: An Indispensable Dimension in the University Rankings.伦理学:大学排名中不可或缺的维度。
Sci Eng Ethics. 2017 Feb;23(1):65-80. doi: 10.1007/s11948-016-9758-1. Epub 2016 Jan 20.
10
Plagiarism Allegations Account for Most Retractions in Major Latin American/Caribbean Databases.剽窃指控占拉丁美洲/加勒比地区主要数据库中撤稿事件的大多数。
Sci Eng Ethics. 2016 Oct;22(5):1447-1456. doi: 10.1007/s11948-015-9714-5. Epub 2015 Oct 31.

本文引用的文献

1
Who's afraid of peer review?谁害怕同行评审?
Science. 2013 Oct 4;342(6154):60-5. doi: 10.1126/science.2013.342.6154.342_60.
2
Publication misconduct and plagiarism retractions: a systematic, retrospective study.发表不当行为和抄袭撤稿:一项系统的、回顾性研究。
Curr Med Res Opin. 2012 Oct;28(10):1575-83. doi: 10.1185/03007995.2012.728131. Epub 2012 Oct 9.
3
ArXiv at 20.20时的ArXiv
Nature. 2011 Aug 10;476(7359):145-7. doi: 10.1038/476145a.
4
A tale of two citations.两个引用的故事。
Nature. 2008 Jan 24;451(7177):397-9. doi: 10.1038/451397a.

科学语料库中的文本复用模式。

Patterns of text reuse in a scientific corpus.

作者信息

Citron Daniel T, Ginsparg Paul

机构信息

Departments of Physics and.

Departments of Physics and Information Science, Cornell University, Ithaca, NY 14853

出版信息

Proc Natl Acad Sci U S A. 2015 Jan 6;112(1):25-30. doi: 10.1073/pnas.1415135111. Epub 2014 Dec 8.

DOI:10.1073/pnas.1415135111
PMID:25489072
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4291616/
Abstract

We consider the incidence of text "reuse" by researchers via a systematic pairwise comparison of the text content of all articles deposited to arXiv.org from 1991 to 2012. We measure the global frequencies of three classes of text reuse and measure how chronic text reuse is distributed among authors in the dataset. We infer a baseline for accepted practice, perhaps surprisingly permissive compared with other societal contexts, and a clearly delineated set of aberrant authors. We find a negative correlation between the amount of reused text in an article and its influence, as measured by subsequent citations. Finally, we consider the distribution of countries of origin of articles containing large amounts of reused text.

摘要

我们通过对1991年至2012年提交至arXiv.org的所有文章的文本内容进行系统的两两比较,来考量研究人员对文本“复用”的发生率。我们测量了三类文本复用的整体频率,并衡量了长期文本复用在数据集中作者之间的分布情况。我们推断出一个被认可做法的基线,与其他社会背景相比,这个基线或许出人意料地宽松,同时还确定了一组界限分明的异常作者。我们发现,一篇文章中复用文本的数量与其影响力(通过后续引用量来衡量)之间存在负相关。最后,我们考量了包含大量复用文本的文章的原产国分布情况。