• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用从综合句法图中提取的文本模式进行自动作者身份检测。

Automatic Authorship Detection Using Textual Patterns Extracted from Integrated Syntactic Graphs.

作者信息

Gómez-Adorno Helena, Sidorov Grigori, Pinto David, Vilariño Darnes, Gelbukh Alexander

机构信息

Instituto Politécnico Nacional, Centro de Investigación en Computación, Av. Juan de Dios Bátiz S/N, Mexico City 07738, Mexico.

Benemérita Universidad Autónoma de Puebla, Facultad de Ciencias de la Computación, Av. San Claudio y 14 Sur, Puebla 72570, Mexico.

出版信息

Sensors (Basel). 2016 Aug 29;16(9):1374. doi: 10.3390/s16091374.

DOI:10.3390/s16091374
PMID:27589740
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5038652/
Abstract

We apply the integrated syntactic graph feature extraction methodology to the task of automatic authorship detection. This graph-based representation allows integrating different levels of language description into a single structure. We extract textual patterns based on features obtained from shortest path walks over integrated syntactic graphs and apply them to determine the authors of documents. On average, our method outperforms the state of the art approaches and gives consistently high results across different corpora, unlike existing methods. Our results show that our textual patterns are useful for the task of authorship attribution.

摘要

我们将集成句法图特征提取方法应用于自动作者身份检测任务。这种基于图的表示方式允许将不同层次的语言描述整合到一个单一结构中。我们基于从集成句法图上的最短路径遍历获得的特征来提取文本模式,并将其应用于确定文档的作者。与现有方法不同,平均而言,我们的方法优于当前的先进方法,并且在不同语料库上都能持续给出高准确率的结果。我们的结果表明,我们提取的文本模式对于作者身份归属任务是有用的。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/9a220cacd60d/sensors-16-01374-g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/1a539e2c5fa5/sensors-16-01374-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/8f0475591f13/sensors-16-01374-g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/60c9137c096b/sensors-16-01374-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/9a220cacd60d/sensors-16-01374-g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/1a539e2c5fa5/sensors-16-01374-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/8f0475591f13/sensors-16-01374-g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/60c9137c096b/sensors-16-01374-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9c59/5038652/9a220cacd60d/sensors-16-01374-g004.jpg

相似文献

1
Automatic Authorship Detection Using Textual Patterns Extracted from Integrated Syntactic Graphs.利用从综合句法图中提取的文本模式进行自动作者身份检测。
Sensors (Basel). 2016 Aug 29;16(9):1374. doi: 10.3390/s16091374.
2
Path-based knowledge reasoning with textual semantic information for medical knowledge graph completion.基于路径的知识推理与文本语义信息融合的医疗知识图谱补全方法
BMC Med Inform Decis Mak. 2021 Nov 29;21(Suppl 9):335. doi: 10.1186/s12911-021-01622-7.
3
Authorship attribution based on Life-Like Network Automata.基于类生命网络自动机的作者归因。
PLoS One. 2018 Mar 22;13(3):e0193703. doi: 10.1371/journal.pone.0193703. eCollection 2018.
4
Learning Stylometric Representations for Authorship Analysis.学习文体风格表示法进行作者分析。
IEEE Trans Cybern. 2019 Jan;49(1):107-121. doi: 10.1109/TCYB.2017.2766189. Epub 2017 Nov 21.
5
Multi-way association extraction and visualization from biological text documents using hyper-graphs: applications to genetic association studies for diseases.使用超图从生物文本文档中进行多方面关联提取和可视化:在疾病的遗传关联研究中的应用。
Artif Intell Med. 2010 Jul;49(3):145-54. doi: 10.1016/j.artmed.2010.03.002. Epub 2010 Apr 9.
6
Authorship identification of documents with high content similarity.具有高度内容相似性的文档的作者身份识别。
Scientometrics. 2018;115(1):223-237. doi: 10.1007/s11192-018-2661-6. Epub 2018 Feb 2.
7
Abusive Language Detection in Online Conversations by Combining Content- and Graph-Based Features.通过结合基于内容和基于图的特征来检测在线对话中的辱骂性语言。
Front Big Data. 2019 Jun 4;2:8. doi: 10.3389/fdata.2019.00008. eCollection 2019.
8
Backtrackless walks on a graph.无回溯 walks 在图上。
IEEE Trans Neural Netw Learn Syst. 2013 Jun;24(6):977-89. doi: 10.1109/TNNLS.2013.2248093.
9
Kernel approaches for genic interaction extraction.用于基因相互作用提取的核方法。
Bioinformatics. 2008 Jan 1;24(1):118-26. doi: 10.1093/bioinformatics/btm544. Epub 2007 Nov 14.
10
Neighborhood hash graph kernel for protein-protein interaction extraction.基于邻近哈希图核的蛋白质-蛋白质相互作用提取方法。
J Biomed Inform. 2011 Dec;44(6):1086-92. doi: 10.1016/j.jbi.2011.08.011. Epub 2011 Aug 23.

引用本文的文献

1
Deep neural network and model-based clustering technique for forensic electronic mail author attribution.用于法医电子邮件作者归属的深度神经网络和基于模型的聚类技术。
SN Appl Sci. 2021;3(3):348. doi: 10.1007/s42452-020-04127-6. Epub 2021 Feb 18.

本文引用的文献

1
Approaching human language with complex networks.用复杂网络研究人类语言
Phys Life Rev. 2014 Dec;11(4):598-618. doi: 10.1016/j.plrev.2014.04.004. Epub 2014 Apr 18.