• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

将贝尔测试应用于中文文本。

Applying the Bell's Test to Chinese Texts.

作者信息

Bessmertny Igor A, Huang Xiaoxi, Platonov Aleksei V, Yu Chuqiao, Koroleva Julia A

机构信息

School of Computer Science and Technology, Hangzhou Dianzi University, Hangzhou 310018, China.

Saint Petersburg National Research, University of Information Technology Mechanics and Optics, St. Petersburg 197101, Russia.

出版信息

Entropy (Basel). 2020 Feb 28;22(3):275. doi: 10.3390/e22030275.

DOI:10.3390/e22030275
PMID:33286049
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7516728/
Abstract

Search engines are able to find documents containing patterns from a query. This approach can be used for alphabetic languages such as English. However, Chinese is highly dependent on context. The significant problem of Chinese text processing is the missing blanks between words, so it is necessary to segment the text to words before any other action. Algorithms for Chinese text segmentation should consider context; that is, the word segmentation process depends on other ideograms. As the existing segmentation algorithms are imperfect, we have considered an approach to build the context from all possible n-grams surrounding the query words. This paper proposes a quantum-inspired approach to rank Chinese text documents by their relevancy to the query. Particularly, this approach uses Bell's test, which measures the quantum entanglement of two words within the context. The contexts of words are built using the hyperspace analogue to language (HAL) algorithm. Experiments fulfilled in three domains demonstrated that the proposed approach provides acceptable results.

摘要

搜索引擎能够找到包含查询模式的文档。这种方法可用于英语等字母语言。然而,中文高度依赖上下文。中文文本处理的一个重大问题是词与词之间缺少空格,因此在进行任何其他操作之前有必要将文本分词。中文文本分词算法应考虑上下文;也就是说,分词过程取决于其他表意文字。由于现有的分词算法并不完善,我们考虑了一种从查询词周围所有可能的n元语法构建上下文的方法。本文提出了一种受量子启发的方法,根据中文文本文档与查询的相关性对其进行排序。特别地,这种方法使用贝尔测试,该测试测量上下文中两个词的量子纠缠。词的上下文是使用超空间语言模拟(HAL)算法构建的。在三个领域进行的实验表明,所提出的方法提供了可接受的结果。

相似文献

1
Applying the Bell's Test to Chinese Texts.将贝尔测试应用于中文文本。
Entropy (Basel). 2020 Feb 28;22(3):275. doi: 10.3390/e22030275.
2
On the unsupervised analysis of domain-specific Chinese texts.关于特定领域中文文本的无监督分析。
Proc Natl Acad Sci U S A. 2016 May 31;113(22):6154-9. doi: 10.1073/pnas.1516510113. Epub 2016 May 16.
3
Font adaptive word indexing of modern printed documents.现代印刷文档的字体自适应词索引
IEEE Trans Pattern Anal Mach Intell. 2006 Aug;28(8):1187-99. doi: 10.1109/TPAMI.2006.162.
4
A new split based searching for exact pattern matching for natural texts.一种新的基于分割的自然文本精确模式匹配搜索方法。
PLoS One. 2018 Jul 26;13(7):e0200912. doi: 10.1371/journal.pone.0200912. eCollection 2018.
5
Eye movements of second language learners when reading spaced and unspaced Chinese text.第二语言学习者阅读有空格和无空格中文文本时的眼球运动。
J Exp Psychol Appl. 2012 Jun;18(2):192-202. doi: 10.1037/a0027485. Epub 2012 Apr 30.
6
A systematic review of validated methods for identifying Bell's palsy using administrative or claims data.使用行政或索赔数据识别贝尔氏麻痹的验证方法的系统评价。
Vaccine. 2013 Dec 30;31 Suppl 10:K7-11. doi: 10.1016/j.vaccine.2013.04.040.
7
Building a comprehensive syntactic and semantic corpus of Chinese clinical texts.构建中文临床文本的综合句法和语义语料库。
J Biomed Inform. 2017 May;69:203-217. doi: 10.1016/j.jbi.2017.04.006. Epub 2017 Apr 9.
8
Large scale biomedical texts classification: a kNN and an ESA-based approaches.大规模生物医学文本分类:基于k近邻算法和基于词嵌入语义分析的方法。
J Biomed Semantics. 2016 Jun 16;7:40. doi: 10.1186/s13326-016-0073-1.
9
Speculation detection for Chinese clinical notes: Impacts of word segmentation and embedding models.中文临床笔记中的推测检测:分词和嵌入模型的影响
J Biomed Inform. 2016 Apr;60:334-41. doi: 10.1016/j.jbi.2016.02.011. Epub 2016 Feb 26.
10
An approach to a comprehensive test framework for analysis and evaluation of text line segmentation algorithms.一种用于分析和评估文本行分割算法的综合测试框架方法。
Sensors (Basel). 2011;11(9):8782-812. doi: 10.3390/s110908782. Epub 2011 Sep 13.

引用本文的文献

1
Automatic assessment of divergent thinking in Chinese language with TransDis: A transformer-based language model approach.用 TransDis 对汉语发散思维进行自动评估:一种基于转换器的语言模型方法。
Behav Res Methods. 2024 Sep;56(6):5798-5819. doi: 10.3758/s13428-023-02313-z. Epub 2023 Dec 21.

本文引用的文献

1
CRIE: An automated analyzer for Chinese texts.CRIE:一款用于中文文本的自动分析器。
Behav Res Methods. 2016 Dec;48(4):1238-1251. doi: 10.3758/s13428-015-0649-1.
2
Quantum physics meets biology.量子物理学与生物学相遇。
HFSP J. 2009 Dec;3(6):386-400. doi: 10.2976/1.3244985. Epub 2009 Nov 9.