• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用蛋白质结晶筛选实验中一致的命名进行模式匹配和数据集成。

Schema Matching and Data Integration with Consistent Naming on Protein Crystallization Screens.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2020 Nov-Dec;17(6):2074-2085. doi: 10.1109/TCBB.2019.2913368. Epub 2020 Dec 8.

DOI:10.1109/TCBB.2019.2913368
PMID:31034419
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7874513/
Abstract

The data representation as well as naming conventions used in commercial screen files by different companies make the automated analysis of crystallization experiments difficult and time-consuming. In order to reduce the human effort required to deal with this problem, we present an approach for computationally matching elements of two schemas using linguistic schema matching methods and then transform the input screen format to another format with naming defined by the user. This approach is tested on a number of commercial screens from different companies and the results of the experiments showed an overall accuracy of 97 percent on schema matching which is significantly better than the other two matchers we tested. Our tool enables mapping a screen file in one format to another format preferred by the expert using their preferred chemical names.

摘要

不同公司的商业屏幕文件中使用的数据表示和命名约定使得结晶实验的自动化分析变得困难且耗时。为了减少处理此问题所需的人工,我们提出了一种使用语言模式匹配方法计算匹配两个模式元素的方法,然后将输入屏幕格式转换为用户定义命名的另一种格式。该方法在来自不同公司的多个商业屏幕上进行了测试,实验结果表明模式匹配的总体准确性为 97%,明显优于我们测试的其他两个匹配器。我们的工具可以使用专家喜欢的化学名称将一个格式的屏幕文件映射到另一个格式。

相似文献

1
Schema Matching and Data Integration with Consistent Naming on Protein Crystallization Screens.利用蛋白质结晶筛选实验中一致的命名进行模式匹配和数据集成。
IEEE/ACM Trans Comput Biol Bioinform. 2020 Nov-Dec;17(6):2074-2085. doi: 10.1109/TCBB.2019.2913368. Epub 2020 Dec 8.
2
The Protein Naming Utility: a rules database for protein nomenclature.蛋白质命名实用程序:蛋白质命名规则数据库。
Nucleic Acids Res. 2010 Jan;38(Database issue):D336-9. doi: 10.1093/nar/gkp958. Epub 2009 Dec 8.
3
Ontology engineering.本体工程。
Nat Biotechnol. 2010 Feb;28(2):128-30. doi: 10.1038/nbt0210-128.
4
Automatic classification and pattern discovery in high-throughput protein crystallization trials.高通量蛋白质结晶试验中的自动分类与模式发现
J Struct Funct Genomics. 2005;6(2-3):195-202. doi: 10.1007/s10969-005-5243-9.
5
Divide and Conquer Approach to Contact Map Overlap Problem Using 2D-Pattern Mining of Protein Contact Networks.基于蛋白质接触网络二维模式挖掘的接触图重叠问题分治方法
IEEE/ACM Trans Comput Biol Bioinform. 2015 Jul-Aug;12(4):729-37. doi: 10.1109/TCBB.2015.2394402.
6
Survey-based naming conventions for use in OBO Foundry ontology development.用于OBO铸造厂本体开发的基于调查的命名约定。
BMC Bioinformatics. 2009 Apr 27;10:125. doi: 10.1186/1471-2105-10-125.
7
Text mining in livestock animal science: introducing the potential of text mining to animal sciences.文本挖掘在畜牧动物科学中的应用:介绍文本挖掘在动物科学中的应用潜力。
J Anim Sci. 2012 Oct;90(10):3666-76. doi: 10.2527/jas.2011-4841. Epub 2012 Jun 4.
8
MinePhos: a literature mining system for protein phoshphorylation information extraction.MinePhos:一种用于蛋白质磷酸化信息提取的文献挖掘系统。
IEEE/ACM Trans Comput Biol Bioinform. 2012 Jan-Feb;9(1):311-5. doi: 10.1109/TCBB.2011.85. Epub 2011 Apr 27.
9
Protein crystallizability.蛋白质结晶性
Methods Mol Biol. 2010;609:385-400. doi: 10.1007/978-1-60327-241-4_22.
10
Software tool for researching annotations of proteins: open-source protein annotation software with data visualization.用于研究蛋白质注释的软件工具:具有数据可视化功能的开源蛋白质注释软件。
Anal Chem. 2009 Dec 1;81(23):9819-23. doi: 10.1021/ac901335x.

本文引用的文献

1
Protein crystallization screens developed at the MRC Laboratory of Molecular Biology.由医学研究委员会分子生物学实验室开发的蛋白质结晶筛选方法。
Drug Discov Today. 2016 May;21(5):819-25. doi: 10.1016/j.drudis.2016.03.008. Epub 2016 Mar 24.
2
Optimizing Associative Experimental Design for Protein Crystallization Screening.优化用于蛋白质结晶筛选的关联实验设计
IEEE Trans Nanobioscience. 2016 Mar;15(2):101-12. doi: 10.1109/TNB.2016.2536030. Epub 2016 Feb 29.
3
Real-Time Protein Crystallization Image Acquisition and Classification System.实时蛋白质结晶图像采集与分类系统
Cryst Growth Des. 2013 Jul 3;13(7):2728-2736. doi: 10.1021/cg3016029.
4
Consistency of systematic chemical identifiers within and between small-molecule databases.小分子数据库内及数据库间系统化学标识符的一致性。
J Cheminform. 2012 Dec 13;4(1):35. doi: 10.1186/1758-2946-4-35.