Suppr超能文献

糖基格式转换器:一种用于转换聚糖复杂性的转换工具。

GlycanFormatConverter: a conversion tool for translating the complexities of glycans.

机构信息

Graduate School of Engineering, Soka University, Hachioji, Tokyo, Japan.

The Noguchi Institute, Itabashi, Tokyo, Japan.

出版信息

Bioinformatics. 2019 Jul 15;35(14):2434-2440. doi: 10.1093/bioinformatics/bty990.

Abstract

MOTIVATION

Glycans are biomolecules that take an important role in the biological processes of living organisms. They form diverse, complicated structures such as branched and cyclic forms. Web3 Unique Representation of Carbohydrate Structures (WURCS) was proposed as a new linear notation for uniquely representing glycans during the GlyTouCan project. WURCS defines rules for complex glycan structures that other text formats did not support, and so it is possible to represent a wide variety glycans. However, WURCS uses a complicated nomenclature, so it is not human-readable. Therefore, we aimed to support the interpretation of WURCS by converting WURCS to the most basic and widely used format IUPAC.

RESULTS

In this study, we developed GlycanFormatConverter and succeeded in converting WURCS to the three kinds of IUPAC formats (IUPAC-Extended, IUPAC-Condensed and IUPAC-Short). Furthermore, we have implemented functionality to import IUPAC-Extended, KEGG Chemical Function (KCF) and LinearCode formats and to export WURCS. We have thoroughly tested our GlycanFormatConverter and were able to show that it was possible to convert all the glycans registered in the GlyTouCan repository, with exceptions owing only to the limitations of the original format. The source code for this conversion tool has been released as an open source tool.

AVAILABILITY AND IMPLEMENTATION

https://github.com/glycoinfo/GlycanFormatConverter.git.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

糖是生物体内生物过程中起重要作用的生物分子。它们形成多种复杂的结构,如分支和环状形式。在 GlyTouCan 项目中,提出了 Web3 碳水化合物结构的独特表示法 (WURCS),作为一种独特表示聚糖的新线性表示法。WURCS 为其他文本格式不支持的复杂聚糖结构定义了规则,因此可以表示各种各样的聚糖。然而,WURCS 使用复杂的命名法,因此不易读懂。因此,我们旨在通过将 WURCS 转换为最基本和最广泛使用的 IUPAC 格式来支持 WURCS 的解释。

结果

在这项研究中,我们开发了 GlycanFormatConverter,并成功地将 WURCS 转换为三种 IUPAC 格式(IUPAC-Extended、IUPAC-Condensed 和 IUPAC-Short)。此外,我们实现了导入 IUPAC-Extended、KEGG 化学功能 (KCF) 和 LinearCode 格式以及导出 WURCS 的功能。我们对 GlycanFormatConverter 进行了全面测试,能够证明它可以转换 GlyTouCan 存储库中注册的所有聚糖,只有在原始格式的限制下才会出现例外。此转换工具的源代码已作为开源工具发布。

可用性和实现

https://github.com/glycoinfo/GlycanFormatConverter.git。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2132/6612873/99db18fa5355/bty990f1.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验