• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过联合编码图结构和文本节点描述符来学习基因本体论术语的表示。

Learning representations for gene ontology terms by jointly encoding graph structure and textual node descriptors.

机构信息

Faculty of Computing, Harbin Institute of Technology, Harbin 150001, China.

Department of Medical Informatics, School of Biomedical Engineering and Informatics, Nanjing Medical University, Nanjing 211166, China.

出版信息

Brief Bioinform. 2022 Sep 20;23(5). doi: 10.1093/bib/bbac318.

DOI:10.1093/bib/bbac318
PMID:35901452
Abstract

Measuring the semantic similarity between Gene Ontology (GO) terms is a fundamental step in numerous functional bioinformatics applications. To fully exploit the metadata of GO terms, word embedding-based methods have been proposed recently to map GO terms to low-dimensional feature vectors. However, these representation methods commonly overlook the key information hidden in the whole GO structure and the relationship between GO terms. In this paper, we propose a novel representation model for GO terms, named GT2Vec, which jointly considers the GO graph structure obtained by graph contrastive learning and the semantic description of GO terms based on BERT encoders. Our method is evaluated on a protein similarity task on a collection of benchmark datasets. The experimental results demonstrate the effectiveness of using a joint encoding graph structure and textual node descriptors to learn vector representations for GO terms.

摘要

衡量基因本体论(GO)术语之间的语义相似性是许多功能生物信息学应用的基础步骤。为了充分利用 GO 术语的元数据,最近已经提出了基于单词嵌入的方法来将 GO 术语映射到低维特征向量。然而,这些表示方法通常忽略了隐藏在整个 GO 结构中的关键信息以及 GO 术语之间的关系。在本文中,我们提出了一种新的 GO 术语表示模型,称为 GT2Vec,它联合考虑了基于图对比学习获得的 GO 图结构以及基于 BERT 编码器的 GO 术语的语义描述。我们的方法在一组基准数据集上的蛋白质相似性任务上进行了评估。实验结果表明,使用联合编码图结构和文本节点描述符来学习 GO 术语的向量表示是有效的。

相似文献

1
Learning representations for gene ontology terms by jointly encoding graph structure and textual node descriptors.通过联合编码图结构和文本节点描述符来学习基因本体论术语的表示。
Brief Bioinform. 2022 Sep 20;23(5). doi: 10.1093/bib/bbac318.
2
GO2Vec: transforming GO terms and proteins to vector representations via graph embeddings.GO2Vec:通过图嵌入将 GO 术语和蛋白质转换为向量表示。
BMC Genomics. 2019 Dec 24;20(Suppl 9):918. doi: 10.1186/s12864-019-6272-2.
3
Measure the Semantic Similarity of GO Terms Using Aggregate Information Content.使用聚合信息内容测量基因本体术语的语义相似性。
IEEE/ACM Trans Comput Biol Bioinform. 2014 May-Jun;11(3):468-76. doi: 10.1109/TCBB.2013.176.
4
Assessment of Semantic Similarity between Proteins Using Information Content and Topological Properties of the Gene Ontology Graph.使用信息内容和基因本体论图的拓扑属性评估蛋白质之间的语义相似性。
IEEE/ACM Trans Comput Biol Bioinform. 2018 May-Jun;15(3):839-849. doi: 10.1109/TCBB.2017.2689762. Epub 2017 Mar 31.
5
HiG2Vec: hierarchical representations of Gene Ontology and genes in the Poincaré ball.HiG2Vec:庞加莱球中基因本体论和基因的层次表示。
Bioinformatics. 2021 Sep 29;37(18):2971-2980. doi: 10.1093/bioinformatics/btab193.
6
GOGCN: Graph Convolutional Network on Gene Ontology for Functional Similarity Analysis of Genes.GOGCN:用于基因功能相似性分析的基因本体上的图卷积网络
IEEE/ACM Trans Comput Biol Bioinform. 2023 Mar-Apr;20(2):1053-1064. doi: 10.1109/TCBB.2022.3181300. Epub 2023 Apr 3.
7
GoVec: Gene Ontology Representation Learning Using Weighted Heterogeneous Graph and Meta-Path.GoVec:基于加权异质图和元路径的基因本体表示学习。
J Comput Biol. 2021 Dec;28(12):1196-1207. doi: 10.1089/cmb.2021.0069. Epub 2021 Nov 29.
8
Improving automatic GO annotation with semantic similarity.利用语义相似度提高 GO 自动注释的效果。
BMC Bioinformatics. 2022 Dec 12;23(Suppl 2):433. doi: 10.1186/s12859-022-04958-7.
9
Onto2Vec: joint vector-based representation of biological entities and their ontology-based annotations.Onto2Vec:基于向量的生物实体联合表示及其基于本体论的标注。
Bioinformatics. 2018 Jul 1;34(13):i52-i60. doi: 10.1093/bioinformatics/bty259.
10
protein2vec: Predicting Protein-Protein Interactions Based on LSTM.protein2vec:基于 LSTM 的蛋白质-蛋白质相互作用预测。
IEEE/ACM Trans Comput Biol Bioinform. 2022 May-Jun;19(3):1257-1266. doi: 10.1109/TCBB.2020.3003941. Epub 2022 Jun 3.

引用本文的文献

1
OntoTiger: a platform of ontology-based application tools for integrative biomedical exploration.OntoTiger:一个用于综合生物医学探索的基于本体的应用工具平台。
Nucleic Acids Res. 2025 Jul 7;53(W1):W440-W450. doi: 10.1093/nar/gkaf337.
2
An experimental analysis of graph representation learning for Gene Ontology based protein function prediction.基于基因本体论的蛋白质功能预测的图表示学习的实验分析。
PeerJ. 2024 Nov 14;12:e18509. doi: 10.7717/peerj.18509. eCollection 2024.
3
Translational Bioinformatics for Human Reproductive Biology Research: Examples, Opportunities and Challenges for a Future Reproductive Medicine.
生殖生物学研究的转化生物信息学:未来生殖医学的实例、机遇与挑战。
Int J Mol Sci. 2022 Dec 20;24(1):4. doi: 10.3390/ijms24010004.