• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

蛋白质数据的语义相似性分析:生物特征和问题的评估。

Semantic similarity analysis of protein data: assessment with biological features and issues.

机构信息

University ‘Magna Gracia’ of Catanzaro, Italy.

出版信息

Brief Bioinform. 2012 Sep;13(5):569-85. doi: 10.1093/bib/bbr066. Epub 2011 Dec 2.

DOI:10.1093/bib/bbr066
PMID:22138322
Abstract

The integration of proteomics data with biological knowledge is a recent trend in bioinformatics. A lot of biological information is available and is spread on different sources and encoded in different ontologies (e.g. Gene Ontology). Annotating existing protein data with biological information may enable the use (and the development) of algorithms that use biological ontologies as framework to mine annotated data. Recently many methodologies and algorithms that use ontologies to extract knowledge from data, as well as to analyse ontologies themselves have been proposed and applied to other fields. Conversely, the use of such annotations for the analysis of protein data is a relatively novel research area that is currently becoming more and more central in research. Existing approaches span from the definition of the similarity among genes and proteins on the basis of the annotating terms, to the definition of novel algorithms that use such similarities for mining protein data on a proteome-wide scale. This work, after the definition of main concept of such analysis, presents a systematic discussion and comparison of main approaches. Finally, remaining challenges, as well as possible future directions of research are presented.

摘要

蛋白质组学数据与生物知识的整合是生物信息学的一个新趋势。大量的生物信息是可用的,分布在不同的来源,并以不同的本体(例如,基因本体论)进行编码。用生物信息对现有蛋白质数据进行注释,可以使使用(和开发)使用生物本体作为框架来挖掘注释数据的算法成为可能。最近,许多使用本体从数据中提取知识以及分析本体本身的方法和算法已经被提出并应用于其他领域。相反,这种注释在蛋白质数据分析中的应用是一个相对较新的研究领域,目前在研究中越来越重要。现有的方法从基于注释术语的基因和蛋白质之间的相似性定义,到定义使用这种相似性在全蛋白质组范围内挖掘蛋白质数据的新算法都有涉及。这项工作在定义了这种分析的主要概念之后,对主要方法进行了系统的讨论和比较。最后,还提出了剩余的挑战以及可能的未来研究方向。

相似文献

1
Semantic similarity analysis of protein data: assessment with biological features and issues.蛋白质数据的语义相似性分析:生物特征和问题的评估。
Brief Bioinform. 2012 Sep;13(5):569-85. doi: 10.1093/bib/bbr066. Epub 2011 Dec 2.
2
A relation based measure of semantic similarity for Gene Ontology annotations.一种基于关系的基因本体注释语义相似度度量方法。
BMC Bioinformatics. 2008 Nov 4;9:468. doi: 10.1186/1471-2105-9-468.
3
Semantic similarity estimation in the biomedical domain: an ontology-based information-theoretic perspective.生物医学领域的语义相似度评估:基于本体的信息论视角。
J Biomed Inform. 2011 Oct;44(5):749-59. doi: 10.1016/j.jbi.2011.03.013. Epub 2011 Apr 2.
4
A knowledge-driven approach to biomedical document conceptualization.基于知识的生物医学文献概念化方法。
Artif Intell Med. 2010 Jun;49(2):67-78. doi: 10.1016/j.artmed.2010.02.005. Epub 2010 Apr 3.
5
A new method to measure the semantic similarity of GO terms.一种测量基因本体术语语义相似性的新方法。
Bioinformatics. 2007 May 15;23(10):1274-81. doi: 10.1093/bioinformatics/btm087. Epub 2007 Mar 7.
6
How to link ontologies and protein-protein interactions to literature: text-mining approaches and the BioCreative experience.如何将本体和蛋白质-蛋白质相互作用与文献联系起来:文本挖掘方法和 BioCreative 的经验。
Database (Oxford). 2012 Mar 21;2012:bas017. doi: 10.1093/database/bas017. Print 2012.
7
Using ontologies in PROTEUS for modeling proteomics data mining applications.在PROTEUS中使用本体对蛋白质组学数据挖掘应用进行建模。
Stud Health Technol Inform. 2005;112:17-26.
8
A genetic similarity algorithm for searching the Gene Ontology terms and annotating anonymous protein sequences.一种用于搜索基因本体术语和注释匿名蛋白质序列的遗传相似性算法。
J Biomed Inform. 2008 Feb;41(1):65-81. doi: 10.1016/j.jbi.2007.05.010. Epub 2007 Jun 27.
9
An ontology-based measure to compute semantic similarity in biomedicine.基于本体的生物医学语义相似度计算度量方法。
J Biomed Inform. 2011 Feb;44(1):118-25. doi: 10.1016/j.jbi.2010.09.002. Epub 2010 Sep 15.
10
From proteome lists to biological impact--tools and strategies for the analysis of large MS data sets.从蛋白质组列表到生物影响——用于分析大型 MS 数据集的工具和策略。
Proteomics. 2010 Mar;10(6):1270-83. doi: 10.1002/pmic.200900365.

引用本文的文献

1
Identifying optimal substrate classes of membrane transporters.确定膜转运蛋白的最佳底物类别。
PLoS One. 2024 Dec 19;19(12):e0315330. doi: 10.1371/journal.pone.0315330. eCollection 2024.
2
Leveraging graph neural networks for supporting automatic triage of patients.利用图神经网络支持患者的自动分诊。
Sci Rep. 2024 May 31;14(1):12548. doi: 10.1038/s41598-024-63376-2.
3
Exact p-values for global network alignments via combinatorial analysis of shared GO terms : REFANGO: Rigorous Evaluation of Functional Alignments of Networks using Gene Ontology.
通过共享 GO 术语的组合分析进行全局网络比对的确切 p 值:REFANGO:使用基因本体论对网络的功能比对进行严格评估。
J Math Biol. 2024 Mar 29;88(5):50. doi: 10.1007/s00285-024-02058-z.
4
Partial order relation-based gene ontology embedding improves protein function prediction.基于偏序关系的本体论嵌入可提高蛋白质功能预测。
Brief Bioinform. 2024 Jan 22;25(2). doi: 10.1093/bib/bbae077.
5
Assessment of GO-Based Protein Interaction Affinities in the Large-Scale Human-Coronavirus Family Interactome.基于基因本体论的大规模人类冠状病毒家族相互作用组中蛋白质相互作用亲和力评估。
Vaccines (Basel). 2023 Feb 25;11(3):549. doi: 10.3390/vaccines11030549.
6
Machine learning in postgenomic biology and personalized medicine.后基因组生物学与个性化医学中的机器学习
Wiley Interdiscip Rev Data Min Knowl Discov. 2022 Mar-Apr;12(2). doi: 10.1002/widm.1451. Epub 2022 Jan 24.
7
SANA: cross-species prediction of Gene Ontology GO annotations via topological network alignment.SANA:通过拓扑网络比对进行跨物种基因本体论 GO 注释的预测。
NPJ Syst Biol Appl. 2022 Jul 20;8(1):25. doi: 10.1038/s41540-022-00232-x.
8
Network-Based Approaches for Disease-Gene Association Prediction Using Protein-Protein Interaction Networks.基于蛋白质-蛋白质相互作用网络的疾病-基因关联预测的网络方法。
Int J Mol Sci. 2022 Jul 3;23(13):7411. doi: 10.3390/ijms23137411.
9
DIVIS: a semantic DIstance to improve the VISualisation of heterogeneous phenotypic datasets.DIVIS:一种用于改善异质表型数据集可视化的语义距离。
BioData Min. 2022 Apr 4;15(1):10. doi: 10.1186/s13040-022-00293-y.
10
Using dual-network-analyser for communities detecting in dual networks.使用双网络分析器检测双网络中的社区。
BMC Bioinformatics. 2022 Jan 10;22(Suppl 15):614. doi: 10.1186/s12859-022-04564-7.