• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过结构域特征预测通路成员身份。

Predicting pathway membership via domain signatures.

作者信息

Fröhlich Holger, Fellmann Mark, Sültmann Holger, Poustka Annemarie, Beissbarth Tim

机构信息

German Cancer Research Center (DKFZ), Im Neuenheimer Feld 580, 69120 Heidelberg, Germany.

出版信息

Bioinformatics. 2008 Oct 1;24(19):2137-42. doi: 10.1093/bioinformatics/btn403. Epub 2008 Aug 1.

DOI:10.1093/bioinformatics/btn403
PMID:18676972
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2553439/
Abstract

MOTIVATION

Functional characterization of genes is of great importance for the understanding of complex cellular processes. Valuable information for this purpose can be obtained from pathway databases, like KEGG. However, only a small fraction of genes is annotated with pathway information up to now. In contrast, information on contained protein domains can be obtained for a significantly higher number of genes, e.g. from the InterPro database.

RESULTS

We present a classification model, which for a specific gene of interest can predict the mapping to a KEGG pathway, based on its domain signature. The classifier makes explicit use of the hierarchical organization of pathways in the KEGG database. Furthermore, we take into account that a specific gene can be mapped to different pathways at the same time. The classification method produces a scoring of all possible mapping positions of the gene in the KEGG hierarchy. Evaluations of our model, which is a combination of a SVM and ranking perceptron approach, show a high prediction performance. Moreover, for signaling pathways we reveal that it is even possible to forecast accurately the membership to individual pathway components.

AVAILABILITY

The R package gene2pathway is a supplement to this article.

摘要

动机

基因的功能表征对于理解复杂的细胞过程非常重要。为此目的的有价值信息可以从通路数据库(如KEGG)中获得。然而,到目前为止,只有一小部分基因被标注了通路信息。相比之下,可以从InterPro数据库等获得更多基因的包含蛋白质结构域的信息。

结果

我们提出了一种分类模型,该模型可以基于感兴趣的特定基因的结构域特征预测其到KEGG通路的映射。分类器明确利用了KEGG数据库中通路的层次结构。此外,我们考虑到一个特定基因可以同时映射到不同的通路。分类方法对基因在KEGG层次结构中的所有可能映射位置进行评分。我们的模型是支持向量机和排序感知器方法的组合,对其评估显示出很高的预测性能。此外,对于信号通路,我们发现甚至有可能准确预测个体通路成分的成员资格。

可用性

R包gene2pathway是本文的补充。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/9e0c45be7978/btn403f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/33fd4bb95de0/btn403f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/612b3d889e9a/btn403f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/9e0c45be7978/btn403f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/33fd4bb95de0/btn403f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/612b3d889e9a/btn403f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2a75/2639041/9e0c45be7978/btn403f3.jpg

相似文献

1
Predicting pathway membership via domain signatures.通过结构域特征预测通路成员身份。
Bioinformatics. 2008 Oct 1;24(19):2137-42. doi: 10.1093/bioinformatics/btn403. Epub 2008 Aug 1.
2
Extending pathways based on gene lists using InterPro domain signatures.使用InterPro结构域签名基于基因列表扩展通路。
BMC Bioinformatics. 2008 Jan 4;9:3. doi: 10.1186/1471-2105-9-3.
3
ADAN: a database for prediction of protein-protein interaction of modular domains mediated by linear motifs.ADAN:一个用于预测线性基序介导的模块化域蛋白质-蛋白质相互作用的数据库。
Bioinformatics. 2009 Sep 15;25(18):2418-24. doi: 10.1093/bioinformatics/btp424. Epub 2009 Jul 14.
4
Correlated sequence-signatures as markers of protein-protein interaction.作为蛋白质-蛋白质相互作用标志物的相关序列特征
J Mol Biol. 2001 Aug 24;311(4):681-92. doi: 10.1006/jmbi.2001.4920.
5
In silico characterization of proteins: UniProt, InterPro and Integr8.蛋白质的计算机表征:通用蛋白质数据库、InterPro和Integr8。
Mol Biotechnol. 2008 Feb;38(2):165-77. doi: 10.1007/s12033-007-9003-x. Epub 2007 Oct 4.
6
Protein domain prediction.蛋白质结构域预测
Methods Mol Biol. 2008;426:117-43. doi: 10.1007/978-1-60327-058-8_7.
7
Discovering signal transduction networks using signaling domain-domain interactions.利用信号结构域-结构域相互作用发现信号转导网络。
Genome Inform. 2006;17(2):35-45.
8
Predicting novel metabolic pathways through subgraph mining.通过子图挖掘预测新的代谢途径。
Bioinformatics. 2017 Dec 15;33(24):3955-3963. doi: 10.1093/bioinformatics/btx481.
9
Predicting homologous signaling pathways using machine learning.使用机器学习预测同源信号通路。
Bioinformatics. 2009 Nov 15;25(22):2913-20. doi: 10.1093/bioinformatics/btp532. Epub 2009 Sep 7.
10
AutoSCOP: automated prediction of SCOP classifications using unique pattern-class mappings.AutoSCOP:使用独特的模式-类别映射自动预测SCOP分类
Bioinformatics. 2007 May 15;23(10):1203-10. doi: 10.1093/bioinformatics/btm089. Epub 2007 Mar 22.

引用本文的文献

1
REFINING CELLULAR PATHWAY MODELS USING AN ENSEMBLE OF HETEROGENEOUS DATA SOURCES.使用异构数据源集合优化细胞通路模型
Ann Appl Stat. 2018 Sep;12(3):1361-1384. doi: 10.1214/16-aoas915. Epub 2018 Sep 11.
2
Comparative Transcriptome Analysis of Deep-Rooting and Shallow-Rooting Potato ( L.) Genotypes under Drought Stress.干旱胁迫下深根和浅根马铃薯(L.)基因型的比较转录组分析
Plants (Basel). 2022 Aug 3;11(15):2024. doi: 10.3390/plants11152024.
3
Gaussian Embedding for Large-scale Gene Set Analysis.用于大规模基因集分析的高斯嵌入

本文引用的文献

1
Extending pathways based on gene lists using InterPro domain signatures.使用InterPro结构域签名基于基因列表扩展通路。
BMC Bioinformatics. 2008 Jan 4;9:3. doi: 10.1186/1471-2105-9-3.
2
KEGG for linking genomes to life and the environment.京都基因与基因组百科全书,用于将基因组与生命及环境相联系。
Nucleic Acids Res. 2008 Jan;36(Database issue):D480-4. doi: 10.1093/nar/gkm882. Epub 2007 Dec 12.
3
Ensembl 2008.Ensembl 2008。
Nat Mach Intell. 2020 Jul;2(7):387-395. doi: 10.1038/s42256-020-0193-2. Epub 2020 Jun 15.
4
Multi-label multi-instance transfer learning for simultaneous reconstruction and cross-talk modeling of multiple human signaling pathways.用于多个人类信号通路同时重建和串扰建模的多标签多实例迁移学习
BMC Bioinformatics. 2015 Dec 30;16:417. doi: 10.1186/s12859-015-0841-4.
5
A simple feature construction method for predicting upstream/downstream signal flow in human protein-protein interaction networks.一种用于预测人类蛋白质-蛋白质相互作用网络中上游/下游信号流的简单特征构建方法。
Sci Rep. 2015 Dec 9;5:17983. doi: 10.1038/srep17983.
6
Inferring functional modules of protein families with probabilistic topic models.用概率主题模型推断蛋白质家族的功能模块。
BMC Bioinformatics. 2011 May 9;12:141. doi: 10.1186/1471-2105-12-141.
7
HPD: an online integrated human pathway database enabling systems biology studies.HPD:一个在线综合人类途径数据库,支持系统生物学研究。
BMC Bioinformatics. 2009 Oct 8;10 Suppl 11(Suppl 11):S5. doi: 10.1186/1471-2105-10-S11-S5.
Nucleic Acids Res. 2008 Jan;36(Database issue):D707-14. doi: 10.1093/nar/gkm988. Epub 2007 Nov 13.
4
Genetics. Working the (gene count) numbers: finally, a firm answer?遗传学。统计(基因数量)数据:终于有确切答案了?
Science. 2007 May 25;316(5828):1113. doi: 10.1126/science.316.5828.1113a.
5
New developments in the InterPro database.InterPro数据库的新进展。
Nucleic Acids Res. 2007 Jan;35(Database issue):D224-8. doi: 10.1093/nar/gkl841.
6
Identification of a common gene expression signature in dilated cardiomyopathy across independent microarray studies.通过独立的微阵列研究鉴定扩张型心肌病中的常见基因表达特征。
J Am Coll Cardiol. 2006 Oct 17;48(8):1610-7. doi: 10.1016/j.jacc.2006.07.026. Epub 2006 Sep 27.
7
Linear models and empirical bayes methods for assessing differential expression in microarray experiments.用于评估微阵列实验中差异表达的线性模型和经验贝叶斯方法。
Stat Appl Genet Mol Biol. 2004;3:Article3. doi: 10.2202/1544-6115.1027. Epub 2004 Feb 12.
8
The Gene Ontology (GO) database and informatics resource.基因本体论(GO)数据库及信息资源。
Nucleic Acids Res. 2004 Jan 1;32(Database issue):D258-61. doi: 10.1093/nar/gkh036.
9
Variance stabilization applied to microarray data calibration and to the quantification of differential expression.方差稳定化应用于微阵列数据校准和差异表达定量分析。
Bioinformatics. 2002;18 Suppl 1:S96-104. doi: 10.1093/bioinformatics/18.suppl_1.s96.
10
Characterization of the novel mitochondrial protein import component, Tom34, in mammalian cells.新型线粒体蛋白输入组分Tom34在哺乳动物细胞中的特性分析
J Biochem. 1999 Apr;125(4):721-7. doi: 10.1093/oxfordjournals.jbchem.a022342.