• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于隐马尔可夫模型的方法识别参与相同途径的基因。

Identification of genes involved in the same pathways using a Hidden Markov Model-based approach.

机构信息

Department of Electrical Engineering and Computer Science, University of Kansas, 1520 West 15th Street, Lawrence, KS 66045, USA.

出版信息

Bioinformatics. 2009 Nov 15;25(22):2945-54. doi: 10.1093/bioinformatics/btp521. Epub 2009 Aug 31.

DOI:10.1093/bioinformatics/btp521
PMID:19720676
Abstract

MOTIVATION

The sequencing of whole genomes from various species has provided us with a wealth of genetic information. To make use of the vast amounts of data available today it is necessary to devise computer-based analysis techniques.

RESULTS

We propose a Hidden Markov Model (HMM) based algorithm to detect groups of genes functionally similar to a set of input genes from microarray expression data. A subset of experiments from a microarray is selected based on a set of related input genes. HMMs are trained from the input genes and a group of random gene input sets to provide significance estimates. Every gene in the microarray is scored using all HMMs and significant matches with the input genes are retained. We ran this algorithm on the life cycle of Drosophila microarray data set with KEGG pathways for cell cycle and translation factors as input data sets. Results show high functional similarity in resulting gene sets, increasing our biological insight into gene pathways and KEGG annotations. The algorithm performed very well compared to the Signature Algorithm and a purely correlation-based approach.

AVAILABILITY

Java source codes and data sets are available at http://www.ittc.ku.edu/~xwchen/software.htm

摘要

动机

对来自不同物种的全基因组进行测序为我们提供了大量的遗传信息。为了利用当今可用的大量数据,有必要设计基于计算机的分析技术。

结果

我们提出了一种基于隐马尔可夫模型(HMM)的算法,用于从微阵列表达数据中检测与一组输入基因在功能上相似的基因组。根据一组相关的输入基因,从微阵列中选择一组实验。从输入基因和一组随机基因输入集训练 HMM,以提供显著性估计。使用所有 HMM 对微阵列中的每个基因进行评分,并保留与输入基因的显著匹配。我们在果蝇微阵列数据集的生命周期上运行此算法,以细胞周期和翻译因子的 KEGG 途径作为输入数据集。结果表明,结果基因集具有很高的功能相似性,这增加了我们对基因途径和 KEGG 注释的生物学理解。与 Signature 算法和纯粹基于相关性的方法相比,该算法的性能非常出色。

可用性

Java 源代码和数据集可在 http://www.ittc.ku.edu/~xwchen/software.htm 上获得。

相似文献

1
Identification of genes involved in the same pathways using a Hidden Markov Model-based approach.基于隐马尔可夫模型的方法识别参与相同途径的基因。
Bioinformatics. 2009 Nov 15;25(22):2945-54. doi: 10.1093/bioinformatics/btp521. Epub 2009 Aug 31.
2
Pathway analysis using random forests classification and regression.使用随机森林分类和回归的通路分析
Bioinformatics. 2006 Aug 15;22(16):2028-36. doi: 10.1093/bioinformatics/btl344. Epub 2006 Jun 29.
3
MILANO--custom annotation of microarray results using automatic literature searches.米兰——使用自动文献检索对微阵列结果进行定制注释。
BMC Bioinformatics. 2005 Jan 20;6:12. doi: 10.1186/1471-2105-6-12.
4
Clustering short time series gene expression data.聚类短时间序列基因表达数据。
Bioinformatics. 2005 Jun;21 Suppl 1:i159-68. doi: 10.1093/bioinformatics/bti1022.
5
PathExpress: a web-based tool to identify relevant pathways in gene expression data.PathExpress:一种用于识别基因表达数据中相关通路的基于网络的工具。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W176-81. doi: 10.1093/nar/gkm261. Epub 2007 Jun 22.
6
Calibrating E-values for hidden Markov models using reverse-sequence null models.使用反向序列空模型校准隐马尔可夫模型的E值。
Bioinformatics. 2005 Nov 15;21(22):4107-15. doi: 10.1093/bioinformatics/bti629. Epub 2005 Aug 25.
7
TileMap: create chromosomal map of tiling array hybridizations.TileMap:创建平铺阵列杂交的染色体图谱。
Bioinformatics. 2005 Sep 15;21(18):3629-36. doi: 10.1093/bioinformatics/bti593. Epub 2005 Jul 26.
8
Towards clustering of incomplete microarray data without the use of imputation.迈向无需插补的不完整微阵列数据聚类
Bioinformatics. 2007 Jan 1;23(1):107-13. doi: 10.1093/bioinformatics/btl555. Epub 2006 Oct 31.
9
Methods for labeling error detection in microarrays based on the effect of data perturbation on the regression model.基于数据扰动对回归模型影响的微阵列标记错误检测方法。
Bioinformatics. 2009 Oct 15;25(20):2708-14. doi: 10.1093/bioinformatics/btp478. Epub 2009 Aug 6.
10
Analysis of a Gibbs sampler method for model-based clustering of gene expression data.一种基于模型的基因表达数据聚类的吉布斯采样器方法分析。
Bioinformatics. 2008 Jan 15;24(2):176-83. doi: 10.1093/bioinformatics/btm562. Epub 2007 Nov 22.

引用本文的文献

1
Expression profile-based screening for critical genes reveals S100A4, ACKR3 and CDH1 in docetaxel-resistant prostate cancer cells.基于表达谱筛选关键基因揭示多西他赛耐药前列腺癌细胞中的S100A4、ACKR3和CDH1
Aging (Albany NY). 2019 Dec 29;11(24):12754-12772. doi: 10.18632/aging.102600.