• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于检测进化保守元件的系统发育隐马尔可夫模型的统计功效。

Statistical power of phylo-HMM for evolutionarily conserved element detection.

作者信息

Fan Xiaodan, Zhu Jun, Schadt Eric E, Liu Jun S

机构信息

Department of Statistics, Harvard University, Boston, MA, USA.

出版信息

BMC Bioinformatics. 2007 Oct 5;8:374. doi: 10.1186/1471-2105-8-374.

DOI:10.1186/1471-2105-8-374
PMID:17919331
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2194792/
Abstract

BACKGROUND

An important goal of comparative genomics is the identification of functional elements through conservation analysis. Phylo-HMM was recently introduced to detect conserved elements based on multiple genome alignments, but the method has not been rigorously evaluated.

RESULTS

We report here a simulation study to investigate the power of phylo-HMM. We show that the power of the phylo-HMM approach depends on many factors, the most important being the number of species-specific genomes used and evolutionary distances between pairs of species. This finding is consistent with results reported by other groups for simpler comparative genomics models. In addition, the conservation ratio of conserved elements and the expected length of the conserved elements are also major factors. In contrast, the influence of the topology and the nucleotide substitution model are relatively minor factors.

CONCLUSION

Our results provide for general guidelines on how to select the number of genomes and their evolutionary distance in comparative genomics studies, as well as the level of power we can expect under different parameter settings.

摘要

背景

比较基因组学的一个重要目标是通过保守性分析来识别功能元件。系统发育隐马尔可夫模型(Phylo-HMM)最近被引入用于基于多个基因组比对来检测保守元件,但该方法尚未得到严格评估。

结果

我们在此报告一项模拟研究,以探究Phylo-HMM的效能。我们表明,Phylo-HMM方法的效能取决于许多因素,其中最重要的是所使用的物种特异性基因组的数量以及物种对之间的进化距离。这一发现与其他研究小组针对更简单的比较基因组学模型所报告的结果一致。此外,保守元件的保守率和保守元件的预期长度也是主要因素。相比之下,拓扑结构和核苷酸替换模型的影响相对较小。

结论

我们的结果为在比较基因组学研究中如何选择基因组数量及其进化距离提供了一般指导原则,以及在不同参数设置下我们可以预期的效能水平。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/dcf5df2b01fe/1471-2105-8-374-11.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/19fa41257e65/1471-2105-8-374-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/cacb749359a2/1471-2105-8-374-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/37ae9fe4eab1/1471-2105-8-374-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/21639a47181d/1471-2105-8-374-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/3091ab9e200a/1471-2105-8-374-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/4ffdb4d1b068/1471-2105-8-374-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/5a3ac233871e/1471-2105-8-374-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/781d064a996d/1471-2105-8-374-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/f4e96c59e02d/1471-2105-8-374-9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/e6e2586a6b87/1471-2105-8-374-10.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/dcf5df2b01fe/1471-2105-8-374-11.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/19fa41257e65/1471-2105-8-374-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/cacb749359a2/1471-2105-8-374-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/37ae9fe4eab1/1471-2105-8-374-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/21639a47181d/1471-2105-8-374-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/3091ab9e200a/1471-2105-8-374-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/4ffdb4d1b068/1471-2105-8-374-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/5a3ac233871e/1471-2105-8-374-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/781d064a996d/1471-2105-8-374-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/f4e96c59e02d/1471-2105-8-374-9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/e6e2586a6b87/1471-2105-8-374-10.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/05d4/2194792/dcf5df2b01fe/1471-2105-8-374-11.jpg

相似文献

1
Statistical power of phylo-HMM for evolutionarily conserved element detection.用于检测进化保守元件的系统发育隐马尔可夫模型的统计功效。
BMC Bioinformatics. 2007 Oct 5;8:374. doi: 10.1186/1471-2105-8-374.
2
Comparative annotation of viral genomes with non-conserved gene structure.具有非保守基因结构的病毒基因组的比较注释
Bioinformatics. 2007 May 1;23(9):1080-9. doi: 10.1093/bioinformatics/btm078. Epub 2007 Mar 6.
3
Using hidden Markov models and observed evolution to annotate viral genomes.使用隐马尔可夫模型和观察到的进化对病毒基因组进行注释。
Bioinformatics. 2006 Jun 1;22(11):1308-16. doi: 10.1093/bioinformatics/btl092. Epub 2006 Apr 13.
4
XRate: a fast prototyping, training and annotation tool for phylo-grammars.XRate:一种用于系统发育语法的快速原型制作、训练和注释工具。
BMC Bioinformatics. 2006 Oct 3;7:428. doi: 10.1186/1471-2105-7-428.
5
GeneSyn: a tool for detecting conserved gene order across genomes.基因同步(GeneSyn):一种用于检测跨基因组保守基因顺序的工具。
Bioinformatics. 2004 Jun 12;20(9):1472-4. doi: 10.1093/bioinformatics/bth102. Epub 2004 Feb 19.
6
Discovery of regulatory elements in vertebrates through comparative genomics.通过比较基因组学发现脊椎动物中的调控元件。
Nat Biotechnol. 2005 Oct;23(10):1249-56. doi: 10.1038/nbt1140.
7
Improving the specificity of high-throughput ortholog prediction.提高高通量直系同源物预测的特异性。
BMC Bioinformatics. 2006 May 28;7:270. doi: 10.1186/1471-2105-7-270.
8
OMA Browser--exploring orthologous relations across 352 complete genomes.OMA浏览器——探索352个完整基因组间的直系同源关系。
Bioinformatics. 2007 Aug 15;23(16):2180-2. doi: 10.1093/bioinformatics/btm295. Epub 2007 Jun 1.
9
Comparative genomics reveals unusually long motifs in mammalian genomes.比较基因组学揭示了哺乳动物基因组中异常长的基序。
Bioinformatics. 2006 Jul 15;22(14):e236-42. doi: 10.1093/bioinformatics/btl265.
10
GARD: a genetic algorithm for recombination detection.GARD:一种用于重组检测的遗传算法。
Bioinformatics. 2006 Dec 15;22(24):3096-8. doi: 10.1093/bioinformatics/btl474. Epub 2006 Nov 16.

引用本文的文献

1
GermlncRNA: a unique catalogue of long non-coding RNAs and associated regulations in male germ cell development.生殖系长链非编码RNA:男性生殖细胞发育中长链非编码RNA及其相关调控的独特目录
Database (Oxford). 2015 May 17;2015:bav044. doi: 10.1093/database/bav044. Print 2015.
2
N-terminal proteomics and ribosome profiling provide a comprehensive view of the alternative translation initiation landscape in mice and men.N端蛋白质组学和核糖体分析提供了小鼠和人类中可变翻译起始情况的全面视图。
Mol Cell Proteomics. 2014 May;13(5):1245-61. doi: 10.1074/mcp.M113.036442. Epub 2014 Mar 12.
3
Deep proteome coverage based on ribosome profiling aids mass spectrometry-based protein and peptide discovery and provides evidence of alternative translation products and near-cognate translation initiation events.

本文引用的文献

1
Multiple sequence alignment: in pursuit of homologous DNA positions.多序列比对:寻找同源DNA位置。
Genome Res. 2007 Feb;17(2):127-35. doi: 10.1101/gr.5232407.
2
The ENCODE Project at UC Santa Cruz.加州大学圣克鲁兹分校的DNA元件百科全书计划。
Nucleic Acids Res. 2007 Jan;35(Database issue):D663-7. doi: 10.1093/nar/gkl1017. Epub 2006 Dec 13.
3
Why do human diversity levels vary at a megabase scale?为什么人类多样性水平在兆碱基尺度上会有所不同?
基于核糖体分析的深度蛋白质组覆盖可辅助基于质谱的蛋白质和肽发现,并提供替代翻译产物和近同源翻译起始事件的证据。
Mol Cell Proteomics. 2013 Jul;12(7):1780-90. doi: 10.1074/mcp.M113.027540. Epub 2013 Feb 21.
4
BigFoot: Bayesian alignment and phylogenetic footprinting with MCMC.大脚怪:使用马尔可夫链蒙特卡罗方法进行贝叶斯比对和系统发育足迹分析。
BMC Evol Biol. 2009 Aug 28;9:217. doi: 10.1186/1471-2148-9-217.
5
Understanding the molecular epidemiology of foot-and-mouth-disease virus.了解口蹄疫病毒的分子流行病学。
Infect Genet Evol. 2009 Mar;9(2):153-61. doi: 10.1016/j.meegid.2008.11.005. Epub 2008 Nov 28.
Genome Res. 2005 Sep;15(9):1222-31. doi: 10.1101/gr.3461105.
4
Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes.脊椎动物、昆虫、蠕虫和酵母基因组中的进化保守元件。
Genome Res. 2005 Aug;15(8):1034-50. doi: 10.1101/gr.3715005. Epub 2005 Jul 15.
5
Subtree power analysis and species selection for comparative genomics.用于比较基因组学的子树功率分析和物种选择
Proc Natl Acad Sci U S A. 2005 May 31;102(22):7900-5. doi: 10.1073/pnas.0502790102. Epub 2005 May 23.
6
Systematic discovery of regulatory motifs in human promoters and 3' UTRs by comparison of several mammals.通过比较多种哺乳动物系统地发现人类启动子和3'非翻译区中的调控基序。
Nature. 2005 Mar 17;434(7031):338-45. doi: 10.1038/nature03441. Epub 2005 Feb 27.
7
A model of the statistical power of comparative genome sequence analysis.比较基因组序列分析的统计功效模型。
PLoS Biol. 2005 Jan;3(1):e10. doi: 10.1371/journal.pbio.0030010. Epub 2005 Jan 4.
8
Highly conserved non-coding sequences are associated with vertebrate development.高度保守的非编码序列与脊椎动物发育相关。
PLoS Biol. 2005 Jan;3(1):e7. doi: 10.1371/journal.pbio.0030007. Epub 2004 Nov 11.
9
Aligning multiple genomic sequences with the threaded blockset aligner.使用线程化块集比对器对多个基因组序列进行比对。
Genome Res. 2004 Apr;14(4):708-15. doi: 10.1101/gr.1933104.
10
MAVID: constrained ancestral alignment of multiple sequences.MAVID:多条序列的受限祖先比对
Genome Res. 2004 Apr;14(4):693-9. doi: 10.1101/gr.1960404.