Suppr超能文献

快速近似基序统计

Fast approximate motif statistics.

作者信息

Nicodème P

机构信息

DKFZ Theoretische Bioinformatik, 69120 Heidelberg, Germany.

出版信息

J Comput Biol. 2001;8(3):235-48. doi: 10.1089/10665270152530836.

Abstract

We present in this article a fast approximate method for computing the statistics of a number of non-self-overlapping matches of motifs in a random text in the nonuniform Bernoulli model. This method is well suited for protein motifs where the probability of self-overlap of motifs is small. For 96% of the PROSITE motifs, the expectations of occurrences of the motifs in a 7-million-amino-acids random database are computed by the approximate method with less than 1% error when compared with the exact method. Processing of the whole PROSITE takes about 30 seconds with the approximate method. We apply this new method to a comparison of the C. elegans and S. cerevisiae proteomes.

摘要

在本文中,我们提出了一种快速近似方法,用于计算非均匀伯努利模型下随机文本中多个非自重叠基序匹配的统计量。该方法非常适合基序自重叠概率较小的蛋白质基序。对于96%的PROSITE基序,在一个700万个氨基酸的随机数据库中,通过近似方法计算得到的基序出现期望与精确方法相比,误差小于1%。使用近似方法处理整个PROSITE大约需要30秒。我们将这种新方法应用于秀丽隐杆线虫和酿酒酵母蛋白质组的比较。

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验