• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于比较EST文库中聚类结构的贝叶斯非参数方法。

A Bayesian nonparametric approach for comparing clustering structures in EST libraries.

作者信息

Lijoi Antonio, Mena Ramsés H, Prünster Igor

机构信息

Department of Economics and Quantitative Methods, University of Pavia, Pavia, Italy.

出版信息

J Comput Biol. 2008 Dec;15(10):1315-27. doi: 10.1089/cmb.2008.0043.

DOI:10.1089/cmb.2008.0043
PMID:19040366
Abstract

Inference for Expressed Sequence Tags (ESTs) data is considered. We focus on evaluating the redundancy of a cDNA library and, more importantly, on comparing different libraries on the basis of their clustering structure. The numerical results we achieve allow us to assess the effect of an error correction procedure for EST data and to study the compatibility of single EST libraries with respect to merged ones. The proposed method is based on a Bayesian nonparametric approach that allows to understand the clustering mechanism that generates the observed data. As specific nonparametric model we use the two parameter Poisson-Dirichlet (PD) process. The PD process represents a tractable nonparametric prior which is a natural candidate for modeling data arising from discrete distributions. It allows prediction and testing in order to analyze the clustering structure featured by the data. We show how a full Bayesian analysis can be performed and describe the corresponding computational algorithm.

摘要

考虑对表达序列标签(ESTs)数据进行推断。我们专注于评估cDNA文库的冗余性,更重要的是,基于其聚类结构比较不同的文库。我们获得的数值结果使我们能够评估EST数据纠错程序的效果,并研究单个EST文库与合并文库的兼容性。所提出的方法基于贝叶斯非参数方法,该方法能够理解生成观测数据的聚类机制。作为特定的非参数模型,我们使用双参数泊松 - 狄利克雷(PD)过程。PD过程代表一种易于处理的非参数先验,它是对离散分布产生的数据进行建模的自然候选者。它允许进行预测和测试,以便分析数据所具有的聚类结构。我们展示了如何进行全贝叶斯分析并描述了相应的计算算法。

相似文献

1
A Bayesian nonparametric approach for comparing clustering structures in EST libraries.一种用于比较EST文库中聚类结构的贝叶斯非参数方法。
J Comput Biol. 2008 Dec;15(10):1315-27. doi: 10.1089/cmb.2008.0043.
2
A Bayesian nonparametric method for prediction in EST analysis.一种用于EST分析预测的贝叶斯非参数方法。
BMC Bioinformatics. 2007 Sep 14;8:339. doi: 10.1186/1471-2105-8-339.
3
RBR: library-less repeat detection for ESTs.RBR:用于ESTs的无文库重复序列检测
Bioinformatics. 2006 Sep 15;22(18):2232-6. doi: 10.1093/bioinformatics/btl368. Epub 2006 Jul 12.
4
Rediscovery of Good-Turing estimators via Bayesian nonparametrics.通过贝叶斯非参数方法重新发现古德-图灵估计器
Biometrics. 2016 Mar;72(1):136-45. doi: 10.1111/biom.12366. Epub 2015 Jul 29.
5
[A new method for EST clustering].[一种用于EST聚类的新方法]
Yi Chuan Xue Bao. 2003 Feb;30(2):147-53.
6
Statistical modeling of sequencing errors in SAGE libraries.SAGE文库中测序错误的统计建模
Bioinformatics. 2004 Aug 4;20 Suppl 1:i31-9. doi: 10.1093/bioinformatics/bth924.
7
Gene capture prediction and overlap estimation in EST sequencing from one or multiple libraries.来自一个或多个文库的EST测序中的基因捕获预测与重叠估计。
BMC Bioinformatics. 2005 Dec 13;6:300. doi: 10.1186/1471-2105-6-300.
8
EST clustering error evaluation and correction.EST聚类错误评估与校正。
Bioinformatics. 2004 Nov 22;20(17):2973-84. doi: 10.1093/bioinformatics/bth342. Epub 2004 Jun 9.
9
Parallel hash-based EST clustering algorithm for gene sequencing.用于基因测序的基于哈希的并行EST聚类算法
DNA Cell Biol. 2004 Oct;23(10):615-23. doi: 10.1089/dna.2004.23.615.
10
Estimating and comparing the rates of gene discovery and expressed sequence tag (EST) frequencies in EST surveys.在EST调查中估计并比较基因发现率和表达序列标签(EST)频率。
Bioinformatics. 2004 Sep 22;20(14):2279-87. doi: 10.1093/bioinformatics/bth239. Epub 2004 Apr 1.

引用本文的文献

1
Sparse graphs using exchangeable random measures.使用可交换随机测度的稀疏图。
J R Stat Soc Series B Stat Methodol. 2017 Nov;79(5):1295-1366. doi: 10.1111/rssb.12233. Epub 2017 Sep 23.
2
A Bayesian Semi-parametric Approach for the Differential Analysis of Sequence Counts Data.一种用于序列计数数据差异分析的贝叶斯半参数方法。
J R Stat Soc Ser C Appl Stat. 2014 Apr;63(3):385-404. doi: 10.1111/rssc.12041.