• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于分析阵列比较基因组杂交(array CGH)数据的分割/聚类模型。

A segmentation/clustering model for the analysis of array CGH data.

作者信息

Picard F, Robin S, Lebarbier E, Daudin J-J

机构信息

UMR INA P-G/ENGREF/INRA MIA 518, Paris, France.

出版信息

Biometrics. 2007 Sep;63(3):758-66. doi: 10.1111/j.1541-0420.2006.00729.x.

DOI:10.1111/j.1541-0420.2006.00729.x
PMID:17825008
Abstract

Microarray-CGH (comparative genomic hybridization) experiments are used to detect and map chromosomal imbalances. A CGH profile can be viewed as a succession of segments that represent homogeneous regions in the genome whose representative sequences share the same relative copy number on average. Segmentation methods constitute a natural framework for the analysis, but they do not provide a biological status for the detected segments. We propose a new model for this segmentation/clustering problem, combining a segmentation model with a mixture model. We present a new hybrid algorithm called dynamic programming-expectation maximization (DP-EM) to estimate the parameters of the model by maximum likelihood. This algorithm combines DP and the EM algorithm. We also propose a model selection heuristic to select the number of clusters and the number of segments. An example of our procedure is presented, based on publicly available data sets. We compare our method to segmentation methods and to hidden Markov models, and we show that the new segmentation/clustering model is a promising alternative that can be applied in the more general context of signal processing.

摘要

微阵列比较基因组杂交(CGH)实验用于检测和定位染色体失衡。CGH图谱可视为一系列代表基因组中均匀区域的片段,其代表性序列平均具有相同的相对拷贝数。分割方法构成了分析的自然框架,但它们没有为检测到的片段提供生物学状态。我们针对此分割/聚类问题提出了一种新模型,将分割模型与混合模型相结合。我们提出了一种名为动态规划期望最大化(DP-EM)的新混合算法,通过最大似然估计模型参数。该算法结合了DP和EM算法。我们还提出了一种模型选择启发式方法来选择聚类数和片段数。基于公开可用数据集给出了我们方法的一个示例。我们将我们的方法与分割方法和隐马尔可夫模型进行比较,结果表明新的分割/聚类模型是一种有前途的替代方法,可应用于更一般的信号处理背景中。

相似文献

1
A segmentation/clustering model for the analysis of array CGH data.一种用于分析阵列比较基因组杂交(array CGH)数据的分割/聚类模型。
Biometrics. 2007 Sep;63(3):758-66. doi: 10.1111/j.1541-0420.2006.00729.x.
2
Integrating copy number polymorphisms into array CGH analysis using a robust HMM.使用稳健的隐马尔可夫模型将拷贝数多态性整合到阵列比较基因组杂交分析中。
Bioinformatics. 2006 Jul 15;22(14):e431-9. doi: 10.1093/bioinformatics/btl238.
3
Continuous-index hidden Markov modelling of array CGH copy number data.阵列比较基因组杂交拷贝数数据的连续索引隐马尔可夫模型
Bioinformatics. 2007 Apr 15;23(8):1006-14. doi: 10.1093/bioinformatics/btm059. Epub 2007 Feb 19.
4
Robust smooth segmentation approach for array CGH data analysis.用于阵列比较基因组杂交数据分析的稳健平滑分割方法。
Bioinformatics. 2007 Sep 15;23(18):2463-9. doi: 10.1093/bioinformatics/btm359. Epub 2007 Jul 27.
5
Analysis of array CGH data for cancer studies using fused quantile regression.使用融合分位数回归分析用于癌症研究的阵列比较基因组杂交数据。
Bioinformatics. 2007 Sep 15;23(18):2470-6. doi: 10.1093/bioinformatics/btm364. Epub 2007 Jul 20.
6
A supervised hidden markov model framework for efficiently segmenting tiling array data in transcriptional and chIP-chip experiments: systematically incorporating validated biological knowledge.一种用于在转录和芯片免疫沉淀实验中有效分割平铺阵列数据的监督隐马尔可夫模型框架:系统地整合经过验证的生物学知识。
Bioinformatics. 2006 Dec 15;22(24):3016-24. doi: 10.1093/bioinformatics/btl515. Epub 2006 Oct 12.
7
BioHMM: a heterogeneous hidden Markov model for segmenting array CGH data.BioHMM:一种用于分割阵列比较基因组杂交数据的异构隐马尔可夫模型。
Bioinformatics. 2006 May 1;22(9):1144-6. doi: 10.1093/bioinformatics/btl089. Epub 2006 Mar 13.
8
A mixture model with random-effects components for clustering correlated gene-expression profiles.一种具有随机效应成分的混合模型,用于对相关基因表达谱进行聚类。
Bioinformatics. 2006 Jul 15;22(14):1745-52. doi: 10.1093/bioinformatics/btl165. Epub 2006 May 3.
9
Detection of gene copy number changes in CGH microarrays using a spatially correlated mixture model.使用空间相关混合模型检测比较基因组杂交微阵列中的基因拷贝数变化。
Bioinformatics. 2006 Apr 15;22(8):911-8. doi: 10.1093/bioinformatics/btl035. Epub 2006 Feb 2.
10
Stochastic segmentation models for array-based comparative genomic hybridization data analysis.用于基于阵列的比较基因组杂交数据分析的随机分割模型
Biostatistics. 2008 Apr;9(2):290-307. doi: 10.1093/biostatistics/kxm031. Epub 2007 Sep 12.

引用本文的文献

1
DiffSegR: an RNA-seq data driven method for differential expression analysis using changepoint detection.DiffSegR:一种基于RNA测序数据,利用变点检测进行差异表达分析的方法。
NAR Genom Bioinform. 2023 Nov 6;5(4):lqad098. doi: 10.1093/nargab/lqad098. eCollection 2023 Dec.
2
How to fit transfer models to learning data: a segmentation/clustering approach.如何将迁移模型拟合到学习数据中:一种分割/聚类方法。
Behav Res Methods. 2024 Mar;56(3):2549-2568. doi: 10.3758/s13428-023-02166-6. Epub 2023 Jul 17.
3
High throughput genotyping of structural variations in a complex plant genome using an original Affymetrix® axiom® array.
利用原始的 Affymetrix® axiom® 阵列对复杂植物基因组中的结构变异进行高通量基因分型。
BMC Genomics. 2019 Nov 13;20(1):848. doi: 10.1186/s12864-019-6136-9.
4
Genomic region detection via Spatial Convex Clustering.通过空间凸包聚类进行基因组区域检测。
PLoS One. 2018 Sep 11;13(9):e0203007. doi: 10.1371/journal.pone.0203007. eCollection 2018.
5
iSeg: an efficient algorithm for segmentation of genomic and epigenomic data.iSeg:一种用于基因组和表观基因组数据分割的高效算法。
BMC Bioinformatics. 2018 Apr 11;19(1):131. doi: 10.1186/s12859-018-2140-3.
6
Detecting changes in the annual movements of terrestrial migratory species: using the first-passage time to document the spring migration of caribou.检测陆地迁徙物种年度迁徙模式的变化:利用首次通过时间记录驯鹿的春季迁徙。
Mov Ecol. 2014 Aug 1;2:19. doi: 10.1186/s40462-014-0019-0. eCollection 2014.
7
A HIERARCHICAL BAYESIAN MODEL FOR INFERENCE OF COPY NUMBER VARIANTS AND THEIR ASSOCIATION TO GENE EXPRESSION.用于推断拷贝数变异及其与基因表达关联的分层贝叶斯模型。
Ann Appl Stat. 2014 Mar 1;8(1):148-175. doi: 10.1214/13-AOAS705.
8
Robust regression analysis of copy number variation data based on a univariate score.基于单变量评分的拷贝数变异数据稳健回归分析。
PLoS One. 2014 Feb 7;9(2):e86272. doi: 10.1371/journal.pone.0086272. eCollection 2014.
9
Identifying multiple change points in a linear mixed effects model.在线性混合效应模型中识别多个变化点。
Stat Med. 2014 Mar 15;33(6):1015-28. doi: 10.1002/sim.5996. Epub 2013 Sep 30.
10
Fast detection of de novo copy number variants from SNP arrays for case-parent trios.基于 SNP 芯片的先证者-父母三体型检测新发拷贝数变异的快速方法。
BMC Bioinformatics. 2012 Dec 12;13:330. doi: 10.1186/1471-2105-13-330.