• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于分析阵列比较基因组杂交数据的更快的循环二元分割算法。

A faster circular binary segmentation algorithm for the analysis of array CGH data.

作者信息

Venkatraman E S, Olshen Adam B

机构信息

Department of Epidemiology and Biostatistics, Memorial Sloan-Kettering Cancer Center, 1275 York Avenue, New York, NY 10021, USA.

出版信息

Bioinformatics. 2007 Mar 15;23(6):657-63. doi: 10.1093/bioinformatics/btl646. Epub 2007 Jan 18.

DOI:10.1093/bioinformatics/btl646
PMID:17234643
Abstract

MOTIVATION

Array CGH technologies enable the simultaneous measurement of DNA copy number for thousands of sites on a genome. We developed the circular binary segmentation (CBS) algorithm to divide the genome into regions of equal copy number. The algorithm tests for change-points using a maximal t-statistic with a permutation reference distribution to obtain the corresponding P-value. The number of computations required for the maximal test statistic is O(N2), where N is the number of markers. This makes the full permutation approach computationally prohibitive for the newer arrays that contain tens of thousands markers and highlights the need for a faster algorithm.

RESULTS

We present a hybrid approach to obtain the P-value of the test statistic in linear time. We also introduce a rule for stopping early when there is strong evidence for the presence of a change. We show through simulations that the hybrid approach provides a substantial gain in speed with only a negligible loss in accuracy and that the stopping rule further increases speed. We also present the analyses of array CGH data from breast cancer cell lines to show the impact of the new approaches on the analysis of real data.

AVAILABILITY

An R version of the CBS algorithm has been implemented in the "DNAcopy" package of the Bioconductor project. The proposed hybrid method for the P-value is available in version 1.2.1 or higher and the stopping rule for declaring a change early is available in version 1.5.1 or higher.

摘要

动机

阵列比较基因组杂交(Array CGH)技术能够同时测量基因组上千个位点的DNA拷贝数。我们开发了循环二元分割(CBS)算法,将基因组划分为拷贝数相等的区域。该算法使用带有置换参考分布的最大t统计量来检验变化点,以获得相应的P值。最大检验统计量所需的计算量为O(N2),其中N是标记的数量。这使得全置换方法对于包含数万个标记的新型阵列在计算上难以实现,凸显了对更快算法的需求。

结果

我们提出了一种混合方法,能在线性时间内获得检验统计量的P值。我们还引入了一条规则,当有强有力的证据表明存在变化时提前停止。通过模拟我们表明,混合方法在速度上有显著提升,而准确性仅有可忽略不计的损失,并且停止规则进一步提高了速度。我们还展示了对乳腺癌细胞系阵列CGH数据的分析,以说明新方法对实际数据分析的影响。

可用性

CBS算法的R版本已在Bioconductor项目的“DNAcopy”包中实现。用于P值的拟议混合方法在1.2.1或更高版本中可用,提前声明变化的停止规则在1.5.1或更高版本中可用。

相似文献

1
A faster circular binary segmentation algorithm for the analysis of array CGH data.一种用于分析阵列比较基因组杂交数据的更快的循环二元分割算法。
Bioinformatics. 2007 Mar 15;23(6):657-63. doi: 10.1093/bioinformatics/btl646. Epub 2007 Jan 18.
2
Robust smooth segmentation approach for array CGH data analysis.用于阵列比较基因组杂交数据分析的稳健平滑分割方法。
Bioinformatics. 2007 Sep 15;23(18):2463-9. doi: 10.1093/bioinformatics/btm359. Epub 2007 Jul 27.
3
A fast and flexible method for the segmentation of aCGH data.一种用于阵列比较基因组杂交(aCGH)数据分割的快速灵活方法。
Bioinformatics. 2008 Aug 15;24(16):i139-45. doi: 10.1093/bioinformatics/btn272.
4
A segmentation/clustering model for the analysis of array CGH data.一种用于分析阵列比较基因组杂交(array CGH)数据的分割/聚类模型。
Biometrics. 2007 Sep;63(3):758-66. doi: 10.1111/j.1541-0420.2006.00729.x.
5
Integrating copy number polymorphisms into array CGH analysis using a robust HMM.使用稳健的隐马尔可夫模型将拷贝数多态性整合到阵列比较基因组杂交分析中。
Bioinformatics. 2006 Jul 15;22(14):e431-9. doi: 10.1093/bioinformatics/btl238.
6
Analysis of array CGH data for cancer studies using fused quantile regression.使用融合分位数回归分析用于癌症研究的阵列比较基因组杂交数据。
Bioinformatics. 2007 Sep 15;23(18):2470-6. doi: 10.1093/bioinformatics/btm364. Epub 2007 Jul 20.
7
CGHPRO -- a comprehensive data analysis tool for array CGH.CGHPRO——一种用于阵列比较基因组杂交的综合数据分析工具。
BMC Bioinformatics. 2005 Apr 5;6:85. doi: 10.1186/1471-2105-6-85.
8
CGHcall: calling aberrations for array CGH tumor profiles.CGHcall:用于阵列比较基因组杂交肿瘤图谱的畸变检测
Bioinformatics. 2007 Apr 1;23(7):892-4. doi: 10.1093/bioinformatics/btm030. Epub 2007 Jan 31.
9
ITALICS: an algorithm for normalization and DNA copy number calling for Affymetrix SNP arrays.斜体:一种用于Affymetrix SNP阵列归一化和DNA拷贝数调用的算法。
Bioinformatics. 2008 Mar 15;24(6):768-74. doi: 10.1093/bioinformatics/btn048. Epub 2008 Feb 5.
10
Stochastic segmentation models for array-based comparative genomic hybridization data analysis.用于基于阵列的比较基因组杂交数据分析的随机分割模型
Biostatistics. 2008 Apr;9(2):290-307. doi: 10.1093/biostatistics/kxm031. Epub 2007 Sep 12.

引用本文的文献

1
Chromosome engineering to correct a complex rearrangement on Chromosome 8 reveals the effects of 8p syndrome on gene expression and neural differentiation.通过染色体工程纠正8号染色体上的复杂重排揭示了8p综合征对基因表达和神经分化的影响。
bioRxiv. 2025 Aug 22:2024.11.17.624023. doi: 10.1101/2024.11.17.624023.
2
Proteogenomic analysis of the CALGB 40601 (Alliance) HER2+ breast cancer neoadjuvant trial reveals resistance biomarkers.CALGB 40601(联盟)HER2阳性乳腺癌新辅助试验的蛋白质基因组分析揭示了耐药生物标志物。
Cell Rep Med. 2025 Jun 17;6(6):102154. doi: 10.1016/j.xcrm.2025.102154. Epub 2025 Jun 5.
3
In situ structure of the mouse sperm central apparatus reveals mechanistic insights into asthenozoospermia.
小鼠精子中央装置的原位结构揭示了弱精子症的机制见解。
Cell Res. 2025 Jun 5. doi: 10.1038/s41422-025-01135-2.
4
SAVANA: reliable analysis of somatic structural variants and copy number aberrations using long-read sequencing.SAVANA:利用长读长测序技术对体细胞结构变异和拷贝数畸变进行可靠分析。
Nat Methods. 2025 May 28. doi: 10.1038/s41592-025-02708-0.
5
EMcnv: enhancing CNV detection performance through ensemble strategies with heterogeneous meta-graph neural networks.EMcnv:通过使用异构元图神经网络的集成策略提高拷贝数变异(CNV)检测性能。
Brief Bioinform. 2025 Mar 4;26(2). doi: 10.1093/bib/bbaf135.
6
Benchmarking copy number aberrations inference tools using single-cell multi-omics datasets.使用单细胞多组学数据集对拷贝数变异推断工具进行基准测试。
Brief Bioinform. 2025 Mar 4;26(2). doi: 10.1093/bib/bbaf076.
7
Longitudinal Profiling of Circulating Tumor DNA Reveals the Evolutionary Dynamics of Metastatic Prostate Cancer during Serial Therapy.循环肿瘤DNA的纵向分析揭示了转移性前列腺癌在序贯治疗期间的进化动力学。
Cancer Res. 2025 May 2;85(9):1680-1695. doi: 10.1158/0008-5472.CAN-24-1943.
8
Molecular and pharmacological heterogeneity of ETV6::RUNX1 acute lymphoblastic leukemia.ETV6::RUNX1急性淋巴细胞白血病的分子与药理学异质性
Nat Commun. 2025 Jan 29;16(1):1153. doi: 10.1038/s41467-025-56229-7.
9
Molecular clustering on ctDNA improves the prognostic stratification of patients with DLBCL compared with ctDNA levels.与循环肿瘤DNA(ctDNA)水平相比,ctDNA上的分子聚类改善了弥漫性大B细胞淋巴瘤(DLBCL)患者的预后分层。
Blood Adv. 2025 Apr 8;9(7):1692-1701. doi: 10.1182/bloodadvances.2024014136.
10
Replication stress increases de novo CNVs across the malaria parasite genome.复制应激增加了疟原虫基因组中的新生拷贝数变异。
bioRxiv. 2024 Dec 31:2024.12.19.629492. doi: 10.1101/2024.12.19.629492.