• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

赛格威 2.0:高斯混合模型和小批量训练。

Segway 2.0: Gaussian mixture models and minibatch training.

机构信息

Princess Margaret Cancer Centre, Toronto, ON M5G 1L7, Canada.

Engineering Physics Program, University of British Columbia, Vancouver, BC V6T 1Z1, Canada.

出版信息

Bioinformatics. 2018 Feb 15;34(4):669-671. doi: 10.1093/bioinformatics/btx603.

DOI:10.1093/bioinformatics/btx603
PMID:29028889
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5860603/
Abstract

SUMMARY

Segway performs semi-automated genome annotation, discovering joint patterns across multiple genomic signal datasets. We discuss a major new version of Segway and highlight its ability to model data with substantially greater accuracy. Major enhancements in Segway 2.0 include the ability to model data with a mixture of Gaussians, enabling capture of arbitrarily complex signal distributions, and minibatch training, leading to better learned parameters.

AVAILABILITY AND IMPLEMENTATION

Segway and its source code are freely available for download at http://segway.hoffmanlab.org. We have made available scripts (https://doi.org/10.5281/zenodo.802939) and datasets (https://doi.org/10.5281/zenodo.802906) for this paper's analysis.

CONTACT

michael.hoffman@utoronto.ca.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

Segway 执行半自动基因组注释,发现多个基因组信号数据集之间的联合模式。我们讨论了 Segway 的一个主要新版本,并强调了它能够更准确地对数据进行建模的能力。Segway 2.0 的主要增强功能包括能够使用混合高斯模型对数据进行建模,从而能够捕获任意复杂的信号分布,以及使用小批量训练,从而获得更好的学习参数。

可用性和实现

Segway 及其源代码可在 http://segway.hoffmanlab.org 免费下载。我们提供了用于本文分析的脚本(https://doi.org/10.5281/zenodo.802939)和数据集(https://doi.org/10.5281/zenodo.802906)。

联系人

michael.hoffman@utoronto.ca。

补充信息

补充数据可在“Bioinformatics”在线获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/96af/5860603/623e0be04bdf/btx603f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/96af/5860603/7cfe5e6fd277/btx603f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/96af/5860603/623e0be04bdf/btx603f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/96af/5860603/7cfe5e6fd277/btx603f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/96af/5860603/623e0be04bdf/btx603f2.jpg

相似文献

1
Segway 2.0: Gaussian mixture models and minibatch training.赛格威 2.0:高斯混合模型和小批量训练。
Bioinformatics. 2018 Feb 15;34(4):669-671. doi: 10.1093/bioinformatics/btx603.
2
DFAST: a flexible prokaryotic genome annotation pipeline for faster genome publication.DFAST:一个灵活的原核生物基因组注释管道,用于更快地发布基因组。
Bioinformatics. 2018 Mar 15;34(6):1037-1039. doi: 10.1093/bioinformatics/btx713.
3
Functional annotation of genomic variants in studies of late-onset Alzheimer's disease.迟发性阿尔茨海默病研究中基因组变异的功能注释。
Bioinformatics. 2018 Aug 15;34(16):2724-2731. doi: 10.1093/bioinformatics/bty177.
4
BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs.BUSCO:利用单拷贝同源基因评估基因组组装和注释的完整性。
Bioinformatics. 2015 Oct 1;31(19):3210-2. doi: 10.1093/bioinformatics/btv351. Epub 2015 Jun 9.
5
ppsPCP: a plant presence/absence variants scanner and pan-genome construction pipeline.ppsPCP:一种植物存在/缺失变体扫描和泛基因组构建管道。
Bioinformatics. 2019 Oct 15;35(20):4156-4158. doi: 10.1093/bioinformatics/btz168.
6
GLANET: genomic loci annotation and enrichment tool.GLANET:基因组位点注释和富集工具。
Bioinformatics. 2017 Sep 15;33(18):2818-2828. doi: 10.1093/bioinformatics/btx326.
7
EPIC-CoGe: managing and analyzing genomic data.EPIC-CoGe:管理和分析基因组数据。
Bioinformatics. 2018 Aug 1;34(15):2651-2653. doi: 10.1093/bioinformatics/bty106.
8
Chado controller: advanced annotation management with a community annotation system.Chado 控制器:具有社区注释系统的高级注释管理。
Bioinformatics. 2012 Apr 1;28(7):1054-6. doi: 10.1093/bioinformatics/bts046. Epub 2012 Jan 28.
9
SNiPA: an interactive, genetic variant-centered annotation browser.SNiPA:一个交互式的、以基因变异为中心的注释浏览器。
Bioinformatics. 2015 Apr 15;31(8):1334-6. doi: 10.1093/bioinformatics/btu779. Epub 2014 Nov 26.
10
In-depth annotation of SNPs arising from resequencing projects using NGS-SNP.使用 NGS-SNP 对重测序项目产生的 SNPs 进行深度注释。
Bioinformatics. 2011 Aug 15;27(16):2300-1. doi: 10.1093/bioinformatics/btr372. Epub 2011 Jun 22.

引用本文的文献

1
Systems immunology approaches to study T cells in health and disease.系统免疫学方法研究健康和疾病中的 T 细胞。
NPJ Syst Biol Appl. 2024 Oct 9;10(1):117. doi: 10.1038/s41540-024-00446-1.
2
Genome wide clustering on integrated chromatin states and Micro-C contacts reveals chromatin interaction signatures.基于整合染色质状态和Micro-C接触的全基因组聚类揭示了染色质相互作用特征。
NAR Genom Bioinform. 2024 Oct 3;6(4):lqae136. doi: 10.1093/nargab/lqae136. eCollection 2024 Sep.
3
EpiSegMix: a flexible distribution hidden Markov model with duration modeling for chromatin state discovery.

本文引用的文献

1
The ensembl regulatory build.Ensembl调控构建
Genome Biol. 2015 Mar 24;16(1):56. doi: 10.1186/s13059-015-0621-5.
2
Integrative annotation of chromatin elements from ENCODE data.整合 ENCODE 数据中的染色质元件注释
Nucleic Acids Res. 2013 Jan;41(2):827-41. doi: 10.1093/nar/gks1284. Epub 2012 Dec 5.
3
GENCODE: the reference human genome annotation for The ENCODE Project.GENCODE:ENCODE 项目的人类参考基因组注释。
EpiSegMix:一种具有持续时间建模功能的灵活分布隐马尔可夫模型,用于发现染色质状态。
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae178.
4
Robust chromatin state annotation.稳健的染色质状态注释。
Genome Res. 2024 Apr 25;34(3):469-483. doi: 10.1101/gr.278343.123.
5
Toward a comprehensive catalog of regulatory elements.构建调控元件的综合目录。
Hum Genet. 2023 Aug;142(8):1091-1111. doi: 10.1007/s00439-023-02519-3. Epub 2023 Mar 19.
6
Computational methods to explore chromatin state dynamics.计算方法探索染色质状态动力学。
Brief Bioinform. 2022 Nov 19;23(6). doi: 10.1093/bib/bbac439.
7
Segmentation and genome annotation algorithms for identifying chromatin state and other genomic patterns.用于识别染色质状态和其他基因组模式的分割和基因组注释算法。
PLoS Comput Biol. 2021 Oct 14;17(10):e1009423. doi: 10.1371/journal.pcbi.1009423. eCollection 2021 Oct.
8
NucHMM: a method for quantitative modeling of nucleosome organization identifying functional nucleosome states distinctly associated with splicing potentiality.NucHMM:一种定量建模核小体组织的方法,可识别与剪接潜能明显相关的功能核小体状态。
Genome Biol. 2021 Aug 26;22(1):250. doi: 10.1186/s13059-021-02465-1.
9
Fused in sarcoma regulates DNA replication timing and kinetics.融合肉瘤中调节 DNA 复制时间和动力学。
J Biol Chem. 2021 Sep;297(3):101049. doi: 10.1016/j.jbc.2021.101049. Epub 2021 Aug 8.
10
Search and comparison of (epi)genomic feature patterns in multiple genome browser tracks.在多个基因组浏览器轨迹中搜索和比较(表观)基因组特征模式。
BMC Bioinformatics. 2020 Oct 19;21(1):464. doi: 10.1186/s12859-020-03781-2.
Genome Res. 2012 Sep;22(9):1760-74. doi: 10.1101/gr.135350.111.
4
An integrated encyclopedia of DNA elements in the human genome.人类基因组中 DNA 元件的综合百科全书。
Nature. 2012 Sep 6;489(7414):57-74. doi: 10.1038/nature11247.
5
Unsupervised pattern discovery in human chromatin structure through genomic segmentation.通过基因组分割实现人类染色质结构的无监督模式发现。
Nat Methods. 2012 Mar 18;9(5):473-6. doi: 10.1038/nmeth.1937.
6
ChromHMM: automating chromatin-state discovery and characterization.ChromHMM:染色质状态发现与特征描述自动化
Nat Methods. 2012 Feb 28;9(3):215-6. doi: 10.1038/nmeth.1906.
7
A new non-Hodgkin's B-cell line (DoHH2) with a chromosomal translocation t(14;18)(q32;q21).一种新的非霍奇金B细胞系(DoHH2),伴有染色体易位t(14;18)(q32;q21)。
Leukemia. 1991 Mar;5(3):221-4.