• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CrossMap:一种用于基因组组装之间坐标转换的通用工具。

CrossMap: a versatile tool for coordinate conversion between genome assemblies.

机构信息

Department of Bioinformatics and Computational Biology, The University of Texas MD Anderson Cancer Center, Houston, TX 77030, USA, Division of Biomedical Statistics and Informatics, Mayo Clinic College of Medicine, Rochester, MN 55905, USA and Department of Biochemistry and Molecular Biology, Mayo Clinic College of Medicine, Rochester, MN 55905, USA.

出版信息

Bioinformatics. 2014 Apr 1;30(7):1006-7. doi: 10.1093/bioinformatics/btt730. Epub 2013 Dec 18.

DOI:10.1093/bioinformatics/btt730
PMID:24351709
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3967108/
Abstract

MOTIVATION

Reference genome assemblies are subject to change and refinement from time to time. Generally, researchers need to convert the results that have been analyzed according to old assemblies to newer versions, or vice versa, to facilitate meta-analysis, direct comparison, data integration and visualization. Several useful conversion tools can convert genome interval files in browser extensible data or general feature format, but none have the functionality to convert files in sequence alignment map or BigWig format. This is a significant gap in computational genomics tools, as these formats are the ones most widely used for representing high-throughput sequencing data, such as RNA-seq, chromatin immunoprecipitation sequencing, DNA-seq, etc.

RESULTS

Here we developed CrossMap, a versatile and efficient tool for converting genome coordinates between assemblies. CrossMap supports most of the commonly used file formats, including BAM, sequence alignment map, Wiggle, BigWig, browser extensible data, general feature format, gene transfer format and variant call format.

AVAILABILITY AND IMPLEMENTATION

CrossMap is written in Python and C. Source code and a comprehensive user's manual are freely available at: http://crossmap.sourceforge.net/.

摘要

动机

参考基因组组装会不时地进行更改和完善。通常,研究人员需要将根据旧组装进行分析的结果转换为新版本,或者反之亦然,以促进元分析、直接比较、数据集成和可视化。有几个有用的转换工具可以转换浏览器可扩展数据或通用特征格式中的基因组区间文件,但没有一个工具具有转换序列比对图或 BigWig 格式文件的功能。这是计算基因组学工具中的一个重大空白,因为这些格式是最常用于表示高通量测序数据的格式,例如 RNA-seq、染色质免疫沉淀测序、DNA-seq 等。

结果

在这里,我们开发了 CrossMap,这是一种用于在组装之间转换基因组坐标的通用且高效的工具。CrossMap 支持大多数常用的文件格式,包括 BAM、序列比对图、Wiggle、BigWig、浏览器可扩展数据、通用特征格式、基因转移格式和变异调用格式。

可用性和实现

CrossMap 是用 Python 和 C 编写的。源代码和全面的用户手册可在以下网址免费获得:http://crossmap.sourceforge.net/。

相似文献

1
CrossMap: a versatile tool for coordinate conversion between genome assemblies.CrossMap:一种用于基因组组装之间坐标转换的通用工具。
Bioinformatics. 2014 Apr 1;30(7):1006-7. doi: 10.1093/bioinformatics/btt730. Epub 2013 Dec 18.
2
FastRemap: a tool for quickly remapping reads between genome assemblies.FastRemap:一种快速在基因组组装之间重新映射读取的工具。
Bioinformatics. 2022 Sep 30;38(19):4633-4635. doi: 10.1093/bioinformatics/btac554.
3
The UCSC genome browser and associated tools.UCSC 基因组浏览器及相关工具。
Brief Bioinform. 2013 Mar;14(2):144-61. doi: 10.1093/bib/bbs038. Epub 2012 Aug 20.
4
Benchmark study comparing liftover tools for genome conversion of epigenome sequencing data.比较用于表观基因组测序数据基因组转换的Liftover工具的基准研究。
NAR Genom Bioinform. 2020 Aug 6;2(3):lqaa054. doi: 10.1093/nargab/lqaa054. eCollection 2020 Sep.
5
Track data hubs enable visualization of user-defined genome-wide annotations on the UCSC Genome Browser.轨迹数据枢纽允许在 UCSC 基因组浏览器上可视化用户定义的全基因组注释。
Bioinformatics. 2014 Apr 1;30(7):1003-5. doi: 10.1093/bioinformatics/btt637. Epub 2013 Nov 13.
6
BCFtools/liftover: an accurate and comprehensive tool to convert genetic variants across genome assemblies.BCFtools/liftover:一种准确全面的工具,可跨基因组组装转换遗传变异。
Bioinformatics. 2024 Jan 2;40(2). doi: 10.1093/bioinformatics/btae038.
7
bwtool: a tool for bigWig files.bwTool:一个用于 bigWig 文件的工具。
Bioinformatics. 2014 Jun 1;30(11):1618-9. doi: 10.1093/bioinformatics/btu056. Epub 2014 Jan 30.
8
SAMMate: a GUI tool for processing short read alignments in SAM/BAM format.SAMMate:一种用于处理SAM/BAM格式短读比对的图形用户界面工具。
Source Code Biol Med. 2011 Jan 13;6(1):2. doi: 10.1186/1751-0473-6-2.
9
SamQL: a structured query language and filtering tool for the SAM/BAM file format.SamQL:一种针对 SAM/BAM 文件格式的结构化查询语言和过滤工具。
BMC Bioinformatics. 2021 Oct 2;22(1):474. doi: 10.1186/s12859-021-04390-3.
10
HiCLift: a fast and efficient tool for converting chromatin interaction data between genome assemblies.HiCLift:一种用于在基因组组装之间转换染色质相互作用数据的快速高效工具。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad389.

引用本文的文献

1
Single-cell multiome and spatial profiling reveals pancreas cell type-specific gene regulatory programs of type 1 diabetes progression.单细胞多组学和空间分析揭示了1型糖尿病进展中胰腺细胞类型特异性基因调控程序。
Sci Adv. 2025 Sep 12;11(37):eady0080. doi: 10.1126/sciadv.ady0080. Epub 2025 Sep 10.
2
High-quality, haplotype-resolved reference genomes of the Dutch warmblood horse and Friesian horse using trio binning.使用三联体分箱法构建的荷兰温血马和弗里斯兰马的高质量、单倍型解析参考基因组。
BMC Genomics. 2025 Sep 1;26(1):790. doi: 10.1186/s12864-025-11985-0.
3
MEF2C controls segment-specific gene regulatory networks that direct heart tube morphogenesis.MEF2C控制指导心脏管形态发生的节段特异性基因调控网络。
Genes Dev. 2025 Aug 29. doi: 10.1101/gad.352889.125.
4
A Hitchhiker Guide to Structural Variant Calling: A Comprehensive Benchmark Through Different Sequencing Technologies.结构变异检测指南:通过不同测序技术的全面基准测试
Biomedicines. 2025 Aug 9;13(8):1949. doi: 10.3390/biomedicines13081949.
5
Splicing QTL mapping in stimulated macrophages associates low-usage splice junctions with immune-mediated disease risk.在受刺激的巨噬细胞中进行剪接定量性状位点定位,发现低使用频率的剪接接头与免疫介导疾病风险相关。
Nat Commun. 2025 Aug 27;16(1):7205. doi: 10.1038/s41467-025-61669-2.
6
Gene expression QTL mapping in stimulated iPSC-derived macrophages provides insights into common complex diseases.刺激诱导的多能干细胞衍生巨噬细胞中的基因表达定量性状位点图谱为常见复杂疾病提供了见解。
Nat Commun. 2025 Aug 27;16(1):7204. doi: 10.1038/s41467-025-61670-9.
7
The CGG triplet repeat binding protein 1 counteracts R-loop induced transcription-replication stress.CGG三联体重复结合蛋白1可对抗R环诱导的转录-复制应激。
EMBO Rep. 2025 Aug 26. doi: 10.1038/s44319-025-00550-1.
8
LncPTPred: predicting lncRNA-protein interaction based on crosslinking and immunoprecipitation (CLIP-Seq) data.LncPTPred:基于交联免疫沉淀(CLIP-Seq)数据预测长链非编码RNA与蛋白质的相互作用
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf432.
9
Microtubule mechanotransduction refines cytomegalovirus interactions with and remodeling of host chromatin.微管机械转导改善巨细胞病毒与宿主染色质的相互作用及对宿主染色质的重塑。
Nat Commun. 2025 Aug 13;16(1):7507. doi: 10.1038/s41467-025-62921-5.
10
Genetic variation at transcription factor binding sites largely explains phenotypic heritability in maize.转录因子结合位点的遗传变异在很大程度上解释了玉米的表型遗传性。
Nat Genet. 2025 Aug 11. doi: 10.1038/s41588-025-02246-7.

本文引用的文献

1
The UCSC genome browser and associated tools.UCSC 基因组浏览器及相关工具。
Brief Bioinform. 2013 Mar;14(2):144-61. doi: 10.1093/bib/bbs038. Epub 2012 Aug 20.
2
BigWig and BigBed: enabling browsing of large distributed datasets.BigWig 和 BigBed:支持浏览大型分布式数据集。
Bioinformatics. 2010 Sep 1;26(17):2204-7. doi: 10.1093/bioinformatics/btq351. Epub 2010 Jul 17.
3
Touring Ensembl: a practical guide to genome browsing.浏览 Ensembl:基因组浏览实用指南。
BMC Genomics. 2010 May 11;11:295. doi: 10.1186/1471-2164-11-295.
4
The Sequence Alignment/Map format and SAMtools.序列比对/映射格式和 SAMtools。
Bioinformatics. 2009 Aug 15;25(16):2078-9. doi: 10.1093/bioinformatics/btp352. Epub 2009 Jun 8.
5
Galaxy: a platform for interactive large-scale genome analysis.银河:一个用于交互式大规模基因组分析的平台。
Genome Res. 2005 Oct;15(10):1451-5. doi: 10.1101/gr.4086505. Epub 2005 Sep 16.
6
Initial sequencing and analysis of the human genome.人类基因组的初步测序与分析。
Nature. 2001 Feb 15;409(6822):860-921. doi: 10.1038/35057062.