• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

vcfpp:一种用于快速处理变异调用格式的 C++ API。

vcfpp: a C++ API for rapid processing of the variant call format.

机构信息

Section for Computational and RNA Biology, University of Copenhagen, Copenhagen 2200, Denmark.

出版信息

Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae049.

DOI:10.1093/bioinformatics/btae049
PMID:38273677
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10868310/
Abstract

MOTIVATION

Given the widespread use of the variant call format (VCF/BCF) coupled with continuous surge in big data, there remains a perpetual demand for fast and flexible methods to manipulate these comprehensive formats across various programming languages.

RESULTS

This work presents vcfpp, a C++ API of HTSlib in a single file, providing an intuitive interface to manipulate VCF/BCF files rapidly and safely, in addition to being portable. Moreover, this work introduces the vcfppR package to demonstrate the development of a high-performance R package with vcfpp, allowing for rapid and straightforward variants analyses.

AVAILABILITY AND IMPLEMENTATION

vcfpp is available from https://github.com/Zilong-Li/vcfpp under MIT license. vcfppR is available from https://cran.r-project.org/web/packages/vcfppR.

摘要

动机

鉴于变体调用格式 (VCF/BCF) 的广泛使用以及大数据的持续激增,人们一直需要快速灵活的方法来跨各种编程语言处理这些综合格式。

结果

这项工作提出了 vcfpp,它是 HTSlib 的一个 C++ API,包含在单个文件中,提供了一个直观的接口,可以快速、安全地处理 VCF/BCF 文件,并且可移植。此外,这项工作还引入了 vcfppR 包,以展示如何使用 vcfpp 开发高性能的 R 包,从而实现快速、直接的变体分析。

可用性和实现

vcfpp 可从 https://github.com/Zilong-Li/vcfpp 获得,遵循 MIT 许可证。vcfppR 可从 https://cran.r-project.org/web/packages/vcfppR 获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a8e/10868310/f23dcd06b9b9/btae049f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a8e/10868310/f23dcd06b9b9/btae049f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a8e/10868310/f23dcd06b9b9/btae049f1.jpg

相似文献

1
vcfpp: a C++ API for rapid processing of the variant call format.vcfpp:一种用于快速处理变异调用格式的 C++ API。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae049.
2
cyvcf2: fast, flexible variant analysis with Python.cyvcf2:使用Python进行快速、灵活的变异分析。
Bioinformatics. 2017 Jun 15;33(12):1867-1869. doi: 10.1093/bioinformatics/btx057.
3
SeqArray-a storage-efficient high-performance data format for WGS variant calls.SeqArray——一种用于全基因组测序变异检测的存储高效的高性能数据格式。
Bioinformatics. 2017 Aug 1;33(15):2251-2257. doi: 10.1093/bioinformatics/btx145.
4
Insane in the vembrane: filtering and transforming VCF/BCF files.膜上疯狂:过滤和转换 VCF/BCF 文件。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac810.
5
vcf2gwas: Python API for comprehensive GWAS analysis using GEMMA.vcf2gwas:使用 GEMMA 进行全面 GWAS 分析的 Python API。
Bioinformatics. 2022 Jan 12;38(3):839-840. doi: 10.1093/bioinformatics/btab710.
6
vcfr: a package to manipulate and visualize variant call format data in R.vcfr:一个用于在R中处理和可视化变异调用格式数据的软件包。
Mol Ecol Resour. 2017 Jan;17(1):44-53. doi: 10.1111/1755-0998.12549. Epub 2016 Jul 12.
7
VCFshiny: an R/Shiny application for interactively analyzing and visualizing genetic variants.VCFshiny:一款用于交互式分析和可视化基因变异的R/Shiny应用程序。
Bioinform Adv. 2023 Aug 26;3(1):vbad107. doi: 10.1093/bioadv/vbad107. eCollection 2023.
8
HTSlib: C library for reading/writing high-throughput sequencing data.HTSlib:用于读取/写入高通量测序数据的 C 库。
Gigascience. 2021 Feb 16;10(2). doi: 10.1093/gigascience/giab007.
9
re-Searcher: GUI-based bioinformatics tool for simplified genomics data mining of VCF files.再搜索者:用于简化VCF文件基因组学数据挖掘的基于图形用户界面的生物信息学工具。
PeerJ. 2021 May 3;9:e11333. doi: 10.7717/peerj.11333. eCollection 2021.
10
rbioapi: user-friendly R interface to biologic web services' API.rbioapi:生物信息学网络服务 API 的用户友好型 R 接口。
Bioinformatics. 2022 May 13;38(10):2952-2953. doi: 10.1093/bioinformatics/btac172.

引用本文的文献

1
Genetic architecture in Greenland is shaped by demography, structure and selection.格陵兰岛的遗传结构受人口统计学、结构和选择的影响。
Nature. 2025 Mar;639(8054):404-410. doi: 10.1038/s41586-024-08516-4. Epub 2025 Feb 12.

本文引用的文献

1
Syllable-PBWT for space-efficient haplotype long-match query.基于音节的 PBWT 用于高效空间的单倍型长匹配查询。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac734.
2
High-coverage whole-genome sequencing of the expanded 1000 Genomes Project cohort including 602 trios.对扩展的 1000 基因组项目队列进行高覆盖率全基因组测序,包括 602 个三核苷酸重复序列。
Cell. 2022 Sep 1;185(18):3426-3440.e19. doi: 10.1016/j.cell.2022.08.004.
3
A spectrum of free software tools for processing the VCF variant call format: vcflib, bio-vcf, cyvcf2, hts-nim and slivar.
用于处理 VCF 变体调用格式的一系列免费软件工具:vcflib、bio-vcf、cyvcf2、hts-nim 和 slivar。
PLoS Comput Biol. 2022 May 31;18(5):e1009123. doi: 10.1371/journal.pcbi.1009123. eCollection 2022 May.
4
Rapid genotype imputation from sequence with reference panels.基于参考面板的序列快速基因型推断。
Nat Genet. 2021 Jul;53(7):1104-1111. doi: 10.1038/s41588-021-00877-0. Epub 2021 Jun 3.
5
HTSlib: C library for reading/writing high-throughput sequencing data.HTSlib:用于读取/写入高通量测序数据的 C 库。
Gigascience. 2021 Feb 16;10(2). doi: 10.1093/gigascience/giab007.
6
hts-nim: scripting high-performance genomic analyses.hts-nim:高性能基因组分析脚本编写。
Bioinformatics. 2018 Oct 1;34(19):3387-3389. doi: 10.1093/bioinformatics/bty358.
7
cyvcf2: fast, flexible variant analysis with Python.cyvcf2:使用Python进行快速、灵活的变异分析。
Bioinformatics. 2017 Jun 15;33(12):1867-1869. doi: 10.1093/bioinformatics/btx057.
8
vcfr: a package to manipulate and visualize variant call format data in R.vcfr:一个用于在R中处理和可视化变异调用格式数据的软件包。
Mol Ecol Resour. 2017 Jan;17(1):44-53. doi: 10.1111/1755-0998.12549. Epub 2016 Jul 12.
9
Rapid genotype imputation from sequence without reference panels.无需参考面板即可从序列中快速进行基因型推算。
Nat Genet. 2016 Aug;48(8):965-969. doi: 10.1038/ng.3594. Epub 2016 Jul 4.
10
The variant call format and VCFtools.变异调用格式和 VCFtools。
Bioinformatics. 2011 Aug 1;27(15):2156-8. doi: 10.1093/bioinformatics/btr330. Epub 2011 Jun 7.