• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Vcfexpress:用于筛选和格式化VCF文件的灵活、快速的用户表达式。

Vcfexpress: flexible, rapid user-expressions to filter and format VCFs.

作者信息

Pedersen Brent S, Quinlan Aaron R

机构信息

Department of Human Genetics, University of Utah, Salt Lake City, UT 84112, United States.

出版信息

Bioinformatics. 2025 Mar 4;41(3). doi: 10.1093/bioinformatics/btaf097.

DOI:10.1093/bioinformatics/btaf097
PMID:40037622
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11904302/
Abstract

MOTIVATION

Variant call format (VCF) files are the standard output format for various software tools that identify genetic variation from DNA sequencing experiments. Downstream analyses require the ability to query, filter, and modify them simply and efficiently. Several tools are available to perform these operations from the command line, including BCFTools, vembrane, slivar, and others.

RESULTS

Here, we introduce vcfexpress, a new, high-performance toolset for the analysis of VCF files, written in the Rust programming language. It is nearly as fast as BCFTools, but adds functionality to execute user expressions in the lua programming language for precise filtering and reporting of variants from a VCF or BCF file. We demonstrate performance and flexibility by comparing vcfexpress to other tools using the vembrane benchmark.

AVAILABILITY AND IMPLEMENTATION

vcfexpress is available under the MIT license at https://github.com/brentp/vcfexpress with code used for the manuscript deposited in https://doi.org/10.5281/zenodo.14756838.

摘要

动机

变异调用格式(VCF)文件是各种从DNA测序实验中识别基因变异的软件工具的标准输出格式。下游分析需要能够简单高效地查询、过滤和修改这些文件。有几种工具可从命令行执行这些操作,包括BCFTools、vembrane、slivar等。

结果

在此,我们介绍vcfexpress,这是一个用于分析VCF文件的全新高性能工具集,用Rust编程语言编写。它的速度几乎与BCFTools一样快,但增加了用Lua编程语言执行用户表达式的功能,以便从VCF或BCF文件中精确过滤和报告变异。我们通过使用vembrane基准测试将vcfexpress与其他工具进行比较,展示了它的性能和灵活性。

可用性与实现

vcfexpress根据MIT许可协议可在https://github.com/brentp/vcfexpress获取,用于撰写本文的代码存于https://doi.org/10.5281/zenodo.14756838。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a562/11904302/4bce3da722a1/btaf097f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a562/11904302/4bce3da722a1/btaf097f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a562/11904302/4bce3da722a1/btaf097f1.jpg

相似文献

1
Vcfexpress: flexible, rapid user-expressions to filter and format VCFs.Vcfexpress:用于筛选和格式化VCF文件的灵活、快速的用户表达式。
Bioinformatics. 2025 Mar 4;41(3). doi: 10.1093/bioinformatics/btaf097.
2
Vcfexpress: flexible, rapid user-expressions to filter and format VCFs.Vcfexpress:用于筛选和格式化VCF文件的灵活、快速的用户表达式。
bioRxiv. 2024 Nov 7:2024.11.05.622129. doi: 10.1101/2024.11.05.622129.
3
Insane in the vembrane: filtering and transforming VCF/BCF files.膜上疯狂:过滤和转换 VCF/BCF 文件。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac810.
4
cyvcf2: fast, flexible variant analysis with Python.cyvcf2:使用Python进行快速、灵活的变异分析。
Bioinformatics. 2017 Jun 15;33(12):1867-1869. doi: 10.1093/bioinformatics/btx057.
5
VCF-Server: A web-based visualization tool for high-throughput variant data mining and management.VCF-Server:一个基于网络的高通量变异数据挖掘和管理的可视化工具。
Mol Genet Genomic Med. 2019 Jul;7(7):e00641. doi: 10.1002/mgg3.641. Epub 2019 May 24.
6
vcfpp: a C++ API for rapid processing of the variant call format.vcfpp:一种用于快速处理变异调用格式的 C++ API。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae049.
7
Bigtools: a high-performance BigWig and BigBed library in Rust.Bigtools:一个用 Rust 编写的高性能 BigWig 和 BigBed 库。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae350.
8
vcfgl: a flexible genotype likelihood simulator for VCF/BCF files.vcfgl:用于VCF/BCF文件的灵活基因型似然模拟器。
Bioinformatics. 2025 Mar 29;41(4). doi: 10.1093/bioinformatics/btaf098.
9
GVAF: generalized, flexible filtering software for annotated variant files.GVAF:用于注释变异文件的通用、灵活的过滤软件。
Genes Genomics. 2024 Dec;46(12):1487-1493. doi: 10.1007/s13258-024-01580-0. Epub 2024 Oct 12.
10
VCF-kit: assorted utilities for the variant call format.VCF工具包:用于变异调用格式的各种实用工具。
Bioinformatics. 2017 May 15;33(10):1581-1582. doi: 10.1093/bioinformatics/btx011.

本文引用的文献

1
Insane in the vembrane: filtering and transforming VCF/BCF files.膜上疯狂:过滤和转换 VCF/BCF 文件。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac810.
2
A spectrum of free software tools for processing the VCF variant call format: vcflib, bio-vcf, cyvcf2, hts-nim and slivar.用于处理 VCF 变体调用格式的一系列免费软件工具:vcflib、bio-vcf、cyvcf2、hts-nim 和 slivar。
PLoS Comput Biol. 2022 May 31;18(5):e1009123. doi: 10.1371/journal.pcbi.1009123. eCollection 2022 May.
3
Effective variant filtering and expected candidate variant yield in studies of rare human disease.
罕见人类疾病研究中的有效变异筛选及预期候选变异产出
NPJ Genom Med. 2021 Jul 15;6(1):60. doi: 10.1038/s41525-021-00227-3.
4
HTSlib: C library for reading/writing high-throughput sequencing data.HTSlib:用于读取/写入高通量测序数据的 C 库。
Gigascience. 2021 Feb 16;10(2). doi: 10.1093/gigascience/giab007.
5
Twelve years of SAMtools and BCFtools.SAMtools 和 BCFtools 十二年。
Gigascience. 2021 Feb 16;10(2). doi: 10.1093/gigascience/giab008.
6
The Ensembl Variant Effect Predictor.Ensembl变异效应预测器。
Genome Biol. 2016 Jun 6;17(1):122. doi: 10.1186/s13059-016-0974-4.
7
A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3.一个用于注释和预测单核苷酸多态性影响的程序,即SnpEff:黑腹果蝇品系w1118、iso-2、iso-3基因组中的单核苷酸多态性。
Fly (Austin). 2012 Apr-Jun;6(2):80-92. doi: 10.4161/fly.19695.
8
Using Drosophila melanogaster as a Model for Genotoxic Chemical Mutational Studies with a New Program, SnpSift.利用黑腹果蝇作为模式生物,借助新程序SnpSift进行遗传毒性化学诱变研究。
Front Genet. 2012 Mar 15;3:35. doi: 10.3389/fgene.2012.00035. eCollection 2012.
9
The variant call format and VCFtools.变异调用格式和 VCFtools。
Bioinformatics. 2011 Aug 1;27(15):2156-8. doi: 10.1093/bioinformatics/btr330. Epub 2011 Jun 7.