• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

OpenVariant:一个用于解析和操作多种输入文件格式的工具包。

OpenVariant: a toolkit to parse and operate multiple input file formats.

作者信息

Martínez-Millán David, Brando Federica, L Grau Miguel, Sánchez-Guixé Mònica, López-Elorduy Carlos, Reyes-Salazar Iker, Deu-Pons Jordi, López-Bigas Núria, González-Pérez Abel

机构信息

Institute for Research in Biomedicine (IRB Barcelona), The Barcelona Institute of Science and Technology, Barcelona, 08028, Spain.

Centro de Investigación Biomédica en Red en Cáncer (CIBERONC), Instituto de Salud Carlos III, Madrid, 28029, Spain.

出版信息

Bioinformatics. 2024 Nov 28;40(12). doi: 10.1093/bioinformatics/btae714.

DOI:10.1093/bioinformatics/btae714
PMID:39663244
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11634536/
Abstract

SUMMARY

Advances in high-throughput DNA sequencing technologies and decreasing costs have fueled the identification of small genetic variants (such as single nucleotide variants and indels) across tumors. Despite efforts to standardize variant formats and vocabularies, many sources of variability persist across databases and computational tools that annotate variants, hindering their integration within cancer genomic analyses. In this context, we present OpenVariant, an easily extendable Python package that facilitates seamless reading, parsing and refinement of diverse input file formats in a customizable structure, all within a single process.

AVAILABILITY AND IMPLEMENTATION

OpenVariant is an open-source package available at https://github.com/bbglab/openvariant. Documentation may be found at https://openvariant.readthedocs.io.

摘要

摘要

高通量DNA测序技术的进步和成本的降低推动了肿瘤中小基因变异(如单核苷酸变异和插入缺失)的识别。尽管在规范变异格式和词汇方面做出了努力,但在注释变异的数据库和计算工具中,仍存在许多变异性来源,这阻碍了它们在癌症基因组分析中的整合。在此背景下,我们展示了OpenVariant,这是一个易于扩展的Python包,它能在单个进程中以可定制的结构促进对多种输入文件格式进行无缝读取、解析和优化。

可用性和实现方式

OpenVariant是一个开源包,可在https://github.com/bbglab/openvariant获取。文档可在https://openvariant.readthedocs.io找到。

相似文献

1
OpenVariant: a toolkit to parse and operate multiple input file formats.OpenVariant:一个用于解析和操作多种输入文件格式的工具包。
Bioinformatics. 2024 Nov 28;40(12). doi: 10.1093/bioinformatics/btae714.
2
mgikit: demultiplexing toolkit for MGI fastq files.mgikit:用于 MGI fastq 文件的解复用工具包。
Bioinformatics. 2024 Sep 2;40(9). doi: 10.1093/bioinformatics/btae554.
3
Genomation: a toolkit to summarize, annotate and visualize genomic intervals.Genomation:一个用于总结、注释和可视化基因组区间的工具包。
Bioinformatics. 2015 Apr 1;31(7):1127-9. doi: 10.1093/bioinformatics/btu775. Epub 2014 Nov 21.
4
Tracy: basecalling, alignment, assembly and deconvolution of sanger chromatogram trace files.泰西:桑格色谱迹线文件的碱基调用、比对、组装和解卷积。
BMC Genomics. 2020 Mar 14;21(1):230. doi: 10.1186/s12864-020-6635-8.
5
htsint: a Python library for sequencing pipelines that combines data through gene set generation.htsint:一个用于测序流程的Python库,通过基因集生成来整合数据。
BMC Bioinformatics. 2015 Sep 24;16:307. doi: 10.1186/s12859-015-0729-3.
6
DrivR-Base: a feature extraction toolkit for variant effect prediction model construction.DrivR-Base:用于构建变异效应预测模型的特征提取工具包。
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae197.
7
NGS-pipe: a flexible, easily extendable and highly configurable framework for NGS analysis.NGS-pipe:一个灵活、易于扩展且高度可配置的 NGS 分析框架。
Bioinformatics. 2018 Jan 1;34(1):107-108. doi: 10.1093/bioinformatics/btx540.
8
TAPES: A tool for assessment and prioritisation in exome studies.TAPES:外显子组研究中的评估和优先级工具。
PLoS Comput Biol. 2019 Oct 15;15(10):e1007453. doi: 10.1371/journal.pcbi.1007453. eCollection 2019 Oct.
9
Integrative pipeline for profiling DNA copy number and inferring tumor phylogeny.用于分析 DNA 拷贝数和推断肿瘤系统发育的综合分析流程。
Bioinformatics. 2018 Jun 15;34(12):2126-2128. doi: 10.1093/bioinformatics/bty057.
10
Variant Review with the Integrative Genomics Viewer.使用综合基因组浏览器进行变异审查。
Cancer Res. 2017 Nov 1;77(21):e31-e34. doi: 10.1158/0008-5472.CAN-17-0337.

引用本文的文献

1
Oncodrive3D: fast and accurate detection of structural clusters of somatic mutations under positive selection.Oncodrive3D:快速准确地检测正选择下体细胞突变的结构簇
Nucleic Acids Res. 2025 Aug 11;53(15). doi: 10.1093/nar/gkaf776.

本文引用的文献

1
The GA4GH Variation Representation Specification: A computational framework for variation representation and federated identification.GA4GH变异表示规范:变异表示与联合识别的计算框架。
Cell Genom. 2021 Nov 10;1(2). doi: 10.1016/j.xgen.2021.100027.
2
In silico saturation mutagenesis of cancer genes.癌症基因的计算机饱和诱变。
Nature. 2021 Aug;596(7872):428-432. doi: 10.1038/s41586-021-03771-1. Epub 2021 Jul 28.
3
A compendium of mutational cancer driver genes.癌症驱动基因突变综合分析
Nat Rev Cancer. 2020 Oct;20(10):555-572. doi: 10.1038/s41568-020-0290-x. Epub 2020 Aug 10.
4
Integrated Informatics Analysis of Cancer-Related Variants.癌症相关变异的综合信息学分析
JCO Clin Cancer Inform. 2020 Mar;4:310-317. doi: 10.1200/CCI.19.00132.
5
Pan-cancer analysis of whole genomes.泛癌症全基因组分析。
Nature. 2020 Feb;578(7793):82-93. doi: 10.1038/s41586-020-1969-6. Epub 2020 Feb 5.
6
Maftools: efficient and comprehensive analysis of somatic variants in cancer.Maftools:癌症体细胞变异的高效全面分析。
Genome Res. 2018 Nov;28(11):1747-1756. doi: 10.1101/gr.239244.118. Epub 2018 Oct 19.
7
ClinGen Allele Registry links information about genetic variants.ClinGen 变异基因登记库链接有关遗传变异的信息。
Hum Mutat. 2018 Nov;39(11):1690-1701. doi: 10.1002/humu.23637.
8
Comprehensive Characterization of Cancer Driver Genes and Mutations.全面描绘癌症驱动基因和突变。
Cell. 2018 Apr 5;173(2):371-385.e18. doi: 10.1016/j.cell.2018.02.060.
9
Cancer Genome Interpreter annotates the biological and clinical relevance of tumor alterations.癌症基因组解读器注释肿瘤改变的生物学和临床相关性。
Genome Med. 2018 Mar 28;10(1):25. doi: 10.1186/s13073-018-0531-8.
10
The Ensembl Variant Effect Predictor.Ensembl变异效应预测器。
Genome Biol. 2016 Jun 6;17(1):122. doi: 10.1186/s13059-016-0974-4.