• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

MBV:一种解决样本错误标记并检测大型组合基因型和测序分析数据集中技术偏差的方法。

MBV: a method to solve sample mislabeling and detect technical bias in large combined genotype and sequencing assay datasets.

作者信息

Fort Alexandre, Panousis Nikolaos I, Garieri Marco, Antonarakis Stylianos E, Lappalainen Tuuli, Dermitzakis Emmanouil T, Delaneau Olivier

机构信息

Department of Genetic Medicine and Development, University of Geneva Medical School, Geneva, Switzerland.

Swiss Institute of Bioinformatics, Lausanne, Switzerland.

出版信息

Bioinformatics. 2017 Jun 15;33(12):1895-1897. doi: 10.1093/bioinformatics/btx074.

DOI:10.1093/bioinformatics/btx074
PMID:28186259
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6044394/
Abstract

MOTIVATION

Large genomic datasets combining genotype and sequence data, such as for expression quantitative trait loci (eQTL) detection, require perfect matching between both data types.

RESULTS

We described here MBV (Match BAM to VCF); a method to quickly solve sample mislabeling and detect cross-sample contamination and PCR amplification bias.

AVAILABILITY AND IMPLEMENTATION

MBV is implemented in C ++ as an independent component of the QTLtools software package, the binary and source codes are freely available at https://qtltools.github.io/qtltools/ .

CONTACT

olivier.delaneau@unige.ch or emmanouil.dermitzakis@unige.ch.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

用于诸如表达数量性状基因座(eQTL)检测等结合基因型和序列数据的大型基因组数据集,要求两种数据类型之间完美匹配。

结果

我们在此描述了MBV(将BAM与VCF匹配);一种快速解决样本错误标记、检测跨样本污染和PCR扩增偏差的方法。

可用性与实现方式

MBV用C++实现,作为QTLtools软件包的一个独立组件,二进制文件和源代码可在https://qtltools.github.io/qtltools/ 免费获取。

联系方式

olivier.delaneau@unige.ch 或 emmanouil.dermitzakis@unige.ch。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
MBV: a method to solve sample mislabeling and detect technical bias in large combined genotype and sequencing assay datasets.MBV:一种解决样本错误标记并检测大型组合基因型和测序分析数据集中技术偏差的方法。
Bioinformatics. 2017 Jun 15;33(12):1895-1897. doi: 10.1093/bioinformatics/btx074.
2
FlashPCA2: principal component analysis of Biobank-scale genotype datasets.FlashPCA2:生物样本库规模基因型数据集的主成分分析
Bioinformatics. 2017 Sep 1;33(17):2776-2778. doi: 10.1093/bioinformatics/btx299.
3
Fast and efficient QTL mapper for thousands of molecular phenotypes.适用于数千种分子表型的快速高效QTL定位器。
Bioinformatics. 2016 May 15;32(10):1479-85. doi: 10.1093/bioinformatics/btv722. Epub 2015 Dec 26.
4
cyvcf2: fast, flexible variant analysis with Python.cyvcf2:使用Python进行快速、灵活的变异分析。
Bioinformatics. 2017 Jun 15;33(12):1867-1869. doi: 10.1093/bioinformatics/btx057.
5
Simple, rapid and accurate genotyping-by-sequencing from aligned whole genomes with ArrayMaker.使用ArrayMaker从比对的全基因组中进行简单、快速且准确的测序基因分型。
Bioinformatics. 2015 Feb 15;31(4):599-601. doi: 10.1093/bioinformatics/btu691. Epub 2014 Oct 21.
6
UpSetR: an R package for the visualization of intersecting sets and their properties.UpSetR:一个用于可视化相交集及其属性的 R 包。
Bioinformatics. 2017 Sep 15;33(18):2938-2940. doi: 10.1093/bioinformatics/btx364.
7
GTC: how to maintain huge genotype collections in a compressed form.GTC:如何以压缩形式保存大型基因型集合。
Bioinformatics. 2018 Jun 1;34(11):1834-1840. doi: 10.1093/bioinformatics/bty023.
8
Constructing linkage maps in the genomics era with MapDisto 2.0.在基因组学时代,利用 MapDisto 2.0 构建连锁图谱。
Bioinformatics. 2017 Jul 15;33(14):2224-2225. doi: 10.1093/bioinformatics/btx177.
9
VariantTools: an extensible framework for developing and testing variant callers.VariantTools:一个用于开发和测试变异调用程序的可扩展框架。
Bioinformatics. 2017 Oct 15;33(20):3311-3313. doi: 10.1093/bioinformatics/btx450.
10
Estimating error models for whole genome sequencing using mixtures of Dirichlet-multinomial distributions.使用狄利克雷多项分布的混合模型估计全基因组测序的误差模型。
Bioinformatics. 2017 Aug 1;33(15):2322-2329. doi: 10.1093/bioinformatics/btx133.

引用本文的文献

1
ABCA7 variants impact phosphatidylcholine and mitochondria in neurons.ABCA7基因变异影响神经元中的磷脂酰胆碱和线粒体。
Nature. 2025 Sep 10. doi: 10.1038/s41586-025-09520-y.
2
Splicing QTL mapping in stimulated macrophages associates low-usage splice junctions with immune-mediated disease risk.在受刺激的巨噬细胞中进行剪接定量性状位点定位,发现低使用频率的剪接接头与免疫介导疾病风险相关。
Nat Commun. 2025 Aug 27;16(1):7205. doi: 10.1038/s41467-025-61669-2.
3
Gene expression QTL mapping in stimulated iPSC-derived macrophages provides insights into common complex diseases.刺激诱导的多能干细胞衍生巨噬细胞中的基因表达定量性状位点图谱为常见复杂疾病提供了见解。
Nat Commun. 2025 Aug 27;16(1):7204. doi: 10.1038/s41467-025-61670-9.
4
A Transcriptomic Roadmap of Parkinson's Disease Progression at Single Cell Resolution.单细胞分辨率下帕金森病进展的转录组学路线图
medRxiv. 2025 Jul 30:2025.07.30.25332436. doi: 10.1101/2025.07.30.25332436.
5
Allele Specific Expression Quality Control Fills Critical Gap in Transcriptome Assisted Rare Variant Interpretation.等位基因特异性表达质量控制填补了转录组辅助罕见变异解读中的关键空白。
bioRxiv. 2025 Jun 8:2025.05.30.657086. doi: 10.1101/2025.05.30.657086.
6
Population-scale cross-disorder atlas of the human prefrontal cortex at single-cell resolution.单细胞分辨率下人类前额叶皮层的群体规模跨疾病图谱。
Sci Data. 2025 Jun 6;12(1):954. doi: 10.1038/s41597-025-04687-5.
7
A multi-omics resource of B cell activation reveals genetic mechanisms for immune-mediated diseases.一个B细胞激活的多组学资源揭示了免疫介导疾病的遗传机制。
medRxiv. 2025 Jun 14:2025.05.22.25328104. doi: 10.1101/2025.05.22.25328104.
8
Aortic valve-specific genes dysregulated in calcific aortic valve stenosis as potential biomarkers and therapeutic targets.在钙化性主动脉瓣狭窄中失调的主动脉瓣特异性基因作为潜在的生物标志物和治疗靶点。
HGG Adv. 2025 May 5;6(3):100448. doi: 10.1016/j.xhgg.2025.100448.
9
Integrative genomics sheds light on the immunogenetics of tuberculosis in cattle.整合基因组学揭示了牛结核病的免疫遗传学。
Commun Biol. 2025 Mar 24;8(1):479. doi: 10.1038/s42003-025-07846-x.
10
The contribution of genetic determinants of blood gene expression and splicing to molecular phenotypes and health outcomes.血液基因表达和剪接的遗传决定因素对分子表型和健康结果的贡献。
Nat Genet. 2025 Mar;57(3):616-625. doi: 10.1038/s41588-025-02096-3. Epub 2025 Mar 4.

本文引用的文献

1
A global reference for human genetic variation.人类遗传变异的全球参考。
Nature. 2015 Oct 1;526(7571):68-74. doi: 10.1038/nature15393.
2
Tools and best practices for data processing in allelic expression analysis.等位基因表达分析中数据处理的工具及最佳实践
Genome Biol. 2015 Sep 17;16(1):195. doi: 10.1186/s13059-015-0762-6.
3
Population Variation and Genetic Control of Modular Chromatin Architecture in Humans.人类模块化染色质结构的群体变异和遗传控制。
Cell. 2015 Aug 27;162(5):1039-50. doi: 10.1016/j.cell.2015.08.001. Epub 2015 Aug 20.
4
Reproducibility of high-throughput mRNA and small RNA sequencing across laboratories.高通量 mRNA 和 small RNA 测序在实验室间的可重复性。
Nat Biotechnol. 2013 Nov;31(11):1015-22. doi: 10.1038/nbt.2702. Epub 2013 Sep 15.
5
A tool for RNA sequencing sample identity check.用于 RNA 测序样本身份检查的工具。
Bioinformatics. 2013 Jun 1;29(11):1463-4. doi: 10.1093/bioinformatics/btt155. Epub 2013 Apr 4.
6
Detecting and estimating contamination of human DNA samples in sequencing and array-based genotype data.检测和估计测序和基于阵列的基因型数据中人 DNA 样本的污染。
Am J Hum Genet. 2012 Nov 2;91(5):839-48. doi: 10.1016/j.ajhg.2012.09.004. Epub 2012 Oct 25.
7
5' end-centered expression profiling using cap-analysis gene expression and next-generation sequencing.使用帽状分析基因表达和新一代测序进行 5' 端中心表达谱分析。
Nat Protoc. 2012 Feb 23;7(3):542-61. doi: 10.1038/nprot.2012.005.
8
Fast and accurate short read alignment with Burrows-Wheeler transform.使用Burrows-Wheeler变换进行快速准确的短读比对。
Bioinformatics. 2009 Jul 15;25(14):1754-60. doi: 10.1093/bioinformatics/btp324. Epub 2009 May 18.