• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

glactools:用于管理基因型可能性和等位基因计数的命令行工具集。

glactools: a command-line toolset for the management of genotype likelihoods and allele counts.

机构信息

Department of Evolutionary Genetics, Max Planck Institute for Evolutionary Anthropology, Leipzig 04103, Germany.

出版信息

Bioinformatics. 2018 Apr 15;34(8):1398-1400. doi: 10.1093/bioinformatics/btx749.

DOI:10.1093/bioinformatics/btx749
PMID:29186325
Abstract

MOTIVATION

Research projects involving population genomics routinely need to store genotyping information, population allele counts, combine files from different samples, query the data and export it to various formats. This is often done using bespoke in-house scripts, which cannot be easily adapted to new projects and seldom constitute reproducible workflows.

RESULTS

We introduce glactools, a set of command-line utilities that can import data from genotypes or population-wide allele counts into an intermediate representation, compute various operations on it and export the data to several file formats used by population genetics software. This intermediate format can take two forms, one to store per-individual genotype likelihoods and a second for allele counts from one or more individuals. glactools allows users to perform operations such as intersecting datasets, merging individuals into populations, creating subsets, perform queries (e.g. return sites where a given population does not share an allele with a second one) and compute summary statistics to answer biologically relevant questions.

AVAILABILITY AND IMPLEMENTATION

glactools is freely available for use under the GPL. It requires a C ++ compiler and the htslib library. The source code and the instructions about how to download test data are available on the website (https://grenaud.github.io/glactools/).

CONTACT

gabriel.reno@gmail.com.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

涉及群体基因组学的研究项目通常需要存储基因分型信息、群体等位基因计数、组合来自不同样本的文件、查询数据并将其导出到各种格式。这通常是使用定制的内部脚本完成的,这些脚本不容易适应新项目,并且很少构成可重复的工作流程。

结果

我们引入了 glactools,这是一组命令行实用程序,可以将基因型或全人群等位基因计数数据导入到中间表示形式中,对其进行各种操作,并将数据导出到群体遗传学软件使用的几种文件格式。这种中间格式可以采用两种形式,一种用于存储每个个体的基因型似然,另一种用于存储一个或多个个体的等位基因计数。glactools 允许用户执行诸如数据集交集、将个体合并到群体中、创建子集、执行查询(例如,返回给定群体与第二个群体没有共享等位基因的位点)和计算汇总统计信息以回答生物学上相关的问题。

可用性和实现

glactools 可根据 GPL 免费使用。它需要 C++编译器和 htslib 库。源代码和有关如何下载测试数据的说明可在网站上获得(https://grenaud.github.io/glactools/)。

联系人

gabriel.reno@gmail.com。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
glactools: a command-line toolset for the management of genotype likelihoods and allele counts.glactools:用于管理基因型可能性和等位基因计数的命令行工具集。
Bioinformatics. 2018 Apr 15;34(8):1398-1400. doi: 10.1093/bioinformatics/btx749.
2
Simulating Illumina metagenomic data with InSilicoSeq.用 InSilicoSeq 模拟 Illumina 宏基因组数据。
Bioinformatics. 2019 Feb 1;35(3):521-522. doi: 10.1093/bioinformatics/bty630.
3
XSI-a genotype compression tool for compressive genomics in large biobanks.XSI-a 基因型压缩工具,用于大型生物库中的压缩基因组学。
Bioinformatics. 2022 Aug 2;38(15):3778-3784. doi: 10.1093/bioinformatics/btac413.
4
The Pop-Gen Pipeline Platform: A Software Platform for Population Genomic Analyses.Pop-Gen 管道平台:一个用于群体基因组分析的软件平台。
Mol Biol Evol. 2021 Jul 29;38(8):3478-3485. doi: 10.1093/molbev/msab113.
5
SNP genotyping and parameter estimation in polyploids using low-coverage sequencing data.使用低覆盖度测序数据进行多倍体的 SNP 基因分型和参数估计。
Bioinformatics. 2018 Feb 1;34(3):407-415. doi: 10.1093/bioinformatics/btx587.
6
ASAFE: ancestry-specific allele frequency estimation.ASAFE:特定血统等位基因频率估计。
Bioinformatics. 2016 Jul 15;32(14):2227-9. doi: 10.1093/bioinformatics/btw220. Epub 2016 May 3.
7
ngsLD: evaluating linkage disequilibrium using genotype likelihoods.ngsLD:使用基因型似然评估连锁不平衡。
Bioinformatics. 2019 Oct 1;35(19):3855-3856. doi: 10.1093/bioinformatics/btz200.
8
Estimating IBD tracts from low coverage NGS data.从低覆盖度 NGS 数据估算 IBD 片段。
Bioinformatics. 2016 Jul 15;32(14):2096-102. doi: 10.1093/bioinformatics/btw212. Epub 2016 Apr 22.
9
Discoal: flexible coalescent simulations with selection.Discoal:带选择的灵活合并模拟
Bioinformatics. 2016 Dec 15;32(24):3839-3841. doi: 10.1093/bioinformatics/btw556. Epub 2016 Aug 24.
10
Seqminer2: an efficient tool to query and retrieve genotypes for statistical genetics analyses from biobank scale sequence dataset.Seqminer2:一种高效的工具,可从生物库规模的序列数据集中查询和检索用于统计遗传学分析的基因型。
Bioinformatics. 2020 Dec 8;36(19):4951-4954. doi: 10.1093/bioinformatics/btaa628.

引用本文的文献

1
HLA diversity and signatures of selection in the Maniq, a nomadic hunter-gatherer population in Southern Thailand.泰国南部游牧狩猎采集人群玛尼格人的HLA多样性与选择特征
Immunogenetics. 2025 Jun 9;77(1):23. doi: 10.1007/s00251-025-01380-0.
2
Natural selection and adaptive traits in the Maniq, a nomadic hunter-gatherer society from Mainland Southeast Asia.来自东南亚大陆的游牧狩猎采集社会马尼格人的自然选择与适应性特征。
Sci Rep. 2025 Feb 9;15(1):4809. doi: 10.1038/s41598-024-83657-0.
3
Whole-genome sequencing of the invasive golden apple snail Pomacea canaliculata from Asia reveals rapid expansion and adaptive evolution.
亚洲入侵性福寿螺的全基因组测序揭示了其快速扩张和适应性进化。
Gigascience. 2024 Jan 2;13. doi: 10.1093/gigascience/giae064.
4
Genomic diversity landscapes in outcrossing and selfing Caenorhabditis nematodes.异交和自交秀丽隐杆线虫的基因组多样性景观。
PLoS Genet. 2023 Aug 16;19(8):e1010879. doi: 10.1371/journal.pgen.1010879. eCollection 2023 Aug.
5
Balancing selection on an MYB transcription factor maintains the twig trichome color variation in Melastoma normale.在野牡丹科植物野牡丹中,一个 MYB 转录因子上的平衡选择维持了侧枝刚毛颜色的多样性。
BMC Biol. 2023 May 24;21(1):122. doi: 10.1186/s12915-023-01611-4.
6
The roles of balancing selection and recombination in the evolution of rattlesnake venom.平衡选择和重组在响尾蛇毒液进化中的作用。
Nat Ecol Evol. 2022 Sep;6(9):1367-1380. doi: 10.1038/s41559-022-01829-5. Epub 2022 Jul 18.
7
Comparative Population Genomics of Cryptic Speciation and Adaptive Divergence in Bicknell's and Gray-Cheeked Thrushes (Aves: Catharus bicknelli and Catharus minimus).比氏弯嘴鸫和灰颊山雀(雀形目:卡塔勒斯·比克内利和卡塔勒斯·米尼默斯)隐秘物种形成和适应性分歧的比较种群基因组学。
Genome Biol Evol. 2022 Jan 4;14(1). doi: 10.1093/gbe/evab255.
8
Genetic diversity in the IZUMO1-JUNO protein-receptor pair involved in human reproduction.人类生殖中涉及的 IZUMO1-JUNO 蛋白-受体对的遗传多样性。
PLoS One. 2021 Dec 8;16(12):e0260692. doi: 10.1371/journal.pone.0260692. eCollection 2021.
9
Candidates for Balancing Selection in Leishmania donovani Complex Parasites.杜氏利什曼原虫复合体寄生虫中处于平衡选择的候选者。
Genome Biol Evol. 2021 Dec 1;13(12). doi: 10.1093/gbe/evab265.
10
Thousands of Qatari genomes inform human migration history and improve imputation of Arab haplotypes.数千份卡塔尔人基因组信息揭示了人类的迁徙历史,并提高了对阿拉伯人单倍型的推断。
Nat Commun. 2021 Oct 12;12(1):5929. doi: 10.1038/s41467-021-25287-y.