Suppr超能文献

Crypt4GH:一种支持对加密数据进行原生访问的文件格式标准。

Crypt4GH: a file format standard enabling native access to encrypted data.

作者信息

Senf Alexander, Davies Robert, Haziza Frédéric, Marshall John, Troncoso-Pastoriza Juan, Hofmann Oliver, Keane Thomas M

机构信息

European Bioinformatics Institute, Wellcome Genome Campus, Hinxton CB10 1SD, UK.

Enthought, Inc., 200 W Cesar Chavez, Suite 202, Austin, TX 78701, USA.

出版信息

Bioinformatics. 2021 Sep 9;37(17):2753-2754. doi: 10.1093/bioinformatics/btab087.

Abstract

MOTIVATION

The majority of genome analysis tools and pipelines require data to be decrypted for access. This potentially leaves sensitive genetic data exposed, either because the unencrypted data is not removed after analysis, or because the data leaves traces on the permanent storage medium.

RESULTS

: We defined a file container specification enabling direct byte-level compatible random access to encrypted genetic data stored in community standards such as SAM/BAM/CRAM/VCF/BCF. By standardizing this format, we show how it can be added as a native file format to genomic libraries, enabling direct analysis of encrypted data without the need to create a decrypted copy.

AVAILABILITY AND IMPLEMENTATION

The Crypt4GH specification can be found at: http://samtools.github.io/hts-specs/crypt4gh.pdf.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

大多数基因组分析工具和流程需要对数据进行解密才能访问。这可能会使敏感的遗传数据暴露,原因要么是分析后未删除未加密的数据,要么是数据在永久存储介质上留下了痕迹。

结果

我们定义了一种文件容器规范,能够对存储在诸如SAM/BAM/CRAM/VCF/BCF等社区标准中的加密遗传数据进行直接的字节级兼容随机访问。通过对这种格式进行标准化,我们展示了如何将其作为一种原生文件格式添加到基因组库中,从而能够直接分析加密数据,而无需创建解密副本。

可用性与实现

Crypt4GH规范可在以下网址找到:http://samtools.github.io/hts-specs/crypt4gh.pdf。

补充信息

补充数据可在《生物信息学》在线版获取。

相似文献

2
CRAM 3.1: advances in the CRAM file format.CRAM 3.1:CRAM 文件格式的新进展。
Bioinformatics. 2022 Mar 4;38(6):1497-1503. doi: 10.1093/bioinformatics/btac010.
4
Genozip: a universal extensible genomic data compressor.Genozip:一种通用的可扩展基因组数据压缩器。
Bioinformatics. 2021 Aug 25;37(16):2225-2230. doi: 10.1093/bioinformatics/btab102.
7
The Scramble conversion tool.加扰转换工具。
Bioinformatics. 2014 Oct;30(19):2818-9. doi: 10.1093/bioinformatics/btu390. Epub 2014 Jun 14.
8
The DNA methylation haplotype (mHap) format and mHapTools.DNA 甲基化单体型(mHap)格式和 mHapTools。
Bioinformatics. 2021 Dec 11;37(24):4892-4894. doi: 10.1093/bioinformatics/btab458.
10
htsget: a protocol for securely streaming genomic data.htsget:一种安全流式传输基因组数据的协议。
Bioinformatics. 2019 Jan 1;35(1):119-121. doi: 10.1093/bioinformatics/bty492.

引用本文的文献

8
The European Genome-phenome Archive in 2021.2021 年的欧洲基因组-表型数据库。
Nucleic Acids Res. 2022 Jan 7;50(D1):D980-D987. doi: 10.1093/nar/gkab1059.

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验