Suppr超能文献

Crypt4GH:一种支持对加密数据进行原生访问的文件格式标准。

Crypt4GH: a file format standard enabling native access to encrypted data.

作者信息

Senf Alexander, Davies Robert, Haziza Frédéric, Marshall John, Troncoso-Pastoriza Juan, Hofmann Oliver, Keane Thomas M

机构信息

European Bioinformatics Institute, Wellcome Genome Campus, Hinxton CB10 1SD, UK.

Enthought, Inc., 200 W Cesar Chavez, Suite 202, Austin, TX 78701, USA.

出版信息

Bioinformatics. 2021 Sep 9;37(17):2753-2754. doi: 10.1093/bioinformatics/btab087.

Abstract

MOTIVATION

The majority of genome analysis tools and pipelines require data to be decrypted for access. This potentially leaves sensitive genetic data exposed, either because the unencrypted data is not removed after analysis, or because the data leaves traces on the permanent storage medium.

RESULTS

: We defined a file container specification enabling direct byte-level compatible random access to encrypted genetic data stored in community standards such as SAM/BAM/CRAM/VCF/BCF. By standardizing this format, we show how it can be added as a native file format to genomic libraries, enabling direct analysis of encrypted data without the need to create a decrypted copy.

AVAILABILITY AND IMPLEMENTATION

The Crypt4GH specification can be found at: http://samtools.github.io/hts-specs/crypt4gh.pdf.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

大多数基因组分析工具和流程需要对数据进行解密才能访问。这可能会使敏感的遗传数据暴露,原因要么是分析后未删除未加密的数据,要么是数据在永久存储介质上留下了痕迹。

结果

我们定义了一种文件容器规范,能够对存储在诸如SAM/BAM/CRAM/VCF/BCF等社区标准中的加密遗传数据进行直接的字节级兼容随机访问。通过对这种格式进行标准化,我们展示了如何将其作为一种原生文件格式添加到基因组库中,从而能够直接分析加密数据,而无需创建解密副本。

可用性与实现

Crypt4GH规范可在以下网址找到:http://samtools.github.io/hts-specs/crypt4gh.pdf。

补充信息

补充数据可在《生物信息学》在线版获取。

相似文献

2
CRAM 3.1: advances in the CRAM file format.CRAM 3.1:CRAM 文件格式的新进展。
Bioinformatics. 2022 Mar 4;38(6):1497-1503. doi: 10.1093/bioinformatics/btac010.
4
Genozip: a universal extensible genomic data compressor.Genozip:一种通用的可扩展基因组数据压缩器。
Bioinformatics. 2021 Aug 25;37(16):2225-2230. doi: 10.1093/bioinformatics/btab102.
7
The Scramble conversion tool.加扰转换工具。
Bioinformatics. 2014 Oct;30(19):2818-9. doi: 10.1093/bioinformatics/btu390. Epub 2014 Jun 14.
8
The DNA methylation haplotype (mHap) format and mHapTools.DNA 甲基化单体型(mHap)格式和 mHapTools。
Bioinformatics. 2021 Dec 11;37(24):4892-4894. doi: 10.1093/bioinformatics/btab458.
10
htsget: a protocol for securely streaming genomic data.htsget:一种安全流式传输基因组数据的协议。
Bioinformatics. 2019 Jan 1;35(1):119-121. doi: 10.1093/bioinformatics/bty492.

引用本文的文献

8
The European Genome-phenome Archive in 2021.2021 年的欧洲基因组-表型数据库。
Nucleic Acids Res. 2022 Jan 7;50(D1):D980-D987. doi: 10.1093/nar/gkab1059.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验