• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ECOGEMS:利用整数稀疏矩阵高效压缩和检索 2058 份水稻种质资源的 SNP 数据。

ECOGEMS: efficient compression and retrieve of SNP data of 2058 rice accessions with integer sparse matrices.

机构信息

College of Life Sciences, Henan Agricultural University, Zhengzhou, China.

National Key Laboratory of Wheat and Maize Crop Science, Henan Agricultural University, Zhengzhou, China.

出版信息

Bioinformatics. 2019 Oct 15;35(20):4181-4183. doi: 10.1093/bioinformatics/btz186.

DOI:10.1093/bioinformatics/btz186
PMID:30873546
Abstract

SUMMARY

We proposed to store large-scale genotype data as integer sparse matrices, which consumed much fewer computing resources for storage and analysis than traditional approaches. In addition, the raw genotype data could be readily recovered from integer sparse matrices. Utilizing this approach, we stored the genotype data of 1612 Asian cultivated rice accessions and 446 Asian wild rice accessions across 8 584 244 SNP sites in the ECOGEMS database with 310 MB of disk usage. Graphical interface for visualization, analysis and download of SNP data were implemented in ECOGEMS, which made it a valuable resource for rice functional genomic studies.

AVAILABILITY AND IMPLEMENTATION

The code and data of ECOGEMS are freely available at https://github.com/venyao/ECOGEMS. ECOGEMS is deployed at http://ecogems.ncpgr.cn and http://150.109.59.144: 3838/ECOGEMS/ for online use.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

我们提出将大规模基因型数据存储为整数稀疏矩阵,这比传统方法消耗更少的计算资源进行存储和分析。此外,原始基因型数据可以从整数稀疏矩阵中轻松恢复。利用这种方法,我们在 ECOGEMS 数据库中存储了 1612 个亚洲栽培稻品系和 446 个亚洲野生稻品系的基因型数据,跨越 8584244 个 SNP 位点,仅使用 310MB 的磁盘空间。ECOGEMS 实现了用于 SNP 数据可视化、分析和下载的图形界面,使其成为水稻功能基因组研究的有价值资源。

可用性和实现

ECOGEMS 的代码和数据可在 https://github.com/venyao/ECOGEMS 上免费获取。ECOGEMS 部署在 http://ecogems.ncpgr.cn 和 http://150.109.59.144:3838/ECOGEMS/ 上,供在线使用。

补充信息

补充数据可在生物信息学在线获得。

相似文献

1
ECOGEMS: efficient compression and retrieve of SNP data of 2058 rice accessions with integer sparse matrices.ECOGEMS:利用整数稀疏矩阵高效压缩和检索 2058 份水稻种质资源的 SNP 数据。
Bioinformatics. 2019 Oct 15;35(20):4181-4183. doi: 10.1093/bioinformatics/btz186.
2
RiceVarMap: a comprehensive database of rice genomic variations.水稻变异图谱:一个全面的水稻基因组变异数据库。
Nucleic Acids Res. 2015 Jan;43(Database issue):D1018-22. doi: 10.1093/nar/gku894. Epub 2014 Oct 1.
3
MaizeSNPDB: A comprehensive database for efficient retrieve and analysis of SNPs among 1210 maize lines.玉米单核苷酸多态性数据库(MaizeSNPDB):一个用于高效检索和分析1210个玉米品系中单核苷酸多态性的综合数据库。
Comput Struct Biotechnol J. 2019 Nov 7;17:1377-1383. doi: 10.1016/j.csbj.2019.10.003. eCollection 2019.
4
SR4R: An Integrative SNP Resource for Genomic Breeding and Population Research in Rice.SR4R:一个水稻基因组育种和群体研究的综合 SNP 资源。
Genomics Proteomics Bioinformatics. 2020 Apr;18(2):173-185. doi: 10.1016/j.gpb.2020.03.002. Epub 2020 Jun 30.
5
OryzaGenome: Genome Diversity Database of Wild Oryza Species.水稻基因组:野生稻物种的基因组多样性数据库。
Plant Cell Physiol. 2016 Jan;57(1):e1. doi: 10.1093/pcp/pcv171. Epub 2015 Nov 16.
6
shinyCircos: an R/Shiny application for interactive creation of Circos plot.shinyCircos:一个用于交互式创建 Circos 图的 R/Shiny 应用程序。
Bioinformatics. 2018 Apr 1;34(7):1229-1231. doi: 10.1093/bioinformatics/btx763.
7
GTShark: genotype compression in large projects.GTShark:大型项目中的基因型压缩。
Bioinformatics. 2019 Nov 1;35(22):4791-4793. doi: 10.1093/bioinformatics/btz508.
8
GTC: how to maintain huge genotype collections in a compressed form.GTC:如何以压缩形式保存大型基因型集合。
Bioinformatics. 2018 Jun 1;34(11):1834-1840. doi: 10.1093/bioinformatics/bty023.
9
ChIPWig: a random access-enabling lossless and lossy compression method for ChIP-seq data.ChIPWig:一种用于 ChIP-seq 数据的随机访问支持的无损和有损压缩方法。
Bioinformatics. 2018 Mar 15;34(6):911-919. doi: 10.1093/bioinformatics/btx685.
10
Varanto: variant enrichment analysis and annotation.瓦兰托(Varanto):变体富集分析和注释。
Bioinformatics. 2019 Sep 1;35(17):3154-3156. doi: 10.1093/bioinformatics/btz046.

引用本文的文献

1
Epiallelic Variation of TILLER ANGLE CONTROL 5 (TAC5) Regulates Tiller Angle by Modulating Gravitropism in Rice.分蘖角控制基因5(TAC5)的表观等位变异通过调节水稻的向重力性来调控分蘖角。
Rice (N Y). 2025 May 28;18(1):44. doi: 10.1186/s12284-025-00794-4.
2
BbGSD: Black-boned Sheep Genome SNP Database.BbGSD:黑骨羊基因组单核苷酸多态性数据库。
Database (Oxford). 2025 Jan 28;2025. doi: 10.1093/database/baaf004.
3
OsSPL5 promotes rice outcrossing efficiency by G-protein pathway.OsSPL5通过G蛋白途径提高水稻异交效率。
Plant Biotechnol J. 2025 Feb;23(2):509-511. doi: 10.1111/pbi.14514. Epub 2024 Nov 29.
4
OsRopGEF10 Attenuates Cytokinin Signaling to Regulate Panicle Development and Grain Yield in Rice.OsRopGEF10减弱细胞分裂素信号传导以调控水稻穗发育和籽粒产量
Rice (N Y). 2024 Sep 3;17(1):57. doi: 10.1186/s12284-024-00737-5.
5
SoybeanGDB: A comprehensive genomic and bioinformatic platform for soybean genetics and genomics.大豆基因组数据库(SoybeanGDB):一个用于大豆遗传学和基因组学研究的综合基因组学与生物信息学平台。
Comput Struct Biotechnol J. 2023 Jun 12;21:3327-3338. doi: 10.1016/j.csbj.2023.06.012. eCollection 2023.
6
Enhancing genomic mutation data storage optimization based on the compression of asymmetry of sparsity.基于稀疏性不对称压缩增强基因组突变数据存储优化
Front Genet. 2023 Jun 1;14:1213907. doi: 10.3389/fgene.2023.1213907. eCollection 2023.
7
UDP-glucosyltransferase OsUGT75A promotes submergence tolerance during rice seed germination.UDP-葡萄糖基转移酶 OsUGT75A 在水稻种子萌发过程中促进耐淹水能力。
Nat Commun. 2023 Apr 21;14(1):2296. doi: 10.1038/s41467-023-38085-5.
8
Encoding Heat Shock Protein Regulates Leaf Size in Rice.编码热休克蛋白调控水稻叶片大小。
Int J Mol Sci. 2022 Apr 18;23(8):4446. doi: 10.3390/ijms23084446.
9
BnaSNPDB: An interactive web portal for the efficient retrieval and analysis of SNPs among 1,007 rapeseed accessions.BnaSNPDB:一个用于高效检索和分析1007份油菜品种单核苷酸多态性(SNP)的交互式网络平台。
Comput Struct Biotechnol J. 2020 Sep 29;18:2766-2773. doi: 10.1016/j.csbj.2020.09.031. eCollection 2020.
10
MaizeSNPDB: A comprehensive database for efficient retrieve and analysis of SNPs among 1210 maize lines.玉米单核苷酸多态性数据库(MaizeSNPDB):一个用于高效检索和分析1210个玉米品系中单核苷酸多态性的综合数据库。
Comput Struct Biotechnol J. 2019 Nov 7;17:1377-1383. doi: 10.1016/j.csbj.2019.10.003. eCollection 2019.