• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

保持轻松:(重新)分析无需主要基础设施的全社区数据集。

Keeping it light: (re)analyzing community-wide datasets without major infrastructure.

机构信息

Population Health and Reproduction, University of California Davis, 1 Shields Ave., Davis, CA, 95616, USA.

Biology Department, Woods Hole Oceanographic Institution, 266 Woods Hole Rd., Woods Hole, MA, 02543, USA.

出版信息

Gigascience. 2019 Feb 1;8(2):giy159. doi: 10.1093/gigascience/giy159.

DOI:10.1093/gigascience/giy159
PMID:30544142
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6350038/
Abstract

DNA sequencing technology has revolutionized the field of biology, shifting biology from a data-limited to data-rich state. Central to the interpretation of sequencing data are the computational tools and approaches that convert raw data into biologically meaningful information. Both the tools and the generation of data are actively evolving, yet the practice of re-analysis of previously generated data with new tools is not commonplace. Re-analysis of existing data provides an affordable means of generating new information and will likely become more routine within biology, yet necessitates a new set of considerations for best practices and resource development. Here, we discuss several practices that we believe to be broadly applicable when re-analyzing data, especially when done by small research groups.

摘要

DNA 测序技术彻底改变了生物学领域,使生物学从数据有限的状态转变为数据丰富的状态。解释测序数据的核心是将原始数据转化为有生物学意义的信息的计算工具和方法。工具和数据的产生都在积极发展,但用新工具重新分析以前生成的数据的做法并不常见。对现有数据进行重新分析是生成新信息的一种经济实惠的手段,并且在生物学领域中可能会变得更加常规,但需要为最佳实践和资源开发考虑一组新的因素。在这里,我们讨论了一些我们认为在重新分析数据时特别适用于小型研究小组的实践。

相似文献

1
Keeping it light: (re)analyzing community-wide datasets without major infrastructure.保持轻松:(重新)分析无需主要基础设施的全社区数据集。
Gigascience. 2019 Feb 1;8(2):giy159. doi: 10.1093/gigascience/giy159.
2
DNA Sequencing Data Analysis.DNA测序数据分析。
Methods Mol Biol. 2018;1754:1-13. doi: 10.1007/978-1-4939-7717-8_1.
3
Whole Genome Sequence Analysis and Population Genomics of Group A Streptococci.A 组链球菌的全基因组序列分析与群体基因组学研究。
Methods Mol Biol. 2020;2136:81-111. doi: 10.1007/978-1-0716-0467-0_7.
4
Recommendations on e-infrastructures for next-generation sequencing.关于下一代测序电子基础设施的建议。
Gigascience. 2016 Jun 7;5:26. doi: 10.1186/s13742-016-0132-7.
5
An introduction to high-throughput sequencing experiments: design and bioinformatics analysis.高通量测序实验介绍:设计与生物信息学分析
Methods Mol Biol. 2013;1038:1-26. doi: 10.1007/978-1-62703-514-9_1.
6
Evaluating Variant Calling Tools for Non-Matched Next-Generation Sequencing Data.评估用于非配对下一代测序数据的变异调用工具。
Sci Rep. 2017 Feb 24;7:43169. doi: 10.1038/srep43169.
7
A method for discovery of genome-wide SNP between any two genotypes from whole-genome re-sequencing data.一种从全基因组重测序数据中发现任意两种基因型之间全基因组单核苷酸多态性的方法。
Methods Mol Biol. 2014;1099:287-94. doi: 10.1007/978-1-62703-715-0_24.
8
Do it yourself guide to genome assembly.基因组组装自助指南。
Brief Funct Genomics. 2016 Jan;15(1):1-9. doi: 10.1093/bfgp/elu042. Epub 2014 Nov 11.
9
Simulating Next-Generation Sequencing Datasets from Empirical Mutation and Sequencing Models.根据经验性突变和测序模型模拟下一代测序数据集。
PLoS One. 2016 Nov 28;11(11):e0167047. doi: 10.1371/journal.pone.0167047. eCollection 2016.
10
High throughput sequencing methods and analysis for microbiome research.高通量测序方法及其在微生物组研究中的分析。
J Microbiol Methods. 2013 Dec;95(3):401-14. doi: 10.1016/j.mimet.2013.08.011. Epub 2013 Sep 9.

引用本文的文献

1
Cyberinfrastructure and resources to enable an integrative approach to studying forest trees.支持采用综合方法研究林木的网络基础设施和资源。
Evol Appl. 2019 Nov 3;13(1):228-241. doi: 10.1111/eva.12860. eCollection 2020 Jan.
2
Re-assembly, quality evaluation, and annotation of 678 microbial eukaryotic reference transcriptomes.重新组装、质量评估和 678 个微生物真核参考转录组的注释。
Gigascience. 2019 Apr 1;8(4). doi: 10.1093/gigascience/giy158.

本文引用的文献

1
Re-assembly, quality evaluation, and annotation of 678 microbial eukaryotic reference transcriptomes.重新组装、质量评估和 678 个微生物真核参考转录组的注释。
Gigascience. 2019 Apr 1;8(4). doi: 10.1093/gigascience/giy158.
2
The Oyster River Protocol: a multi-assembler and kmer approach for de novo transcriptome assembly.牡蛎河协议:一种用于从头转录组组装的多组装器和kmer方法。
PeerJ. 2018 Aug 3;6:e5428. doi: 10.7717/peerj.5428. eCollection 2018.
3
Probing the evolution, ecology and physiology of marine protists using transcriptomics.利用转录组学探究海洋原生生物的进化、生态和生理学。
Nat Rev Microbiol. 2017 Jan;15(1):6-20. doi: 10.1038/nrmicro.2016.160. Epub 2016 Nov 21.
4
The Marine Microbial Eukaryote Transcriptome Sequencing Project (MMETSP): illuminating the functional diversity of eukaryotic life in the oceans through transcriptome sequencing.海洋微生物真核生物转录组测序计划(MMETSP):通过转录组测序揭示海洋真核生物多样性的功能。
PLoS Biol. 2014 Jun 24;12(6):e1001889. doi: 10.1371/journal.pbio.1001889. eCollection 2014 Jun.
5
Full-length transcriptome assembly from RNA-Seq data without a reference genome.无参考基因组的 RNA-Seq 数据的全长转录组组装。
Nat Biotechnol. 2011 May 15;29(7):644-52. doi: 10.1038/nbt.1883.
6
Archiving next generation sequencing data.归档下一代测序数据。
Nucleic Acids Res. 2010 Jan;38(Database issue):D870-1. doi: 10.1093/nar/gkp1078. Epub 2009 Dec 3.
7
ABySS: a parallel assembler for short read sequence data.ABySS:一种用于短读长序列数据的并行汇编器。
Genome Res. 2009 Jun;19(6):1117-23. doi: 10.1101/gr.089532.108. Epub 2009 Feb 27.
8
CAP3: A DNA sequence assembly program.CAP3:一个DNA序列组装程序。
Genome Res. 1999 Sep;9(9):868-77. doi: 10.1101/gr.9.9.868.