• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

riboCleaner:一种用于鉴定和量化植物 RNA-seq 数据中 rRNA 读取污染的工具。

riboCleaner: a pipeline to identify and quantify rRNA read contamination from RNA-seq data in plants.

机构信息

Computational Biology, BASF Corporation, Research Triangle Park, NC 27709-3528, USA.

出版信息

Bioinformatics. 2022 Aug 2;38(15):3840-3843. doi: 10.1093/bioinformatics/btac402.

DOI:10.1093/bioinformatics/btac402
PMID:35731209
Abstract

MOTIVATION

Analysis of gene expression data can be crucial for elucidating biological relationships within living organisms. However, accurate quantification of gene expression relies directly upon the accuracy of the reference genome or transcriptome to which the expression data are mapped. Errors in gene annotation can lead to errors in the quantification of gene expression. One source of gene annotation error in eukaryotes arises from incorrect predictions of messenger RNA gene models within ribosomal DNA (rDNA) regions.

RESULTS

Here, we provide examples of how the presence of false gene models in rDNA regions can result in a handful of genes appearing to contribute to >50% of the total transcripts per million values of entire RNA-seq datasets. To this end, we have created riboCleaner, a bioinformatics pipeline designed to identify misannotated gene models in rDNA regions and quantify rRNA-derived reads in RNA-seq data. We also show the applicability of riboCleaner in several plant genome assemblies.

AVAILABILITY AND IMPLEMENTATION

We have implemented riboCleaner as a containerized Snakemake workflow. The workflow, instructions for building the container and other documentation are available at https://github.com/basf. The data underlying this article are available in GitHub at https://github.com/basf/riboCleaner. For convenience, a prebuilt Docker image containing riboCleaner is available at https://hub.docker.com/u/basfcontainers.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

分析基因表达数据对于阐明生物体内部的生物学关系至关重要。然而,基因表达的准确定量直接依赖于所映射的参考基因组或转录组的准确性。基因注释错误会导致基因表达定量错误。真核生物中基因注释错误的一个来源是核糖体 DNA(rDNA)区域内信使 RNA 基因模型的错误预测。

结果

在这里,我们提供了一些例子,说明 rDNA 区域中假基因模型的存在如何导致少数基因似乎对整个 RNA-seq 数据集的每百万个转录物的 50%以上有贡献。为此,我们创建了 riboCleaner,这是一个生物信息学管道,旨在识别 rDNA 区域中错误注释的基因模型,并量化 RNA-seq 数据中的 rRNA 衍生读取。我们还展示了 riboCleaner 在几个植物基因组组装中的适用性。

可用性和实现

我们已经将 riboCleaner 实现为一个容器化的 Snakemake 工作流程。该工作流程、构建容器的说明和其他文档可在 https://github.com/basf 上获得。本文所依据的数据可在 GitHub 上的 https://github.com/basf/riboCleaner 中获得。为方便起见,可在 https://hub.docker.com/u/basfcontainers 上获得包含 riboCleaner 的预构建 Docker 映像。

补充信息

补充数据可在生物信息学在线获得。

相似文献

1
riboCleaner: a pipeline to identify and quantify rRNA read contamination from RNA-seq data in plants.riboCleaner:一种用于鉴定和量化植物 RNA-seq 数据中 rRNA 读取污染的工具。
Bioinformatics. 2022 Aug 2;38(15):3840-3843. doi: 10.1093/bioinformatics/btac402.
2
CAARS: comparative assembly and annotation of RNA-Seq data.CAARS:RNA-Seq 数据的比较组装和注释。
Bioinformatics. 2019 Jul 1;35(13):2199-2207. doi: 10.1093/bioinformatics/bty903.
3
PhytoPipe: a phytosanitary pipeline for plant pathogen detection and diagnosis using RNA-seq data.PhytoPipe:一种使用 RNA-seq 数据进行植物病原体检测和诊断的植物卫生管道。
BMC Bioinformatics. 2023 Dec 13;24(1):470. doi: 10.1186/s12859-023-05589-2.
4
Quantifying circular RNA expression from RNA-seq data using model-based framework.基于模型框架从 RNA-seq 数据中定量环状 RNA 的表达。
Bioinformatics. 2017 Jul 15;33(14):2131-2139. doi: 10.1093/bioinformatics/btx129.
5
ProkSeq for complete analysis of RNA-Seq data from prokaryotes.用于对来自原核生物的RNA测序数据进行全面分析的ProkSeq。
Bioinformatics. 2021 Apr 9;37(1):126-128. doi: 10.1093/bioinformatics/btaa1063.
6
Holistic optimization of an RNA-seq workflow for multi-threaded environments.多线程环境下 RNA-seq 工作流程的整体优化。
Bioinformatics. 2019 Oct 15;35(20):4173-4175. doi: 10.1093/bioinformatics/btz169.
7
Hierarchical analysis of RNA-seq reads improves the accuracy of allele-specific expression.基于层次分析的 RNA-seq 测序reads 提高了等位基因特异性表达的准确性。
Bioinformatics. 2018 Jul 1;34(13):2177-2184. doi: 10.1093/bioinformatics/bty078.
8
FINDER: an automated software package to annotate eukaryotic genes from RNA-Seq data and associated protein sequences.FINDER:一个自动化软件包,用于从 RNA-Seq 数据和相关蛋白质序列中注释真核基因。
BMC Bioinformatics. 2021 Apr 20;22(1):205. doi: 10.1186/s12859-021-04120-9.
9
baerhunter: an R package for the discovery and analysis of expressed non-coding regions in bacterial RNA-seq data.baerhunter:一个用于在细菌 RNA-seq 数据中发现和分析表达的非编码区域的 R 包。
Bioinformatics. 2020 Feb 1;36(3):966-969. doi: 10.1093/bioinformatics/btz643.
10
RASflow: an RNA-Seq analysis workflow with Snakemake.RASflow:一个基于 Snakemake 的 RNA-Seq 分析工作流程。
BMC Bioinformatics. 2020 Mar 18;21(1):110. doi: 10.1186/s12859-020-3433-x.