• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Transipedia.org:基于 k-mer 的大型 RNA 测序数据集探索及其在癌症数据中的应用。

Transipedia.org: k-mer-based exploration of large RNA sequencing datasets and application to cancer data.

机构信息

IRMB, INSERM U1183, Hopital Saint-Eloi, Universite de Montpellier, Montpellier, France.

CRCT, Inserm, CNRS, Université Toulouse III-Paul Sabatier, Centre de Recherches en Cancérologie de Toulouse, Toulouse, France.

出版信息

Genome Biol. 2024 Oct 10;25(1):266. doi: 10.1186/s13059-024-03413-5.

DOI:10.1186/s13059-024-03413-5
PMID:39390592
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11468207/
Abstract

Indexing techniques relying on k-mers have proven effective in searching for RNA sequences across thousands of RNA-seq libraries, but without enabling direct RNA quantification. We show here that arbitrary RNA sequences can be quantified in seconds through their decomposition into k-mers, with a precision akin to that of conventional RNA quantification methods. Using an index of the Cancer Cell Line Encyclopedia (CCLE) collection consisting of 1019 RNA-seq samples, we show that k-mer indexing offers a powerful means to reveal non-reference sequences, and variant RNAs induced by specific gene alterations, for instance in splicing factors.

摘要

基于 k-mer 的索引技术已被证明在搜索数千个 RNA-seq 文库中的 RNA 序列方面非常有效,但无法直接进行 RNA 定量。我们在这里展示,通过将任意 RNA 序列分解为 k-mer,可以在几秒钟内对其进行定量,其精度与传统的 RNA 定量方法相当。使用包含 1019 个 RNA-seq 样本的癌症细胞系百科全书(CCLE)集合的索引,我们表明 k-mer 索引提供了一种强大的方法来揭示非参考序列,以及由特定基因改变诱导的变体 RNA,例如剪接因子。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/6f5249a1364d/13059_2024_3413_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/10ce837ec1ff/13059_2024_3413_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/f32fc6ba411b/13059_2024_3413_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/2f705ed4f1a6/13059_2024_3413_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/6f5249a1364d/13059_2024_3413_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/10ce837ec1ff/13059_2024_3413_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/f32fc6ba411b/13059_2024_3413_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/2f705ed4f1a6/13059_2024_3413_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e5d5/11468207/6f5249a1364d/13059_2024_3413_Fig4_HTML.jpg

相似文献

1
Transipedia.org: k-mer-based exploration of large RNA sequencing datasets and application to cancer data.Transipedia.org:基于 k-mer 的大型 RNA 测序数据集探索及其在癌症数据中的应用。
Genome Biol. 2024 Oct 10;25(1):266. doi: 10.1186/s13059-024-03413-5.
2
Reference-free inferring of transcriptomic events in cancer cells on single-cell data.无参考转录事件推断在单细胞数据中的癌细胞。
BMC Cancer. 2024 May 20;24(1):607. doi: 10.1186/s12885-024-12331-5.
3
KaMRaT: a C++ toolkit for k-mer count matrix dimension reduction.KaMRaT:一种用于 k-mer 计数矩阵降维的 C++工具包。
Bioinformatics. 2024 Mar 4;40(3). doi: 10.1093/bioinformatics/btae090.
4
Kmerator Suite: design of specific -mer signatures and automatic metadata discovery in large RNA-seq datasets.Kmerator套件:在大型RNA测序数据集中设计特定的k-mer特征并自动发现元数据
NAR Genom Bioinform. 2021 Jun 23;3(3):lqab058. doi: 10.1093/nargab/lqab058. eCollection 2021 Sep.
5
REINDEER: efficient indexing of k-mer presence and abundance in sequencing datasets.驯鹿:测序数据集中小段序列存在和丰度的高效索引。
Bioinformatics. 2020 Jul 1;36(Suppl_1):i177-i185. doi: 10.1093/bioinformatics/btaa487.
6
Lossless indexing with counting de Bruijn graphs.基于计数型 de Bruijn 图的无损索引
Genome Res. 2022 Sep 27;32(9):1754-1764. doi: 10.1101/gr.276607.122.
7
RNA-Skim: a rapid method for RNA-Seq quantification at transcript level.RNA-Skim:一种在转录水平上进行 RNA-Seq 定量的快速方法。
Bioinformatics. 2014 Jun 15;30(12):i283-i292. doi: 10.1093/bioinformatics/btu288.
8
DE-kupl: exhaustive capture of biological variation in RNA-seq data through k-mer decomposition.DE-kupl:通过 k-mer 分解实现 RNA-seq 数据中生物变异的全面捕获。
Genome Biol. 2017 Dec 28;18(1):243. doi: 10.1186/s13059-017-1372-2.
9
OneStopRNAseq: A Web Application for Comprehensive and Efficient Analyses of RNA-Seq Data.OneStopRNAseq:一种用于 RNA-Seq 数据综合高效分析的网络应用程序。
Genes (Basel). 2020 Oct 2;11(10):1165. doi: 10.3390/genes11101165.
10
Indexing Arbitrary-Length k-Mers in Sequencing Reads.对测序读段中的任意长度k-mer进行索引
PLoS One. 2015 Jul 16;10(7):e0133198. doi: 10.1371/journal.pone.0133198. eCollection 2015.

引用本文的文献

1
RNALoc-LM: RNA subcellular localization prediction using pre-trained RNA language model.RNALoc-LM:使用预训练RNA语言模型进行RNA亚细胞定位预测。
Bioinformatics. 2025 Mar 29;41(4). doi: 10.1093/bioinformatics/btaf127.

本文引用的文献

1
Needle: a fast and space-efficient prefilter for estimating the quantification of very large collections of expression experiments.针:一种快速且节省空间的预过滤器,用于估计大量表达实验的定量。
Bioinformatics. 2022 Sep 2;38(17):4100-4108. doi: 10.1093/bioinformatics/btac492.
2
Lossless indexing with counting de Bruijn graphs.基于计数型 de Bruijn 图的无损索引
Genome Res. 2022 Sep 27;32(9):1754-1764. doi: 10.1101/gr.276607.122.
3
Impact of gene annotation choice on the quantification of RNA-seq data.基因注释选择对 RNA-seq 数据定量的影响。
BMC Bioinformatics. 2022 Mar 30;23(1):107. doi: 10.1186/s12859-022-04644-8.
4
JAFFAL: detecting fusion genes with long-read transcriptome sequencing.JAFFAL:利用长读长转录组测序检测融合基因。
Genome Biol. 2022 Jan 6;23(1):10. doi: 10.1186/s13059-021-02588-5.
5
recount3: summaries and queries for large-scale RNA-seq expression and splicing.recount3:大规模 RNA-seq 表达和剪接的摘要和查询。
Genome Biol. 2021 Nov 29;22(1):323. doi: 10.1186/s13059-021-02533-6.
6
Kmerator Suite: design of specific -mer signatures and automatic metadata discovery in large RNA-seq datasets.Kmerator套件:在大型RNA测序数据集中设计特定的k-mer特征并自动发现元数据
NAR Genom Bioinform. 2021 Jun 23;3(3):lqab058. doi: 10.1093/nargab/lqab058. eCollection 2021 Sep.
7
Gene Fusions Create Partner and Collateral Dependencies Essential to Cancer Cell Survival.基因融合会导致肿瘤细胞存活所必需的伙伴和附属依赖性。
Cancer Res. 2021 Aug 1;81(15):3971-3984. doi: 10.1158/0008-5472.CAN-21-0791. Epub 2021 Jun 7.
8
Data structures based on -mers for querying large collections of sequencing data sets.基于 - 元的序列数据集查询的大型数据集的数据结构。
Genome Res. 2021 Jan;31(1):1-12. doi: 10.1101/gr.260604.119. Epub 2020 Dec 16.
9
Genetic alterations of SUGP1 mimic mutant-SF3B1 splice pattern in lung adenocarcinoma and other cancers.SUGP1 的基因改变模拟了肺腺癌和其他癌症中突变型 SF3B1 的剪接模式。
Oncogene. 2021 Jan;40(1):85-96. doi: 10.1038/s41388-020-01507-5. Epub 2020 Oct 14.
10
The GTEx Consortium atlas of genetic regulatory effects across human tissues.GTEx 联盟人类组织遗传调控效应图谱
Science. 2020 Sep 11;369(6509):1318-1330. doi: 10.1126/science.aaz1776.