• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

KaMRaT:一种用于 k-mer 计数矩阵降维的 C++工具包。

KaMRaT: a C++ toolkit for k-mer count matrix dimension reduction.

机构信息

I2BC, Université Paris-Saclay, CNRS, CEA, 91190 Gif-sur-Yvette, France.

Univ. Lille, CNRS, Centrale Lille, UMR 9189 CRIStAL, F-59000 Lille, France.

出版信息

Bioinformatics. 2024 Mar 4;40(3). doi: 10.1093/bioinformatics/btae090.

DOI:10.1093/bioinformatics/btae090
PMID:38444086
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10942800/
Abstract

MOTIVATION

KaMRaT is designed for processing large k-mer count tables derived from multi-sample, RNA-seq data. Its primary objective is to identify condition-specific or differentially expressed sequences, regardless of gene or transcript annotation.

RESULTS

KaMRaT is implemented in C++. Major functions include scoring k-mers based on count statistics, merging overlapping k-mers into contigs and selecting k-mers based on their occurrence across specific samples.

AVAILABILITY AND IMPLEMENTATION

Source code and documentation are available via https://github.com/Transipedia/KaMRaT.

摘要

动机

KaMRaT 是为处理来自多样本 RNA-seq 数据的大 k-mer 计数表而设计的。它的主要目的是识别特定于条件或差异表达的序列,而不考虑基因或转录本注释。

结果

KaMRaT 是用 C++实现的。主要功能包括基于计数统计对 k-mers 进行评分、将重叠的 k-mers 合并成连续体,并根据它们在特定样本中的出现情况选择 k-mers。

可用性和实现

源代码和文档可通过 https://github.com/Transipedia/KaMRaT 获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d4a/10942800/0bfa56919695/btae090f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d4a/10942800/0bfa56919695/btae090f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d4a/10942800/0bfa56919695/btae090f1.jpg

相似文献

1
KaMRaT: a C++ toolkit for k-mer count matrix dimension reduction.KaMRaT:一种用于 k-mer 计数矩阵降维的 C++工具包。
Bioinformatics. 2024 Mar 4;40(3). doi: 10.1093/bioinformatics/btae090.
2
KAnalyze: a fast versatile pipelined k-mer toolkit.KAnalyze:一个快速通用的流水线 k-mer 工具包。
Bioinformatics. 2014 Jul 15;30(14):2070-2. doi: 10.1093/bioinformatics/btu152. Epub 2014 Mar 18.
3
Practical selection of representative sets of RNA-seq samples using a hierarchical approach.使用层次方法对 RNA-seq 样本进行有代表性的集合的实际选择。
Bioinformatics. 2021 Jul 12;37(Suppl_1):i334-i341. doi: 10.1093/bioinformatics/btab315.
4
Squeakr: an exact and approximate k-mer counting system.Squeakr:一种精确和近似的 k-mer 计数系统。
Bioinformatics. 2018 Feb 15;34(4):568-575. doi: 10.1093/bioinformatics/btx636.
5
KCOSS: an ultra-fast k-mer counter for assembled genome analysis.KCOSS:用于组装基因组分析的超快速k-mer计数器。
Bioinformatics. 2022 Jan 27;38(4):933-940. doi: 10.1093/bioinformatics/btab797.
6
PanKmer: k-mer-based and reference-free pangenome analysis.PanKmer:基于 k-mer 的无参考基因组泛基因组分析。
Bioinformatics. 2023 Oct 3;39(10). doi: 10.1093/bioinformatics/btad621.
7
EPIK: precise and scalable evolutionary placement with informative k-mers.EPIK:带信息 k- -mer 的精确可扩展进化放置。
Bioinformatics. 2023 Dec 1;39(12). doi: 10.1093/bioinformatics/btad692.
8
Transipedia.org: k-mer-based exploration of large RNA sequencing datasets and application to cancer data.Transipedia.org:基于 k-mer 的大型 RNA 测序数据集探索及其在癌症数据中的应用。
Genome Biol. 2024 Oct 10;25(1):266. doi: 10.1186/s13059-024-03413-5.
9
Optimization of de novo transcriptome assembly from high-throughput short read sequencing data improves functional annotation for non-model organisms.优化从头转录组组装从高通量短读测序数据提高非模式生物的功能注释。
BMC Bioinformatics. 2012 Jul 18;13:170. doi: 10.1186/1471-2105-13-170.
10
CMash: fast, multi-resolution estimation of k-mer-based Jaccard and containment indices.CMash:基于 k-mer 的 Jaccard 和包含指数的快速、多分辨率估计。
Bioinformatics. 2022 Jun 24;38(Suppl 1):i28-i35. doi: 10.1093/bioinformatics/btac237.

本文引用的文献

1
kmtricks: efficient and flexible construction of Bloom filters for large sequencing data collections.kmtricks:用于大型测序数据集的布隆过滤器的高效灵活构建
Bioinform Adv. 2022 Apr 29;2(1):vbac029. doi: 10.1093/bioadv/vbac029. eCollection 2022.
2
k mdiff, large-scale and user-friendly differential k-mer analyses.kmdiff,大规模且用户友好的差异 k-mer 分析。
Bioinformatics. 2022 Dec 13;38(24):5443-5445. doi: 10.1093/bioinformatics/btac689.
3
iMOKA: k-mer based software to analyze large collections of sequencing data.iMOKA:基于 k-mer 的软件,用于分析大量测序数据。
Genome Biol. 2020 Oct 13;21(1):261. doi: 10.1186/s13059-020-02165-2.
4
Association mapping from sequencing reads using -mers.基于 -mers 的测序reads 的关联作图。
Elife. 2018 Jun 13;7:e32920. doi: 10.7554/eLife.32920.
5
DE-kupl: exhaustive capture of biological variation in RNA-seq data through k-mer decomposition.DE-kupl:通过 k-mer 分解实现 RNA-seq 数据中生物变异的全面捕获。
Genome Biol. 2017 Dec 28;18(1):243. doi: 10.1186/s13059-017-1372-2.
6
Identifying subgroup markers in heterogeneous populations.识别异质人群中的亚群标志物。
Nucleic Acids Res. 2013 Nov;41(21):e200. doi: 10.1093/nar/gkt845. Epub 2013 Sep 22.
7
A fast, lock-free approach for efficient parallel counting of occurrences of k-mers.一种快速、无锁的方法,用于高效并行计数 k-mer 的出现次数。
Bioinformatics. 2011 Mar 15;27(6):764-70. doi: 10.1093/bioinformatics/btr011. Epub 2011 Jan 7.
8
De novo repeat classification and fragment assembly.从头重复序列分类和片段组装。
Genome Res. 2004 Sep;14(9):1786-96. doi: 10.1101/gr.2395204.
9
Molecular classification of cancer: class discovery and class prediction by gene expression monitoring.癌症的分子分类:通过基因表达监测进行类别发现和类别预测。
Science. 1999 Oct 15;286(5439):531-7. doi: 10.1126/science.286.5439.531.