• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BicSPAM:使用序列模式的灵活双聚类

BicSPAM: flexible biclustering using sequential patterns.

作者信息

Henriques Rui, Madeira Sara C

机构信息

Knowledge Discovery and BIOInformatics group (KDBIO), INESC-ID, and Computer Science and Engineering (CSE) Department, Instituto Superior Técnico, Universidade de Lisboa, Av, Rovisco Pais, 1, 1049-001 Lisboa, Portugal.

出版信息

BMC Bioinformatics. 2014 May 6;15:130. doi: 10.1186/1471-2105-15-130.

DOI:10.1186/1471-2105-15-130
PMID:24885271
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4071222/
Abstract

BACKGROUND

Biclustering is a critical task for biomedical applications. Order-preserving biclusters, submatrices where the values of rows induce the same linear ordering across columns, capture local regularities with constant, shifting, scaling and sequential assumptions. Additionally, biclustering approaches relying on pattern mining output deliver exhaustive solutions with an arbitrary number and positioning of biclusters. However, existing order-preserving approaches suffer from robustness, scalability and/or flexibility issues. Additionally, they are not able to discover biclusters with symmetries and parameterizable levels of noise.

RESULTS

We propose new biclustering algorithms to perform flexible, exhaustive and noise-tolerant biclustering based on sequential patterns (BicSPAM). Strategies are proposed to allow for symmetries and to seize efficiency gains from item-indexable properties and/or from partitioning methods with conservative distance guarantees. Results show BicSPAM ability to capture symmetries, handle planted noise, and scale in terms of memory and time. BicSPAM also achieves the best match-scores for the recovery of hidden biclusters in synthetic datasets with varying noise distributions and levels of missing values. Finally, results on gene expression data lead to complete solutions, delivering new biclusters corresponding to putative modules with heightened biological relevance.

CONCLUSIONS

BicSPAM provides an exhaustive way to discover flexible structures of order-preserving biclusters. To the best of our knowledge, BicSPAM is the first attempt to deal with order-preserving biclusters that allow for symmetries and that are robust to varying levels of noise.

摘要

背景

双聚类是生物医学应用中的一项关键任务。保序双聚类是指行值在各列中诱导出相同线性顺序的子矩阵,它在恒定、移位、缩放和顺序假设下捕捉局部规律。此外,依赖模式挖掘输出的双聚类方法能提供包含任意数量和位置的双聚类的详尽解决方案。然而,现有的保序方法存在鲁棒性、可扩展性和/或灵活性问题。此外,它们无法发现具有对称性和可参数化噪声水平的双聚类。

结果

我们提出了基于序列模式的新型双聚类算法(BicSPAM),以执行灵活、详尽且耐噪声的双聚类。我们提出了一些策略,以允许对称性,并从可按项索引的属性和/或具有保守距离保证的分区方法中获取效率提升。结果表明,BicSPAM能够捕捉对称性、处理植入的噪声,并在内存和时间方面实现扩展。在具有不同噪声分布和缺失值水平的合成数据集中,BicSPAM在恢复隐藏双聚类方面也取得了最佳匹配分数。最后,在基因表达数据上的结果产生了完整的解决方案,提供了与具有更高生物学相关性的假定模块相对应的新双聚类。

结论

BicSPAM提供了一种详尽的方法来发现保序双聚类的灵活结构。据我们所知,BicSPAM是首次尝试处理允许对称性且对不同噪声水平具有鲁棒性的保序双聚类。

相似文献

1
BicSPAM: flexible biclustering using sequential patterns.BicSPAM:使用序列模式的灵活双聚类
BMC Bioinformatics. 2014 May 6;15:130. doi: 10.1186/1471-2105-15-130.
2
BicPAM: Pattern-based biclustering for biomedical data analysis.BicPAM:用于生物医学数据分析的基于模式的双聚类
Algorithms Mol Biol. 2014 Dec 16;9(1):27. doi: 10.1186/s13015-014-0027-z. eCollection 2014.
3
UniBic: Sequential row-based biclustering algorithm for analysis of gene expression data.UniBic:用于基因表达数据分析的基于行的序列双聚类算法。
Sci Rep. 2016 Mar 22;6:23466. doi: 10.1038/srep23466.
4
Measuring the quality of linear patterns in biclusters.测量双簇中线性模式的质量。
Methods. 2015 Jul 15;83:18-27. doi: 10.1016/j.ymeth.2015.04.005. Epub 2015 Apr 15.
5
BicPAMS: software for biological data analysis with pattern-based biclustering.BicPAMS:用于基于模式的双聚类生物数据分析的软件。
BMC Bioinformatics. 2017 Feb 2;18(1):82. doi: 10.1186/s12859-017-1493-3.
6
Discovery of error-tolerant biclusters from noisy gene expression data.从嘈杂的基因表达数据中发现容错双聚类。
BMC Bioinformatics. 2011 Nov 24;12 Suppl 12(Suppl 12):S1. doi: 10.1186/1471-2105-12-S12-S1.
7
POPBic: Pathway-Based Order Preserving Biclustering Algorithm Towards the Analysis of Gene Expression Data.POPBic:基于通路的保留序分箱算法,用于基因表达数据分析。
IEEE/ACM Trans Comput Biol Bioinform. 2021 Nov-Dec;18(6):2659-2670. doi: 10.1109/TCBB.2020.2980816. Epub 2021 Dec 8.
8
BiC2PAM: constraint-guided biclustering for biological data analysis with domain knowledge.BiC2PAM:利用领域知识进行生物数据分析的约束引导双聚类
Algorithms Mol Biol. 2016 Sep 14;11:23. doi: 10.1186/s13015-016-0085-5. eCollection 2016.
9
Identification of bicluster regions in a binary matrix and its applications.二值矩阵中双聚类区域的识别及其应用。
PLoS One. 2013 Aug 5;8(8):e71680. doi: 10.1371/journal.pone.0071680. Print 2013.
10
A comparative analysis of biclustering algorithms for gene expression data.基于基因表达数据的对比分析双聚类算法。
Brief Bioinform. 2013 May;14(3):279-92. doi: 10.1093/bib/bbs032. Epub 2012 Jul 6.

引用本文的文献

1
Biclustering data analysis: a comprehensive survey.双聚类数据分析:全面综述。
Brief Bioinform. 2024 May 23;25(4). doi: 10.1093/bib/bbae342.
2
Rank-preserving biclustering algorithm: a case study on miRNA breast cancer.保留秩的双聚类算法:在 miRNA 乳腺癌中的案例研究。
Med Biol Eng Comput. 2021 Apr;59(4):989-1004. doi: 10.1007/s11517-020-02271-0. Epub 2021 Apr 11.
3
EBIC: an evolutionary-based parallel biclustering algorithm for pattern discovery.EBIC:一种基于进化的并行关联聚类算法,用于发现模式。

本文引用的文献

1
Putting genetic interactions in context through a global modular decomposition.通过全局模块化分解来了解遗传相互作用。
Genome Res. 2011 Aug;21(8):1375-87. doi: 10.1101/gr.117176.110. Epub 2011 Jun 29.
2
DeBi: Discovering Differentially Expressed Biclusters using a Frequent Itemset Approach.DeBi:使用频繁项集方法发现差异表达的双聚类
Algorithms Mol Biol. 2011 Jun 23;6(1):18. doi: 10.1186/1748-7188-6-18.
3
Analysis of protein complexes through model-based biclustering of label-free quantitative AP-MS data.通过基于模型的无标签定量 AP-MS 数据的双聚类分析蛋白质复合物。
Bioinformatics. 2018 Nov 1;34(21):3719-3726. doi: 10.1093/bioinformatics/bty401.
4
A GPU-accelerated algorithm for biclustering analysis and detection of condition-dependent coexpression network modules.一种用于双聚类分析和检测条件相关共表达网络模块的 GPU 加速算法。
Sci Rep. 2017 Jun 23;7(1):4162. doi: 10.1038/s41598-017-04070-4.
5
BicPAMS: software for biological data analysis with pattern-based biclustering.BicPAMS:用于基于模式的双聚类生物数据分析的软件。
BMC Bioinformatics. 2017 Feb 2;18(1):82. doi: 10.1186/s12859-017-1493-3.
6
BiC2PAM: constraint-guided biclustering for biological data analysis with domain knowledge.BiC2PAM:利用领域知识进行生物数据分析的约束引导双聚类
Algorithms Mol Biol. 2016 Sep 14;11:23. doi: 10.1186/s13015-016-0085-5. eCollection 2016.
7
BicNET: Flexible module discovery in large-scale biological networks using biclustering.BicNET:使用双聚类在大规模生物网络中进行灵活的模块发现。
Algorithms Mol Biol. 2016 May 20;11:14. doi: 10.1186/s13015-016-0074-8. eCollection 2016.
8
UniBic: Sequential row-based biclustering algorithm for analysis of gene expression data.UniBic:用于基因表达数据分析的基于行的序列双聚类算法。
Sci Rep. 2016 Mar 22;6:23466. doi: 10.1038/srep23466.
9
BicPAM: Pattern-based biclustering for biomedical data analysis.BicPAM:用于生物医学数据分析的基于模式的双聚类
Algorithms Mol Biol. 2014 Dec 16;9(1):27. doi: 10.1186/s13015-014-0027-z. eCollection 2014.
Mol Syst Biol. 2010 Jun 22;6:385. doi: 10.1038/msb.2010.41.
4
FABIA: factor analysis for bicluster acquisition.FABIA:双聚类因子分析。
Bioinformatics. 2010 Jun 15;26(12):1520-7. doi: 10.1093/bioinformatics/btq227. Epub 2010 Apr 23.
5
Identification of regulatory modules in time series gene expression data using a linear time biclustering algorithm.使用线性时间二分聚类算法识别时间序列基因表达数据中的调控模块。
IEEE/ACM Trans Comput Biol Bioinform. 2010 Jan-Mar;7(1):153-65. doi: 10.1109/TCBB.2008.34.
6
PathFinder: mining signal transduction pathway segments from protein-protein interaction networks.路径查找器:从蛋白质-蛋白质相互作用网络中挖掘信号转导途径片段
BMC Bioinformatics. 2007 Sep 13;8:335. doi: 10.1186/1471-2105-8-335.
7
Biclustering algorithms for biological data analysis: a survey.用于生物数据分析的双聚类算法:一项综述。
IEEE/ACM Trans Comput Biol Bioinform. 2004 Jan-Mar;1(1):24-45. doi: 10.1109/TCBB.2004.2.
8
Review: a gentle introduction to imputation of missing values.综述:缺失值插补的简要介绍
J Clin Epidemiol. 2006 Oct;59(10):1087-91. doi: 10.1016/j.jclinepi.2006.01.014. Epub 2006 Jul 11.
9
BicAT: a biclustering analysis toolbox.BicAT:一个双聚类分析工具箱。
Bioinformatics. 2006 May 15;22(10):1282-3. doi: 10.1093/bioinformatics/btl099. Epub 2006 Mar 21.
10
A systematic comparison and evaluation of biclustering methods for gene expression data.基因表达数据双聚类方法的系统比较与评估
Bioinformatics. 2006 May 1;22(9):1122-9. doi: 10.1093/bioinformatics/btl060. Epub 2006 Feb 24.