• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

funBIalign:一种基于均方残基分数的用于功能基序发现的分层算法。

funBIalign: a hierachical algorithm for functional motif discovery based on mean squared residue scores.

作者信息

Di Iorio Jacopo, Cremona Marzia A, Chiaromonte Francesca

机构信息

Department of Statistics, Penn State University, Joab L. Thomas Building, University Park, 16802 PA USA.

Department of Operations and Decision System, Université Laval, 2325 Rue de la Terrasse, Québec, G1V0A6 Québec Canada.

出版信息

Stat Comput. 2025;35(1):11. doi: 10.1007/s11222-024-10537-y. Epub 2024 Dec 10.

DOI:10.1007/s11222-024-10537-y
PMID:39669208
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11632007/
Abstract

UNLABELLED

Motif discovery is gaining increasing attention in the domain of functional data analysis. Functional motifs are typical "shapes" or "patterns" that recur multiple times in different portions of a single curve and/or in misaligned portions of multiple curves. In this paper, we define functional motifs using an additive model and we propose for their discovery and evaluation. Inspired by clustering and biclustering techniques, is a multi-step procedure which uses agglomerative hierarchical clustering with complete linkage and a functional distance based on mean squared residue scores to discover functional motifs, both in a single curve (e.g., time series) and in a set of curves. We assess its performance and compare it to other recent methods through extensive simulations. Moreover, we use for discovering motifs in two real-data case studies; one on food price inflation and one on temperature changes.

SUPPLEMENTARY INFORMATION

The online version contains supplementary material available at 10.1007/s11222-024-10537-y.

摘要

未标注

基序发现(Motif discovery)在功能数据分析领域正受到越来越多的关注。功能基序是指在单条曲线的不同部分和/或多条曲线的未对齐部分多次出现的典型“形状”或“模式”。在本文中,我们使用加法模型定义功能基序,并提出用于其发现和评估的方法。受聚类和双聚类技术的启发,该方法是一个多步骤过程,它使用具有完全链接的凝聚层次聚类和基于均方残差分数的功能距离来发现单条曲线(例如时间序列)和一组曲线中的功能基序。我们通过广泛的模拟评估其性能,并将其与其他近期方法进行比较。此外,我们在两个实际数据案例研究中使用该方法来发现基序;一个关于食品价格通胀,另一个关于温度变化。

补充信息

在线版本包含可在10.1007/s11222-024-10537-y获取的补充材料。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/10eb04f9c837/11222_2024_10537_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/5842c4148538/11222_2024_10537_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/6695509acca2/11222_2024_10537_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/d824a5f6cb8b/11222_2024_10537_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/10eb04f9c837/11222_2024_10537_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/5842c4148538/11222_2024_10537_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/6695509acca2/11222_2024_10537_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/d824a5f6cb8b/11222_2024_10537_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f5a/11632007/10eb04f9c837/11222_2024_10537_Fig5_HTML.jpg

相似文献

1
funBIalign: a hierachical algorithm for functional motif discovery based on mean squared residue scores.funBIalign:一种基于均方残基分数的用于功能基序发现的分层算法。
Stat Comput. 2025;35(1):11. doi: 10.1007/s11222-024-10537-y. Epub 2024 Dec 10.
2
Folic acid supplementation and malaria susceptibility and severity among people taking antifolate antimalarial drugs in endemic areas.在流行地区,服用抗叶酸抗疟药物的人群中,叶酸补充剂与疟疾易感性和严重程度的关系。
Cochrane Database Syst Rev. 2022 Feb 1;2(2022):CD014217. doi: 10.1002/14651858.CD014217.
3
Discriminative motif discovery in DNA and protein sequences using the DEME algorithm.使用DEME算法在DNA和蛋白质序列中发现鉴别性基序。
BMC Bioinformatics. 2007 Oct 15;8:385. doi: 10.1186/1471-2105-8-385.
4
Discovery of protein phosphorylation motifs through exploratory data analysis.通过探索性数据分析发现蛋白质磷酸化基序。
PLoS One. 2011;6(5):e20025. doi: 10.1371/journal.pone.0020025. Epub 2011 May 25.
5
EXTREME: an online EM algorithm for motif discovery.极端:一种用于基序发现的在线 EM 算法。
Bioinformatics. 2014 Jun 15;30(12):1667-73. doi: 10.1093/bioinformatics/btu093. Epub 2014 Feb 14.
6
Shifting and scaling patterns from gene expression data.基因表达数据中的转移和缩放模式。
Bioinformatics. 2005 Oct 15;21(20):3840-5. doi: 10.1093/bioinformatics/bti641. Epub 2005 Sep 6.
7
EBIC: an evolutionary-based parallel biclustering algorithm for pattern discovery.EBIC:一种基于进化的并行关联聚类算法,用于发现模式。
Bioinformatics. 2018 Nov 1;34(21):3719-3726. doi: 10.1093/bioinformatics/bty401.
8
Regulatory motif discovery using a population clustering evolutionary algorithm.使用群体聚类进化算法进行调控基序发现。
IEEE/ACM Trans Comput Biol Bioinform. 2007 Jul-Sep;4(3):403-414. doi: 10.1109/tcbb.2007.1044.
9
Discovering biclusters in gene expression data based on high-dimensional linear geometries.基于高维线性几何在基因表达数据中发现双簇。
BMC Bioinformatics. 2008 Apr 23;9:209. doi: 10.1186/1471-2105-9-209.
10
A polynomial time biclustering algorithm for finding approximate expression patterns in gene expression time series.一种用于在基因表达时间序列中寻找近似表达模式的多项式时间双聚类算法。
Algorithms Mol Biol. 2009 Jun 4;4:8. doi: 10.1186/1748-7188-4-8.

本文引用的文献

1
Functional data analysis characterizes the shapes of the first COVID-19 epidemic wave in Italy.功能数据分析刻画了意大利首次 COVID-19 疫情浪潮的形状。
Sci Rep. 2021 Aug 30;11(1):17054. doi: 10.1038/s41598-021-95866-y.
2
Human L1 Transposition Dynamics Unraveled with Functional Data Analysis.运用功能数据分析揭示人类 L1 转座动态。
Mol Biol Evol. 2020 Dec 16;37(12):3576-3600. doi: 10.1093/molbev/msaa194.
3
On the bias of H-scores for comparing biclusters, and how to correct it.关于用于比较双聚类的H分数偏差以及如何校正该偏差。
Bioinformatics. 2020 May 1;36(9):2955-2957. doi: 10.1093/bioinformatics/btaa060.
4
Exact Discovery of Time Series Motifs.时间序列基序的精确发现
Proc SIAM Int Conf Data Min. 2009;2009:473-484. doi: 10.1137/1.9781611972795.41.
5
Biclustering on expression data: A review.基于表达数据的双聚类分析:综述
J Biomed Inform. 2015 Oct;57:163-80. doi: 10.1016/j.jbi.2015.06.028. Epub 2015 Jul 6.
6
Computing the maximum similarity bi-clusters of gene expression data.计算基因表达数据的最大相似性双聚类
Bioinformatics. 2007 Jan 1;23(1):50-6. doi: 10.1093/bioinformatics/btl560. Epub 2006 Nov 7.
7
Biclustering algorithms for biological data analysis: a survey.用于生物数据分析的双聚类算法:一项综述。
IEEE/ACM Trans Comput Biol Bioinform. 2004 Jan-Mar;1(1):24-45. doi: 10.1109/TCBB.2004.2.
8
A unified approach for morphometric and functional data analysis in young, old, and demented adults using automated atlas-based head size normalization: reliability and validation against manual measurement of total intracranial volume.一种使用基于自动图谱的头部大小归一化方法对年轻、老年和痴呆成年人的形态学和功能数据分析的统一方法:与手动测量总颅内体积相比的可靠性和验证。
Neuroimage. 2004 Oct;23(2):724-38. doi: 10.1016/j.neuroimage.2004.06.018.
9
Biclustering of expression data.表达数据的双聚类分析
Proc Int Conf Intell Syst Mol Biol. 2000;8:93-103.