• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

将生物学知识纳入基因聚类的距离计算中。

Incorporation of biological knowledge into distance for clustering genes.

作者信息

Boratyn Grzegorz M, Datta Susmita, Datta Somnath

机构信息

Clinical Proteomics Center, University of Louisville, Louisville, KY 40202, USA.

出版信息

Bioinformation. 2007 Apr 10;1(10):396-405. doi: 10.6026/97320630001396.

DOI:10.6026/97320630001396
PMID:17597929
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1896054/
Abstract

UNLABELLED

In this paper we propose a data based algorithm to marry existing biological knowledge (e.g., functional annotations of genes) with experimental data (gene expression profiles) in creating an overall dissimilarity that can be used with any clustering algorithm that uses a general dissimilarity matrix. We explore this idea with two publicly available gene expression data sets and functional annotations where the results are compared with the clustering results that uses only the experimental data. Although more elaborate evaluations might be called for, the present paper makes a strong case for utilizing existing biological information in the clustering process.

AVAILABILITY

Supplement is available at www.somnathdatta.org/Supp/Bioinformation/appendix.pdf.

摘要

未标注

在本文中,我们提出一种基于数据的算法,将现有的生物学知识(例如基因的功能注释)与实验数据(基因表达谱)相结合,以创建一个总体差异度,该差异度可用于任何使用通用差异矩阵的聚类算法。我们使用两个公开可用的基因表达数据集和功能注释来探索这一想法,并将结果与仅使用实验数据的聚类结果进行比较。尽管可能需要更详尽的评估,但本文有力地证明了在聚类过程中利用现有生物学信息的合理性。

可用性

补充材料可在www.somnathdatta.org/Supp/Bioinformation/appendix.pdf获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/b97949a04079/97320630001396F4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/b6fdf1fe020f/97320630001396F1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/397bdf0ebdb9/97320630001396F2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/1e5f053760bd/97320630001396F3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/b97949a04079/97320630001396F4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/b6fdf1fe020f/97320630001396F1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/397bdf0ebdb9/97320630001396F2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/1e5f053760bd/97320630001396F3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8736/1896054/b97949a04079/97320630001396F4.jpg

相似文献

1
Incorporation of biological knowledge into distance for clustering genes.将生物学知识纳入基因聚类的距离计算中。
Bioinformation. 2007 Apr 10;1(10):396-405. doi: 10.6026/97320630001396.
2
Novel symmetry-based gene-gene dissimilarity measures utilizing Gene Ontology: Application in gene clustering.基于新型对称的基因-基因相异度度量方法,并利用基因本体论:在基因聚类中的应用。
Gene. 2018 Dec 30;679:341-351. doi: 10.1016/j.gene.2018.08.062. Epub 2018 Sep 2.
3
Weighted rank aggregation of cluster validation measures: a Monte Carlo cross-entropy approach.聚类验证指标的加权排序聚合:一种蒙特卡洛交叉熵方法。
Bioinformatics. 2007 Jul 1;23(13):1607-15. doi: 10.1093/bioinformatics/btm158. Epub 2007 May 5.
4
Average correlation clustering algorithm (ACCA) for grouping of co-regulated genes with similar pattern of variation in their expression values.平均相关聚类算法(ACCA)用于对具有相似表达值变化模式的共调控基因进行分组。
J Biomed Inform. 2010 Aug;43(4):560-8. doi: 10.1016/j.jbi.2010.02.001. Epub 2010 Feb 6.
5
Divisive Correlation Clustering Algorithm (DCCA) for grouping of genes: detecting varying patterns in expression profiles.用于基因分组的分裂相关聚类算法(DCCA):检测表达谱中的变化模式。
Bioinformatics. 2008 Jun 1;24(11):1359-66. doi: 10.1093/bioinformatics/btn133. Epub 2008 Apr 10.
6
Incorporating biological knowledge into distance-based clustering analysis of microarray gene expression data.将生物学知识融入基于距离的微阵列基因表达数据聚类分析中。
Bioinformatics. 2006 May 15;22(10):1259-68. doi: 10.1093/bioinformatics/btl065. Epub 2006 Feb 24.
7
Incorporating gene ontology into fuzzy relational clustering of microarray gene expression data.将基因本体论纳入微阵列基因表达数据的模糊关系聚类中。
Biosystems. 2018 Jan;163:1-10. doi: 10.1016/j.biosystems.2017.09.017. Epub 2017 Nov 4.
8
Metric for measuring the effectiveness of clustering of DNA microarray expression.用于测量 DNA 微阵列表达聚类有效性的度量。
BMC Bioinformatics. 2006 Sep 6;7 Suppl 2(Suppl 2):S5. doi: 10.1186/1471-2105-7-S2-S5.
9
Detecting clusters of different geometrical shapes in microarray gene expression data.在微阵列基因表达数据中检测不同几何形状的聚类。
Bioinformatics. 2005 May 1;21(9):1927-34. doi: 10.1093/bioinformatics/bti251. Epub 2005 Jan 12.
10
Clustering of gene expression profiles: creating initialization-independent clusterings by eliminating unstable genes.
J Integr Bioinform. 2010 Mar 25;7(3):455. doi: 10.2390/biecoll-jib-2010-134.

引用本文的文献

1
Clustering-based approaches to SAGE data mining.基于聚类的 SAGE 数据挖掘方法。
BioData Min. 2008 Jul 17;1(1):5. doi: 10.1186/1756-0381-1-5.

本文引用的文献

1
Biologically supervised hierarchical clustering algorithms for gene expression data.用于基因表达数据的生物监督层次聚类算法。
Conf Proc IEEE Eng Med Biol Soc. 2006;2006:5515-8. doi: 10.1109/IEMBS.2006.260308.
2
Weighted rank aggregation of cluster validation measures: a Monte Carlo cross-entropy approach.聚类验证指标的加权排序聚合:一种蒙特卡洛交叉熵方法。
Bioinformatics. 2007 Jul 1;23(13):1607-15. doi: 10.1093/bioinformatics/btm158. Epub 2007 May 5.
3
Methods for evaluating clustering algorithms for gene expression data using a reference set of functional classes.
使用功能类别参考集评估基因表达数据聚类算法的方法。
BMC Bioinformatics. 2006 Aug 31;7:397. doi: 10.1186/1471-2105-7-397.
4
Incorporating biological knowledge into distance-based clustering analysis of microarray gene expression data.将生物学知识融入基于距离的微阵列基因表达数据聚类分析中。
Bioinformatics. 2006 May 15;22(10):1259-68. doi: 10.1093/bioinformatics/btl065. Epub 2006 Feb 24.
5
Computational cluster validation in post-genomic data analysis.后基因组数据分析中的计算聚类验证
Bioinformatics. 2005 Aug 1;21(15):3201-12. doi: 10.1093/bioinformatics/bti517. Epub 2005 May 24.
6
Transcriptomic changes in human breast cancer progression as determined by serial analysis of gene expression.通过基因表达序列分析确定的人类乳腺癌进展中的转录组变化。
Breast Cancer Res. 2004;6(5):R499-513. doi: 10.1186/bcr899. Epub 2004 Jul 6.
7
Comparisons and validation of statistical clustering techniques for microarray gene expression data.微阵列基因表达数据统计聚类技术的比较与验证
Bioinformatics. 2003 Mar 1;19(4):459-66. doi: 10.1093/bioinformatics/btg025.
8
The transcriptional program of sporulation in budding yeast.芽殖酵母中孢子形成的转录程序。
Science. 1998 Oct 23;282(5389):699-705. doi: 10.1126/science.282.5389.699.