• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CHASM 和 SNVBox:用于检测癌症中生物学重要的单核苷酸突变的工具包。

CHASM and SNVBox: toolkit for detecting biologically important single nucleotide mutations in cancer.

机构信息

Department of Biomedical Engineering and Institute for Computational Medicine, Johns Hopkins University, Baltimore, MD, USA.

出版信息

Bioinformatics. 2011 Aug 1;27(15):2147-8. doi: 10.1093/bioinformatics/btr357. Epub 2011 Jun 17.

DOI:10.1093/bioinformatics/btr357
PMID:21685053
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3137226/
Abstract

SUMMARY

Thousands of cancer exomes are currently being sequenced, yielding millions of non-synonymous single nucleotide variants (SNVs) of possible relevance to disease etiology. Here, we provide a software toolkit to prioritize SNVs based on their predicted contribution to tumorigenesis. It includes a database of precomputed, predictive features covering all positions in the annotated human exome and can be used either stand-alone or as part of a larger variant discovery pipeline.

AVAILABILITY AND IMPLEMENTATION

MySQL database, source code and binaries freely available for academic/government use at http://wiki.chasmsoftware.org, Source in Python and C++. Requires 32 or 64-bit Linux system (tested on Fedora Core 8,10,11 and Ubuntu 10), 2.5*≤ Python <3.0*, MySQL server >5.0, 60 GB available hard disk space (50 MB for software and data files, 40 GB for MySQL database dump when uncompressed), 2 GB of RAM.

摘要

摘要

目前正在对数千个人类癌症外显子进行测序,产生了可能与疾病病因学相关的数百万个非同义单核苷酸变异(SNV)。在这里,我们提供了一个软件工具包,用于根据其对肿瘤发生的预测贡献对 SNV 进行优先级排序。它包括一个预计算的、可预测的特征数据库,涵盖了注释人类外显子中的所有位置,可单独使用,也可作为更大的变异发现管道的一部分。

可用性和实现

MySQL 数据库、源代码和二进制文件可在 http://wiki.chasmsoftware.org 上免费供学术/政府使用,Python 和 C++中的源代码。需要 32 位或 64 位 Linux 系统(在 Fedora Core 8、10、11 和 Ubuntu 10 上进行了测试),Python < 3.0*,MySQL 服务器 > 5.0,2.5*≤,60GB 可用硬盘空间(软件和数据文件占用 50MB,未压缩时 MySQL 数据库转储占用 40GB),2GB RAM。

相似文献

1
CHASM and SNVBox: toolkit for detecting biologically important single nucleotide mutations in cancer.CHASM 和 SNVBox:用于检测癌症中生物学重要的单核苷酸突变的工具包。
Bioinformatics. 2011 Aug 1;27(15):2147-8. doi: 10.1093/bioinformatics/btr357. Epub 2011 Jun 17.
2
Predicting the functional consequences of somatic missense mutations found in tumors.预测肿瘤中发现的体细胞错义突变的功能后果。
Methods Mol Biol. 2014;1101:135-59. doi: 10.1007/978-1-62703-721-1_8.
3
FILTUS: a desktop GUI for fast and efficient detection of disease-causing variants, including a novel autozygosity detector.FILTUS:一款用于快速高效检测致病变异(包括新型纯合性检测器)的桌面图形用户界面。
Bioinformatics. 2016 May 15;32(10):1592-4. doi: 10.1093/bioinformatics/btw046. Epub 2016 Jan 27.
4
Saint: a lightweight integration environment for model annotation.圣:模型标注的轻量级集成环境。
Bioinformatics. 2009 Nov 15;25(22):3026-7. doi: 10.1093/bioinformatics/btp523. Epub 2009 Sep 4.
5
SNP-PHAGE--High throughput SNP discovery pipeline.SNP-噬菌体——高通量单核苷酸多态性发现流程
BMC Bioinformatics. 2006 Oct 23;7:468. doi: 10.1186/1471-2105-7-468.
6
Cancer Gene Discovery by Network Analysis of Somatic Mutations Using the MUFFINN Server.使用MUFFINN服务器通过体细胞突变的网络分析发现癌症基因
Methods Mol Biol. 2019;1907:37-50. doi: 10.1007/978-1-4939-8967-6_3.
7
JASPAR RESTful API: accessing JASPAR data from any programming language.JASPAR RESTful API:从任何编程语言访问 JASPAR 数据。
Bioinformatics. 2018 May 1;34(9):1612-1614. doi: 10.1093/bioinformatics/btx804.
8
BioRuby: bioinformatics software for the Ruby programming language.BioRuby:用于 Ruby 编程语言的生物信息学软件。
Bioinformatics. 2010 Oct 15;26(20):2617-9. doi: 10.1093/bioinformatics/btq475. Epub 2010 Aug 25.
9
Identifying cancer mutation targets across thousands of samples: MuteProc, a high throughput mutation analysis pipeline.鉴定上千个样本中的癌症突变靶标:高通量突变分析流水线 MuteProc。
BMC Bioinformatics. 2013 May 28;14:167. doi: 10.1186/1471-2105-14-167.
10
SiNVICT: ultra-sensitive detection of single nucleotide variants and indels in circulating tumour DNA.SiNVICT:循环肿瘤 DNA 中单核苷酸变异和插入缺失的超灵敏检测。
Bioinformatics. 2017 Jan 1;33(1):26-34. doi: 10.1093/bioinformatics/btw536. Epub 2016 Aug 16.

引用本文的文献

1
Homozygous Variant Causes Pure Hair and Nail Ectodermal Dysplasia via Reduction in Protein Stability.纯合子变异通过降低蛋白质稳定性导致单纯毛发和指甲外胚层发育不良。
Hum Mutat. 2024 Jul 1;2024:6420246. doi: 10.1155/2024/6420246. eCollection 2024.
2
Assessing the predicted impact of single amino acid substitutions in MAPK proteins for CAGI6 challenges.评估丝裂原活化蛋白激酶(MAPK)蛋白中单个氨基酸取代对CAGI6挑战的预测影响。
Hum Genet. 2025 Mar;144(2-3):265-280. doi: 10.1007/s00439-024-02724-8. Epub 2025 Feb 20.
3
Advances in predicting breast cancer driver mutations: Tools for precision oncology (Review).预测乳腺癌驱动突变的新进展:精准肿瘤学的工具(综述)。
Int J Mol Med. 2025 Jan;55(1). doi: 10.3892/ijmm.2024.5447. Epub 2024 Oct 25.
4
Machine learning optimized DriverDetect software for high precision prediction of deleterious mutations in human cancers.机器学习优化的 DriverDetect 软件,用于高精度预测人类癌症中的有害突变。
Sci Rep. 2024 Sep 30;14(1):22618. doi: 10.1038/s41598-024-71422-2.
5
CDMPred: a tool for predicting cancer driver missense mutations with high-quality passenger mutations.CDMPred:一种用于预测具有高质量乘客突变的癌症驱动点突变的工具。
PeerJ. 2024 Sep 6;12:e17991. doi: 10.7717/peerj.17991. eCollection 2024.
6
Variant Impact Predictor database (VIPdb), version 2: trends from three decades of genetic variant impact predictors.变异影响预测器数据库(VIPdb),版本 2:三十年来遗传变异影响预测器的趋势。
Hum Genomics. 2024 Aug 28;18(1):90. doi: 10.1186/s40246-024-00663-z.
7
Variant Impact Predictor database (VIPdb), version 2: Trends from 25 years of genetic variant impact predictors.变异影响预测数据库(VIPdb),版本2:25年基因变异影响预测的趋势
bioRxiv. 2024 Jun 28:2024.06.25.600283. doi: 10.1101/2024.06.25.600283.
8
Interface-guided phenotyping of coding variants in the transcription factor RUNX1.转录因子 RUNX1 中编码变异的接口引导表型分析。
Cell Rep. 2024 Jul 23;43(7):114436. doi: 10.1016/j.celrep.2024.114436. Epub 2024 Jul 4.
9
Enhancing missense variant pathogenicity prediction with protein language models using VariPred.利用 VariPred 利用蛋白质语言模型增强错义变异致病性预测。
Sci Rep. 2024 Apr 7;14(1):8136. doi: 10.1038/s41598-024-51489-7.
10
Network-based prediction approach for cancer-specific driver missense mutations using a graph neural network.基于图神经网络的癌症特异性驱动错义突变的网络预测方法。
BMC Bioinformatics. 2023 Oct 10;24(1):383. doi: 10.1186/s12859-023-05507-6.

本文引用的文献

1
Prioritization of driver mutations in pancreatic cancer using cancer-specific high-throughput annotation of somatic mutations (CHASM).利用癌症特异性高通量注释体细胞突变(CHASM)对胰腺癌中的驱动突变进行优先级排序。
Cancer Biol Ther. 2010 Sep 15;10(6):582-7. doi: 10.4161/cbt.10.6.12537. Epub 2010 Oct 1.
2
Bioinformatic tools for identifying disease gene and SNP candidates.用于识别疾病基因和单核苷酸多态性候选位点的生物信息学工具。
Methods Mol Biol. 2010;628:307-19. doi: 10.1007/978-1-60327-367-1_17.
3
Cancer-specific high-throughput annotation of somatic mutations: computational prediction of driver missense mutations.体细胞突变的癌症特异性高通量注释:驱动错义突变的计算预测
Cancer Res. 2009 Aug 15;69(16):6660-7. doi: 10.1158/0008-5472.CAN-09-1133. Epub 2009 Aug 4.
4
The consensus coding sequence (CCDS) project: Identifying a common protein-coding gene set for the human and mouse genomes.共有编码序列(CCDS)计划:鉴定人类和小鼠基因组的共同蛋白质编码基因集。
Genome Res. 2009 Jul;19(7):1316-23. doi: 10.1101/gr.080531.108. Epub 2009 Jun 4.
5
Next generation tools for the annotation of human SNPs.用于人类单核苷酸多态性注释的下一代工具。
Brief Bioinform. 2009 Jan;10(1):35-52. doi: 10.1093/bib/bbn047.
6
The Catalogue of Somatic Mutations in Cancer (COSMIC).癌症体细胞突变目录(COSMIC)。
Curr Protoc Hum Genet. 2008 Apr;Chapter 10:Unit 10.11. doi: 10.1002/0471142905.hg1011s57.
7
CanPredict: a computational tool for predicting cancer-associated missense mutations.CanPredict:一种用于预测癌症相关错义突变的计算工具。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W595-8. doi: 10.1093/nar/gkm405. Epub 2007 May 30.
8
NCBI reference sequences (RefSeq): a curated non-redundant sequence database of genomes, transcripts and proteins.美国国立生物技术信息中心参考序列(RefSeq):一个经过整理的基因组、转录本和蛋白质的非冗余序列数据库。
Nucleic Acids Res. 2007 Jan;35(Database issue):D61-5. doi: 10.1093/nar/gkl842. Epub 2006 Nov 27.
9
Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.基因集富集分析:一种基于知识的方法用于解读全基因组表达谱。
Proc Natl Acad Sci U S A. 2005 Oct 25;102(43):15545-50. doi: 10.1073/pnas.0506580102. Epub 2005 Sep 30.
10
An overview of Ensembl.Ensembl概述。
Genome Res. 2004 May;14(5):925-8. doi: 10.1101/gr.1860604. Epub 2004 Apr 12.