• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Cas 边界:整 Cas 盒的自动定义。

Casboundary: automated definition of integral Cas cassettes.

机构信息

Institute of Mathematics and Computer Sciences, University of São Paulo, São Carlos, SP 13566-590, Brazil.

Bioinformatics Group, Department of Computer Science, University of Freiburg, 79110 Freiburg, Germany.

出版信息

Bioinformatics. 2021 Jun 16;37(10):1352-1359. doi: 10.1093/bioinformatics/btaa984.

DOI:10.1093/bioinformatics/btaa984
PMID:33226067
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8208735/
Abstract

MOTIVATION

CRISPR-Cas are important systems found in most archaeal and many bacterial genomes, providing adaptive immunity against mobile genetic elements in prokaryotes. The CRISPR-Cas systems are encoded by a set of consecutive cas genes, here termed cassette. The identification of cassette boundaries is key for finding cassettes in CRISPR research field. This is often carried out by using Hidden Markov Models and manual annotation. In this article, we propose the first method able to automatically define the cassette boundaries. In addition, we present a Cas-type predictive model used by the method to assign each gene located in the region defined by a cassette's boundaries a Cas label from a set of pre-defined Cas types. Furthermore, the proposed method can detect potentially new cas genes and decompose a cassette into its modules.

RESULTS

We evaluate the predictive performance of our proposed method on data collected from the two most recent CRISPR classification studies. In our experiments, we obtain an average similarity of 0.86 between the predicted and expected cassettes. Besides, we achieve F-scores above 0.9 for the classification of cas genes of known types and 0.73 for the unknown ones. Finally, we conduct two additional study cases, where we investigate the occurrence of potentially new cas genes and the occurrence of module exchange between different genomes.

AVAILABILITY AND IMPLEMENTATION

https://github.com/BackofenLab/Casboundary.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

CRISPR-Cas 是在大多数古菌和许多细菌基因组中发现的重要系统,为原核生物中的移动遗传元件提供了适应性免疫。CRISPR-Cas 系统由一组连续的 cas 基因编码,这里称为盒。盒边界的识别是在 CRISPR 研究领域中寻找盒的关键。这通常通过使用隐马尔可夫模型和手动注释来完成。在本文中,我们提出了第一个能够自动定义盒边界的方法。此外,我们还提出了一种 Cas 型预测模型,该方法用于为位于盒边界定义的区域中定位的每个基因分配来自一组预定义 Cas 类型的 Cas 标签。此外,所提出的方法可以检测潜在的新 cas 基因,并将盒分解为其模块。

结果

我们在最近的两项 CRISPR 分类研究中收集的数据上评估了我们提出的方法的预测性能。在我们的实验中,我们预测的和预期的盒之间的平均相似性为 0.86。此外,我们对已知类型的 cas 基因的分类获得了 F 分数高于 0.9,对未知类型的分类获得了 F 分数高于 0.73。最后,我们进行了另外两个案例研究,研究了潜在新 cas 基因的发生情况和不同基因组之间模块交换的发生情况。

可用性和实现

https://github.com/BackofenLab/Casboundary。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/a528add8fa35/btaa984f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/3ce6dba7a187/btaa984f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/9a16dad1c84a/btaa984f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/80dbda9be330/btaa984f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/26734a8f32b3/btaa984f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/feac62688647/btaa984f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/86a0424f690a/btaa984f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/a528add8fa35/btaa984f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/3ce6dba7a187/btaa984f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/9a16dad1c84a/btaa984f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/80dbda9be330/btaa984f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/26734a8f32b3/btaa984f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/feac62688647/btaa984f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/86a0424f690a/btaa984f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4f2f/8208735/a528add8fa35/btaa984f6.jpg

相似文献

1
Casboundary: automated definition of integral Cas cassettes.Cas 边界:整 Cas 盒的自动定义。
Bioinformatics. 2021 Jun 16;37(10):1352-1359. doi: 10.1093/bioinformatics/btaa984.
2
CRISPR-Cas systems: beyond adaptive immunity.CRISPR-Cas 系统:超越适应性免疫。
Nat Rev Microbiol. 2014 May;12(5):317-26. doi: 10.1038/nrmicro3241. Epub 2014 Apr 7.
3
Survey of clustered regularly interspaced short palindromic repeats and their associated Cas proteins (CRISPR/Cas) systems in multiple sequenced strains of Klebsiella pneumoniae.肺炎克雷伯菌多个测序菌株中规律成簇间隔短回文重复序列及其相关Cas蛋白(CRISPR/Cas)系统的调查
BMC Res Notes. 2015 Aug 4;8:332. doi: 10.1186/s13104-015-1285-7.
4
Comprehensive search for accessory proteins encoded with archaeal and bacterial type III CRISPR-cas gene cassettes reveals 39 new cas gene families.全面搜索具有古菌和细菌 III 型 CRISPR-Cas 基因盒编码的辅助蛋白,揭示了 39 个新的 Cas 基因家族。
RNA Biol. 2019 Apr;16(4):530-542. doi: 10.1080/15476286.2018.1483685. Epub 2018 Jun 19.
5
CRISPRcasIdentifier: Machine learning for accurate identification and classification of CRISPR-Cas systems.CRISPRcasIdentifier:用于准确识别和分类 CRISPR-Cas 系统的机器学习。
Gigascience. 2020 Jun 1;9(6). doi: 10.1093/gigascience/giaa062.
6
Systematic prediction of genes functionally linked to CRISPR-Cas systems by gene neighborhood analysis.通过基因邻域分析系统地预测与 CRISPR-Cas 系统功能相关的基因。
Proc Natl Acad Sci U S A. 2018 Jun 5;115(23):E5307-E5316. doi: 10.1073/pnas.1803440115. Epub 2018 May 21.
7
CRISPRCasdb a successor of CRISPRdb containing CRISPR arrays and cas genes from complete genome sequences, and tools to download and query lists of repeats and spacers.CRISPRCasdb 是 CRISPRdb 的一个后继者,包含来自完整基因组序列的 CRISPR 阵列和 cas 基因,以及用于下载和查询重复序列和间隔区列表的工具。
Nucleic Acids Res. 2020 Jan 8;48(D1):D535-D544. doi: 10.1093/nar/gkz915.
8
[Why so rare if so essentiel: the determinants of the sparse distribution of CRISPR-Cas systems in bacterial genomes].[若如此重要,为何如此罕见:细菌基因组中CRISPR-Cas系统稀疏分布的决定因素]
Biol Aujourdhui. 2017;211(4):255-264. doi: 10.1051/jbio/2018005. Epub 2018 Jun 29.
9
Phylogenomics of Cas4 family nucleases.Cas4家族核酸酶的系统发育基因组学
BMC Evol Biol. 2017 Nov 28;17(1):232. doi: 10.1186/s12862-017-1081-1.
10
CRISPR adaptive immune systems of Archaea.古菌的 CRISPR 适应性免疫系统。
RNA Biol. 2014;11(2):156-67. doi: 10.4161/rna.27990. Epub 2014 Feb 7.

引用本文的文献

1
Discovery of CRISPR-Cas12a clades using a large language model.使用大语言模型发现CRISPR-Cas12a进化枝
Nat Commun. 2025 Aug 23;16(1):7877. doi: 10.1038/s41467-025-63160-4.
2
Deepdefense: annotation of immune systems in prokaryotes using deep learning.深度防御:使用深度学习对原核生物的免疫系统进行注释。
Gigascience. 2024 Jan 2;13. doi: 10.1093/gigascience/giae062.
3
VISPR-online: a web-based interactive tool to visualize CRISPR screening experiments.VISPR-online:一个基于网络的交互式工具,用于可视化 CRISPR 筛选实验。

本文引用的文献

1
CRISPRcasIdentifier: Machine learning for accurate identification and classification of CRISPR-Cas systems.CRISPRcasIdentifier:用于准确识别和分类 CRISPR-Cas 系统的机器学习。
Gigascience. 2020 Jun 1;9(6). doi: 10.1093/gigascience/giaa062.
2
Evolutionary classification of CRISPR-Cas systems: a burst of class 2 and derived variants.CRISPR-Cas 系统的进化分类:Class 2 及其衍生变体的爆发。
Nat Rev Microbiol. 2020 Feb;18(2):67-83. doi: 10.1038/s41579-019-0299-x. Epub 2019 Dec 19.
3
Evolutionary entanglement of mobile genetic elements and host defence systems: guns for hire.
BMC Bioinformatics. 2021 Jun 24;22(1):344. doi: 10.1186/s12859-021-04275-5.
4
CRISPRloci: comprehensive and accurate annotation of CRISPR-Cas systems.CRISPR 基因座:CRISPR-Cas 系统的全面准确注释。
Nucleic Acids Res. 2021 Jul 2;49(W1):W125-W130. doi: 10.1093/nar/gkab456.
移动遗传元件与宿主防御系统的进化纠缠:雇佣枪手。
Nat Rev Genet. 2020 Feb;21(2):119-131. doi: 10.1038/s41576-019-0172-9. Epub 2019 Oct 14.
4
CRISPR-Cas bioinformatics.CRISPR-Cas 生物信息学。
Methods. 2020 Feb 1;172:3-11. doi: 10.1016/j.ymeth.2019.07.013. Epub 2019 Jul 19.
5
CRISPRdisco: An Automated Pipeline for the Discovery and Analysis of CRISPR-Cas Systems.CRISPRdisco:一种用于发现和分析CRISPR-Cas系统的自动化流程
CRISPR J. 2018 Apr;1(2):171-181. doi: 10.1089/crispr.2017.0022. Epub 2018 Apr 9.
6
Comprehensive search for accessory proteins encoded with archaeal and bacterial type III CRISPR-cas gene cassettes reveals 39 new cas gene families.全面搜索具有古菌和细菌 III 型 CRISPR-Cas 基因盒编码的辅助蛋白,揭示了 39 个新的 Cas 基因家族。
RNA Biol. 2019 Apr;16(4):530-542. doi: 10.1080/15476286.2018.1483685. Epub 2018 Jun 19.
7
CRISPRCasFinder, an update of CRISRFinder, includes a portable version, enhanced performance and integrates search for Cas proteins.CRISPRCasFinder 是 CRISRFinder 的更新版本,包括一个可移植版本,性能得到增强,并集成了 Cas 蛋白搜索功能。
Nucleic Acids Res. 2018 Jul 2;46(W1):W246-W251. doi: 10.1093/nar/gky425.
8
Not all predicted CRISPR-Cas systems are equal: isolated cas genes and classes of CRISPR like elements.并非所有预测的CRISPR-Cas系统都是相同的:分离的cas基因和CRISPR样元件类别。
BMC Bioinformatics. 2017 Feb 6;18(1):92. doi: 10.1186/s12859-017-1512-4.
9
Environmental microbiology: Viral diversity on the global stage.环境微生物学:全球范围内的病毒多样性。
Nat Microbiol. 2016 Oct 26;1(11):16205. doi: 10.1038/nmicrobiol.2016.205.
10
Characterizing leader sequences of CRISPR loci.表征CRISPR基因座的前导序列。
Bioinformatics. 2016 Sep 1;32(17):i576-i585. doi: 10.1093/bioinformatics/btw454.