• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PERF:一种从大型 DNA 序列中进行超快速和高效微卫星识别的穷举算法。

PERF: an exhaustive algorithm for ultra-fast and efficient identification of microsatellites from large DNA sequences.

机构信息

CSIR - Centre for Cellular and Molecular Biology, Hyderabad, Telangana 500007, India.

出版信息

Bioinformatics. 2018 Mar 15;34(6):943-948. doi: 10.1093/bioinformatics/btx721.

DOI:10.1093/bioinformatics/btx721
PMID:29121165
Abstract

MOTIVATION

Microsatellites or Simple Sequence Repeats (SSRs) are short tandem repeats of DNA motifs present in all genomes. They have long been used for a variety of purposes in the areas of population genetics, genotyping, marker-assisted selection and forensics. Numerous studies have highlighted their functional roles in genome organization and gene regulation. Though several tools are currently available to identify SSRs from genomic sequences, they have significant limitations.

RESULTS

We present a novel algorithm called PERF for extremely fast and comprehensive identification of microsatellites from DNA sequences of any size. PERF is several fold faster than existing algorithms and uses up to 5-fold lesser memory. It provides a clean and flexible command-line interface to change the default settings, and produces output in an easily-parseable tab-separated format. In addition, PERF generates an interactive and stand-alone HTML report with charts and tables for easy downstream analysis.

AVAILABILITY AND IMPLEMENTATION

PERF is implemented in the Python programming language. It is freely available on PyPI under the package name perf_ssr, and can be installed directly using pip or easy_install. The documentation of PERF is available at https://github.com/rkmlab/perf. The source code of PERF is deposited in GitHub at https://github.com/rkmlab/perf under an MIT license.

CONTACT

tej@ccmb.res.in.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

微卫星或简单重复序列 (SSR) 是存在于所有基因组中的 DNA 基序的短串联重复。它们长期以来一直被用于群体遗传学、基因分型、标记辅助选择和法医学等领域的各种目的。许多研究强调了它们在基因组组织和基因调控中的功能作用。尽管目前有几种工具可用于从基因组序列中识别 SSR,但它们存在显著的局限性。

结果

我们提出了一种名为 PERF 的新算法,用于从任何大小的 DNA 序列中极其快速和全面地识别微卫星。PERF 比现有算法快几倍,使用的内存少 5 倍。它提供了一个干净灵活的命令行接口来更改默认设置,并以易于解析的制表符分隔格式生成输出。此外,PERF 生成带有图表和表格的交互式和独立的 HTML 报告,便于下游分析。

可用性和实现

PERF 是用 Python 编程语言实现的。它在 PyPI 上以 perf_ssr 包的名称免费提供,并可以使用 pip 或 easy_install 直接安装。PERF 的文档可在 https://github.com/rkmlab/perf 上获得。PERF 的源代码存放在 GitHub 上,位于 https://github.com/rkmlab/perf 下,采用 MIT 许可证。

联系人

tej@ccmb.res.in。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
PERF: an exhaustive algorithm for ultra-fast and efficient identification of microsatellites from large DNA sequences.PERF:一种从大型 DNA 序列中进行超快速和高效微卫星识别的穷举算法。
Bioinformatics. 2018 Mar 15;34(6):943-948. doi: 10.1093/bioinformatics/btx721.
2
Krait: an ultrafast tool for genome-wide survey of microsatellites and primer design.Krait:一种用于微卫星全基因组快速检测和引物设计的工具。
Bioinformatics. 2018 Feb 15;34(4):681-683. doi: 10.1093/bioinformatics/btx665.
3
SA-SSR: a suffix array-based algorithm for exhaustive and efficient SSR discovery in large genetic sequences.SA-SSR:一种基于后缀数组的算法,用于在大型基因序列中全面高效地发现简单重复序列(SSR)
Bioinformatics. 2016 Sep 1;32(17):2707-9. doi: 10.1093/bioinformatics/btw298. Epub 2016 May 11.
4
Kmer-SSR: a fast and exhaustive SSR search algorithm.Kmer-SSR:一种快速而全面的 SSR 搜索算法。
Bioinformatics. 2017 Dec 15;33(24):3922-3928. doi: 10.1093/bioinformatics/btx538.
5
TSSV: a tool for characterization of complex allelic variants in pure and mixed genomes.TSSV:一种用于纯合和混合基因组中复杂等位基因变异体特征分析的工具。
Bioinformatics. 2014 Jun 15;30(12):1651-9. doi: 10.1093/bioinformatics/btu068. Epub 2014 Feb 13.
6
Goldilocks: a tool for identifying genomic regions that are 'just right'.金发姑娘:一种用于识别“恰到好处”的基因组区域的工具。
Bioinformatics. 2016 Jul 1;32(13):2047-9. doi: 10.1093/bioinformatics/btw116. Epub 2016 Mar 7.
7
Mosdepth: quick coverage calculation for genomes and exomes.Mosdepth:基因组和外显子组的快速覆盖度计算。
Bioinformatics. 2018 Mar 1;34(5):867-868. doi: 10.1093/bioinformatics/btx699.
8
GSEApy: a comprehensive package for performing gene set enrichment analysis in Python.GSEApy:一个用于在 Python 中进行基因集富集分析的综合软件包。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac757.
9
Efficient population-scale variant analysis and prioritization with VAPr.利用 VAPr 进行高效的群体规模变异分析和优先级排序。
Bioinformatics. 2018 Aug 15;34(16):2843-2845. doi: 10.1093/bioinformatics/bty192.
10
ntCard: a streaming algorithm for cardinality estimation in genomics data.ntCard:一种用于基因组数据基数估计的流算法。
Bioinformatics. 2017 May 1;33(9):1324-1330. doi: 10.1093/bioinformatics/btw832.

引用本文的文献

1
Pytrf: a python package for finding tandem repeats from genomic sequences.Pytrf:一个用于从基因组序列中查找串联重复序列的Python软件包。
BMC Bioinformatics. 2025 Jun 4;26(1):151. doi: 10.1186/s12859-025-06168-3.
2
FOGS: A SNPSTR Marker Database to Combat Wildlife Trafficking and a Cell Culture Bank for Ex-Situ Conservation.FOGS:一个用于打击野生动物非法交易的单核苷酸多态性串联重复序列标记数据库以及一个用于迁地保护的细胞培养库。
Mol Ecol Resour. 2025 May;25(4):e14062. doi: 10.1111/1755-0998.14062. Epub 2025 Jan 10.
3
Characterization of hAT DNA transposon superfamily in the genome of Neotropical fish Apareiodon sp.
解析 hAT 家族 DNA 转座子在新热带鱼 Apareiodon sp. 基因组中的特征
Mol Genet Genomics. 2024 Oct 9;299(1):96. doi: 10.1007/s00438-024-02190-x.
4
Streamlining of Simple Sequence Repeat Data Mining Methodologies and Pipelines for Crop Scanning.简化用于作物扫描的简单序列重复数据挖掘方法和流程
Plants (Basel). 2024 Sep 19;13(18):2619. doi: 10.3390/plants13182619.
5
Mutation Rate and Effective Population Size of the Model Cooperative Bacterium Myxococcus xanthus.模式合作细菌粘细菌的突变率和有效种群大小。
Genome Biol Evol. 2024 May 2;16(5). doi: 10.1093/gbe/evae066.
6
Short tandem repeat mutations regulate gene expression in colorectal cancer.短串联重复突变调节结直肠癌中的基因表达。
Sci Rep. 2024 Feb 9;14(1):3331. doi: 10.1038/s41598-024-53739-0.
7
Chromosomal scale assembly reveals localized structural variants in avian caecal coccidian parasite Eimeria tenella.染色体水平的组装揭示了禽类盲肠球虫寄生虫柔嫩艾美耳球虫中的局部结构变异。
Sci Rep. 2023 Dec 20;13(1):22802. doi: 10.1038/s41598-023-50117-0.
8
Reference quality genome sequence of Indian pomegranate cv. 'Bhagawa' ( L.).印度石榴品种‘Bhagawa’(L.)的参考质量基因组序列。
Front Plant Sci. 2022 Sep 15;13:947164. doi: 10.3389/fpls.2022.947164. eCollection 2022.
9
Microsatellite Variation in the Most Devastating Beetle Pests (Coleoptera: Curculionidae) of Agricultural and Forest Crops.农业和林业作物上最具破坏性的甲虫害虫(鞘翅目:象甲科)的微卫星变异。
Int J Mol Sci. 2022 Aug 30;23(17):9847. doi: 10.3390/ijms23179847.
10
BigFiRSt: A Software Program Using Big Data Technique for Mining Simple Sequence Repeats From Large-Scale Sequencing Data.BigFiRSt:一种使用大数据技术从大规模测序数据中挖掘简单序列重复序列的软件程序。
Front Big Data. 2022 Jan 18;4:727216. doi: 10.3389/fdata.2021.727216. eCollection 2021.