• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ADACT:一种使用最少和相对缺失词来分析核苷酸和蛋白质序列间(不)相似性的工具。

ADACT: a tool for analysing (dis)similarity among nucleotide and protein sequences using minimal and relative absent words.

作者信息

Akon Mujtahid, Akon Muntashir, Kabir Mohimenul, Rahman M Saifur, Rahman M Sohel

机构信息

Department of CSE, BUET, Dhaka, Bangladesh.

Department of CSE, RUET, Rajshahi, Bangladesh.

出版信息

Bioinformatics. 2021 Jun 16;37(10):1468-1470. doi: 10.1093/bioinformatics/btaa853.

DOI:10.1093/bioinformatics/btaa853
PMID:33016997
Abstract

MOTIVATION

Researchers and practitioners use a number of popular sequence comparison tools that use many alignment-based techniques. Due to high time and space complexity and length-related restrictions, researchers often seek alignment-free tools. Recently, some interesting ideas, namely, Minimal Absent Words (MAW) and Relative Absent Words (RAW), have received much interest among the scientific community as distance measures that can give us alignment-free alternatives. This drives us to structure a framework for analysing biological sequences in an alignment-free manner.

RESULTS

In this application note, we present Alignment-free Dissimilarity Analysis & Comparison Tool (ADACT), a simple web-based tool that computes the analogy among sequences using a varied number of indexes through the distance matrix, species relation list and phylogenetic tree. This tool basically combines absent word (MAW or RAW) computation, dissimilarity measures, species relationship and thus brings all required software in one platform for the ease of researchers and practitioners alike in the field of bioinformatics. We have also developed a restful API.

AVAILABILITY AND IMPLEMENTATION

ADACT has been hosted at http://research.buet.ac.bd/ADACT/.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

研究人员和从业者使用许多流行的序列比较工具,这些工具采用了多种基于比对的技术。由于时间和空间复杂度高以及与长度相关的限制,研究人员经常寻求无比对工具。最近,一些有趣的概念,即最小缺失词(MAW)和相对缺失词(RAW),作为能够为我们提供无比对替代方案的距离度量,在科学界引起了广泛关注。这促使我们构建一个以无比对方式分析生物序列的框架。

结果

在本应用笔记中,我们展示了无比对差异分析与比较工具(ADACT),这是一个基于网络的简单工具,它通过距离矩阵、物种关系列表和系统发育树,使用多种指标来计算序列之间的相似度。该工具基本上结合了缺失词(MAW或RAW)计算、差异度量、物种关系,从而将所有所需软件整合在一个平台上,方便生物信息学领域的研究人员和从业者使用。我们还开发了一个RESTful API。

可用性与实现

ADACT托管于http://research.buet.ac.bd/ADACT/。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
ADACT: a tool for analysing (dis)similarity among nucleotide and protein sequences using minimal and relative absent words.ADACT:一种使用最少和相对缺失词来分析核苷酸和蛋白质序列间(不)相似性的工具。
Bioinformatics. 2021 Jun 16;37(10):1468-1470. doi: 10.1093/bioinformatics/btaa853.
2
Absent words and the (dis)similarity analysis of DNA sequences: an experimental study.缺失词与DNA序列的(不)相似性分析:一项实验研究。
BMC Res Notes. 2016 Mar 22;9:186. doi: 10.1186/s13104-016-1972-z.
3
K2 and K2*: efficient alignment-free sequence similarity measurement based on Kendall statistics.K2 和 K2*:基于 Kendall 统计量的高效无对齐序列相似性度量。
Bioinformatics. 2018 May 15;34(10):1682-1689. doi: 10.1093/bioinformatics/btx809.
4
Fast and accurate phylogeny reconstruction using filtered spaced-word matches.使用过滤后的间隔词匹配进行快速准确的系统发育重建。
Bioinformatics. 2017 Apr 1;33(7):971-979. doi: 10.1093/bioinformatics/btw776.
5
Spaced words and kmacs: fast alignment-free sequence comparison based on inexact word matches.空格词和 kmacs:基于不精确词匹配的快速无对齐序列比较。
Nucleic Acids Res. 2014 Jul;42(Web Server issue):W7-11. doi: 10.1093/nar/gku398. Epub 2014 May 14.
6
emMAW: computing minimal absent words in external memory.emMAW:计算外部内存中的最小缺失词。
Bioinformatics. 2017 Sep 1;33(17):2746-2749. doi: 10.1093/bioinformatics/btx209.
7
ntHash: recursive nucleotide hashing.ntHash:递归核苷酸哈希
Bioinformatics. 2016 Nov 15;32(22):3492-3494. doi: 10.1093/bioinformatics/btw397. Epub 2016 Jul 16.
8
Sequence Comparison Without Alignment: The SpaM Approaches.无需比对的序列比较:SpaM方法
Methods Mol Biol. 2021;2231:121-134. doi: 10.1007/978-1-0716-1036-7_8.
9
RNA-TVcurve: a Web server for RNA secondary structure comparison based on a multi-scale similarity of its triple vector curve representation.RNA-TVcurve:一个基于三向量曲线表示的多尺度相似性进行RNA二级结构比较的网络服务器。
BMC Bioinformatics. 2017 Jan 21;18(1):51. doi: 10.1186/s12859-017-1481-7.
10
CD-MAWS: An Alignment-Free Phylogeny Estimation Method Using Cosine Distance on Minimal Absent Word Sets.CD-MAWS:一种基于最小缺失词集余弦距离的无比对系统发育估计方法。
IEEE/ACM Trans Comput Biol Bioinform. 2023 Jan-Feb;20(1):196-205. doi: 10.1109/TCBB.2021.3136792. Epub 2023 Feb 3.

引用本文的文献

1
Revealing protein sequence organization via contiguous hydrophobicity with the blobulator toolkit.使用Blobulator工具包通过连续疏水性揭示蛋白质序列组织。
bioRxiv. 2025 Mar 18:2024.01.15.575761. doi: 10.1101/2024.01.15.575761.