• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用基于比对和无比对算法生成 H1N1 NS1 基因序列的最小模型。

Generating Minimal Models of H1N1 NS1 Gene Sequences Using Alignment-Based and Alignment-Free Algorithms.

机构信息

Institute for Interdisciplinary Information Sciences, Tsinghua University, Beijing 100084, China.

Qiuzhen College, Tsinghua University, Beijing 100084, China.

出版信息

Genes (Basel). 2023 Jan 10;14(1):186. doi: 10.3390/genes14010186.

DOI:10.3390/genes14010186
PMID:36672928
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9858667/
Abstract

For virus classification and tracing, one idea is to generate minimal models from the gene sequences of each virus group for comparative analysis within and between classes, as well as classification and tracing of new sequences. The starting point of defining a minimal model for a group of gene sequences is to find their longest common sequence (LCS), but this is a non-deterministic polynomial-time hard (NP-hard) problem. Therefore, we applied some heuristic approaches of finding LCS, as well as some of the newer methods of treating gene sequences, including multiple sequence alignment (MSA) and k-mer natural vector (NV) encoding. To evaluate our algorithms, a five-fold cross validation classification scheme on a dataset of H1N1 virus non-structural protein 1 (NS1) gene was analyzed. The results indicate that the MSA-based algorithm has the best performance measured by classification accuracy, while the NV-based algorithm exhibits advantages in the time complexity of generating minimal models.

摘要

对于病毒分类和溯源,一种思路是从每组病毒的基因序列中生成最小模型,以便在类内和类间进行比较分析,以及对新序列进行分类和溯源。定义一组基因序列最小模型的出发点是找到它们的最长公共序列(LCS),但这是一个非确定性多项式时间难题(NP-hard)。因此,我们应用了一些寻找 LCS 的启发式方法,以及一些处理基因序列的新方法,包括多序列比对(MSA)和 k-mer 自然向量(NV)编码。为了评估我们的算法,我们对 H1N1 病毒非结构蛋白 1(NS1)基因数据集进行了五次交叉验证分类方案分析。结果表明,基于 MSA 的算法在分类准确性方面表现最佳,而基于 NV 的算法在生成最小模型的时间复杂度方面具有优势。

相似文献

1
Generating Minimal Models of H1N1 NS1 Gene Sequences Using Alignment-Based and Alignment-Free Algorithms.使用基于比对和无比对算法生成 H1N1 NS1 基因序列的最小模型。
Genes (Basel). 2023 Jan 10;14(1):186. doi: 10.3390/genes14010186.
2
Deposition and extension approach to find longest common subsequence for thousands of long sequences.沉积和扩展方法来寻找数千个长序列的最长公共子序列。
Comput Biol Chem. 2010 Jun;34(3):149-57. doi: 10.1016/j.compbiolchem.2010.05.001. Epub 2010 May 11.
3
Protein multiple sequence alignment by hybrid bio-inspired algorithms.基于混合生物启发式算法的蛋白质多重序列比对。
Nucleic Acids Res. 2011 Mar;39(6):1980-92. doi: 10.1093/nar/gkq1052. Epub 2010 Nov 10.
4
Randomized and parallel algorithms for distance matrix calculations in multiple sequence alignment.用于多序列比对中距离矩阵计算的随机和平行算法。
J Clin Monit Comput. 2005 Oct;19(4-5):351-9. doi: 10.1007/s10877-005-0680-3.
5
ProgSIO-MSA: Progressive-based single iterative optimization framework for multiple sequence alignment using an effective scoring system.ProgSIO-MSA:基于渐进式的单次迭代优化框架,使用有效的评分系统进行多序列比对。
J Bioinform Comput Biol. 2020 Apr;18(2):2050005. doi: 10.1142/S0219720020500055. Epub 2020 May 6.
6
A fast parallel algorithm for finding the longest common sequence of multiple biosequences.一种用于寻找多个生物序列最长公共序列的快速并行算法。
BMC Bioinformatics. 2006 Dec 12;7 Suppl 4(Suppl 4):S4. doi: 10.1186/1471-2105-7-S4-S4.
7
A Parallel Multiobjective Metaheuristic for Multiple Sequence Alignment.一种用于多序列比对的并行多目标元启发式算法。
J Comput Biol. 2018 Sep;25(9):1009-1022. doi: 10.1089/cmb.2018.0031. Epub 2018 Apr 19.
8
A polynomial time solvable formulation of multiple sequence alignment.多重序列比对的多项式时间可解公式化表述。
J Comput Biol. 2006 Mar;13(2):309-19. doi: 10.1089/cmb.2006.13.309.
9
An OpenMP-based tool for finding longest common subsequence in bioinformatics.一种基于OpenMP的生物信息学中查找最长公共子序列的工具。
BMC Res Notes. 2019 Apr 11;12(1):220. doi: 10.1186/s13104-019-4256-6.
10
Inefficient control of host gene expression by the 2009 pandemic H1N1 influenza A virus NS1 protein.2009 年甲型 H1N1 流感病毒 NS1 蛋白对宿主基因表达的低效控制。
J Virol. 2010 Jul;84(14):6909-22. doi: 10.1128/JVI.00081-10. Epub 2010 May 5.

本文引用的文献

1
Confidence interval for micro-averaged and macro-averaged scores.微观平均和宏观平均分数的置信区间。
Appl Intell (Dordr). 2022 Mar;52(5):4961-4972. doi: 10.1007/s10489-021-02635-5. Epub 2021 Jul 31.
2
Identification of HIV Rapid Mutations Using Differences in Nucleotide Distribution over Time.利用核苷酸随时间分布的差异鉴定 HIV 快速突变。
Genes (Basel). 2022 Jan 19;13(2):170. doi: 10.3390/genes13020170.
3
Geometric construction of viral genome space and its applications.病毒基因组空间的几何构建及其应用。
Comput Struct Biotechnol J. 2021 Jul 27;19:4226-4234. doi: 10.1016/j.csbj.2021.07.028. eCollection 2021.
4
Analysis of the Genomic Distance Between Bat Coronavirus RaTG13 and SARS-CoV-2 Reveals Multiple Origins of COVID-19.蝙蝠冠状病毒RaTG13与严重急性呼吸综合征冠状病毒2(SARS-CoV-2)之间的基因组距离分析揭示了2019冠状病毒病(COVID-19)的多个起源。
Acta Math Sci. 2021;41(3):1017-1022. doi: 10.1007/s10473-021-0323-x. Epub 2021 Apr 19.
5
A brief review of influenza virus infection.流感病毒感染简述。
J Med Virol. 2021 Aug;93(8):4638-4646. doi: 10.1002/jmv.26990. Epub 2021 Apr 14.
6
Influenza.流感。
Nat Rev Dis Primers. 2018 Jun 28;4(1):3. doi: 10.1038/s41572-018-0002-y.
7
A novel fast vector method for genetic sequence comparison.一种新的快速向量方法用于遗传序列比较。
Sci Rep. 2017 Sep 22;7(1):12226. doi: 10.1038/s41598-017-12493-2.
8
k-mer sparse matrix model for genetic sequence and its applications in sequence comparison.用于基因序列的k-mer稀疏矩阵模型及其在序列比较中的应用
J Theor Biol. 2014 Dec 21;363:145-50. doi: 10.1016/j.jtbi.2014.08.028. Epub 2014 Aug 23.
9
Mutations associated with severity of the pandemic influenza A(H1N1)pdm09 in humans: a systematic review and meta-analysis of epidemiological evidence.与甲型H1N1流感大流行(pdm09)在人类中的严重程度相关的突变:流行病学证据的系统评价和荟萃分析
Arch Virol. 2014 Dec;159(12):3167-83. doi: 10.1007/s00705-014-2179-z. Epub 2014 Jul 31.
10
K-mer natural vector and its application to the phylogenetic analysis of genetic sequences.K- -mer 自然向量及其在遗传序列系统发育分析中的应用。
Gene. 2014 Aug 1;546(1):25-34. doi: 10.1016/j.gene.2014.05.043. Epub 2014 May 22.