• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于可调加权距离的组合向量方法分析多基因座植物条形码数据集。

Analyzing multi-locus plant barcoding datasets with a composition vector method based on adjustable weighted distance.

机构信息

School of Life Sciences, The Chinese University of Hong Kong, Shatin, Hong Kong SAR, China.

出版信息

PLoS One. 2012;7(7):e42154. doi: 10.1371/journal.pone.0042154. Epub 2012 Jul 27.

DOI:10.1371/journal.pone.0042154
PMID:22848736
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3407124/
Abstract

BACKGROUND

The composition vector (CV) method has been proved to be a reliable and fast alignment-free method to analyze large COI barcoding data. In this study, we modify this method for analyzing multi-gene datasets for plant DNA barcoding. The modified method includes an adjustable-weighted algorithm for the vector distance according to the ratio in sequence length of the candidate genes for each pair of taxa.

METHODOLOGY/PRINCIPAL FINDINGS: Three datasets, matK+rbcL dataset with 2,083 sequences, matK+rbcL dataset with 397 sequences and matK+rbcL+trnH-psbA dataset with 397 sequences, were tested. We showed that the success rates of grouping sequences at the genus/species level based on this modified CV approach are always higher than those based on the traditional K2P/NJ method. For the matK+rbcL datasets, the modified CV approach outperformed the K2P-NJ approach by 7.9% in both the 2,083-sequence and 397-sequence datasets, and for the matK+rbcL+trnH-psbA dataset, the CV approach outperformed the traditional approach by 16.7%.

CONCLUSIONS

We conclude that the modified CV approach is an efficient method for analyzing large multi-gene datasets for plant DNA barcoding. Source code, implemented in C++ and supported on MS Windows, is freely available for download at http://math.xtu.edu.cn/myphp/math/research/source/Barcode_source_codes.zip.

摘要

背景

组成向量(CV)方法已被证明是一种可靠且快速的无比对方法,可用于分析大型 COI 条码数据。在本研究中,我们修改了该方法,用于分析植物 DNA 条码的多基因数据集。修改后的方法包括根据候选基因序列长度比为每对分类单元的向量距离设置可调权重算法。

方法/主要发现:我们测试了三个数据集,即包含 2083 条序列的 matK+rbcL 数据集、包含 397 条序列的 matK+rbcL 数据集和包含 397 条序列的 matK+rbcL+trnH-psbA 数据集。我们表明,基于此修改后的 CV 方法,在属/种水平上对序列进行分组的成功率始终高于基于传统 K2P/NJ 方法的成功率。对于 matK+rbcL 数据集,修改后的 CV 方法在 2083 条序列和 397 条序列数据集中分别比 K2P-NJ 方法高出 7.9%,而对于 matK+rbcL+trnH-psbA 数据集,CV 方法比传统方法高出 16.7%。

结论

我们得出结论,修改后的 CV 方法是分析植物 DNA 条码大型多基因数据集的有效方法。源代码,用 C++实现并支持 MS Windows,可在 http://math.xtu.edu.cn/myphp/math/research/source/Barcode_source_codes.zip 免费下载。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e8b8/3407124/02c212829e93/pone.0042154.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e8b8/3407124/02c212829e93/pone.0042154.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e8b8/3407124/02c212829e93/pone.0042154.g001.jpg

相似文献

1
Analyzing multi-locus plant barcoding datasets with a composition vector method based on adjustable weighted distance.基于可调加权距离的组合向量方法分析多基因座植物条形码数据集。
PLoS One. 2012;7(7):e42154. doi: 10.1371/journal.pone.0042154. Epub 2012 Jul 27.
2
The internal transcribed spacer (ITS) region and trnH-psbA [corrected] are suitable candidate loci for DNA barcoding of tropical tree species of India.内转录间隔区(ITS)和 trnH-psbA [更正]是印度热带树种 DNA 条形码的合适候选基因座。
PLoS One. 2013;8(2):e57934. doi: 10.1371/journal.pone.0057934. Epub 2013 Feb 27.
3
[Identification of plant species based on DNA barcode technology].基于DNA条形码技术的植物物种鉴定
Ying Yong Sheng Tai Xue Bao. 2012 May;23(5):1240-6.
4
Identification of species in the angiosperm family Apiaceae using DNA barcodes.利用DNA条形码鉴定被子植物伞形科中的物种。
Mol Ecol Resour. 2014 Nov;14(6):1231-8. doi: 10.1111/1755-0998.12262. Epub 2014 May 14.
5
DNA Barcoding of Invasive Terrestrial Plant Species in India.印度入侵性陆生植物物种的DNA条形码分析
Mol Biotechnol. 2025 Mar;67(3):1027-1034. doi: 10.1007/s12033-024-01102-z. Epub 2024 Mar 2.
6
DNA barcoding of invasive plants in China: A resource for identifying invasive plants.中国入侵植物的 DNA 条形码:鉴定入侵植物的资源。
Mol Ecol Resour. 2018 Jan;18(1):128-136. doi: 10.1111/1755-0998.12715. Epub 2017 Oct 4.
7
DNA barcoding the Canadian Arctic flora: core plastid barcodes (rbcL + matK) for 490 vascular plant species.加拿大北极植物群的DNA条形码:490种维管植物的核心质体条形码(rbcL + matK)
PLoS One. 2013 Oct 22;8(10):e77982. doi: 10.1371/journal.pone.0077982. eCollection 2013.
8
DNA barcoding the Dioscorea in China, a vital group in the evolution of monocotyledon: use of matK gene for species discrimination.中国薯蓣属(Dioscorea)的 DNA 条形码研究:在单子叶植物进化中至关重要的一个类群:应用 matK 基因进行物种鉴别。
PLoS One. 2012;7(2):e32057. doi: 10.1371/journal.pone.0032057. Epub 2012 Feb 20.
9
rbcL and matK earn two thumbs up as the core DNA barcode for ferns.rbcL 和 matK 作为蕨类植物的核心 DNA 条码获得了高度评价。
PLoS One. 2011;6(10):e26597. doi: 10.1371/journal.pone.0026597. Epub 2011 Oct 20.
10
The combination of ITS2 and psbA-trnH region is powerful DNA barcode markers for authentication of medicinal Terminalia plants from Thailand.ITS2 和 psbA-trnH 区的组合是鉴定来自泰国药用诃子属植物的有效 DNA 条形码标记物。
J Nat Med. 2020 Jan;74(1):282-293. doi: 10.1007/s11418-019-01365-w. Epub 2019 Oct 5.

本文引用的文献

1
DNA barcode sequence identification incorporating taxonomic hierarchy and within taxon variability.整合分类阶元与分类内变异性的 DNA 条码序列鉴定。
PLoS One. 2011;6(8):e20552. doi: 10.1371/journal.pone.0020552. Epub 2011 Aug 16.
2
Choosing and using a plant DNA barcode.选择和使用植物 DNA 条形码。
PLoS One. 2011;6(5):e19254. doi: 10.1371/journal.pone.0019254. Epub 2011 May 26.
3
DNA BARCODING: CO1 DNA barcoding amphibians: take the chance, meet the challenge.DNA 条形码:CO1 DNA 条形码两栖动物:抓住机遇,迎接挑战。
Mol Ecol Resour. 2008 Mar;8(2):235-46. doi: 10.1111/j.1471-8286.2007.01964.x.
4
Are plant species inherently harder to discriminate than animal species using DNA barcoding markers?利用 DNA 条形码标记物鉴别植物物种是否比鉴别动物物种固有地更困难?
Mol Ecol Resour. 2009 May;9 Suppl s1:130-9. doi: 10.1111/j.1755-0998.2009.02652.x.
5
MEGA5: molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods.MEGA5:用于最大似然法、进化距离法和最大简约法的分子进化遗传学分析。
Mol Biol Evol. 2011 Oct;28(10):2731-9. doi: 10.1093/molbev/msr121. Epub 2011 May 4.
6
Whole-proteome phylogeny of large dsDNA viruses and parvoviruses through a composition vector method related to dynamical language model.通过与动态语言模型相关的组合向量方法对大型双链 DNA 病毒和细小病毒进行全蛋白质组系统发育分析。
BMC Evol Biol. 2010 Jun 22;10:192. doi: 10.1186/1471-2148-10-192.
7
Proper distance metrics for phylogenetic analysis using complete genomes without sequence alignment.使用完整基因组进行系统发育分析而无需序列比对的适当距离度量。
Int J Mol Sci. 2010 Mar 18;11(3):1141-54. doi: 10.3390/ijms11031141.
8
Rapid DNA barcoding analysis of large datasets using the composition vector method.利用组成向量方法对大型数据集进行快速 DNA 条形码分析。
BMC Bioinformatics. 2009 Nov 10;10 Suppl 14(Suppl 14):S8. doi: 10.1186/1471-2105-10-S14-S8.
9
A DNA barcode for land plants.一种用于陆地植物的DNA条形码。
Proc Natl Acad Sci U S A. 2009 Aug 4;106(31):12794-7. doi: 10.1073/pnas.0905845106. Epub 2009 Jul 30.
10
A fungal phylogeny based on 82 complete genomes using the composition vector method.基于82个完整基因组,采用成分向量法构建的真菌系统发育树。
BMC Evol Biol. 2009 Aug 10;9:195. doi: 10.1186/1471-2148-9-195.