• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过高度敏感的序列比对进行全基因组同线性:萨塔马。

Genome-wide synteny through highly sensitive sequence alignment: Satsuma.

机构信息

Broad Institute of MIT and Harvard, 7 Cambridge Center, Cambridge, MA 02142, USA.

出版信息

Bioinformatics. 2010 May 1;26(9):1145-51. doi: 10.1093/bioinformatics/btq102. Epub 2010 Mar 5.

DOI:10.1093/bioinformatics/btq102
PMID:20208069
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2859124/
Abstract

MOTIVATION

Comparative genomics heavily relies on alignments of large and often complex DNA sequences. From an engineering perspective, the problem here is to provide maximum sensitivity (to find all there is to find), specificity (to only find real homology) and speed (to accommodate the billions of base pairs of vertebrate genomes).

RESULTS

Satsuma addresses all three issues through novel strategies: (i) cross-correlation, implemented via fast Fourier transform; (ii) a match scoring scheme that eliminates almost all false hits; and (iii) an asynchronous 'battleship'-like search that allows for aligning two entire fish genomes (470 and 217 Mb) in 120 CPU hours using 15 processors on a single machine.

AVAILABILITY

Satsuma is part of the Spines software package, implemented in C++ on Linux. The latest version of Spines can be freely downloaded under the LGPL license from http://www.broadinstitute.org/science/programs/genome-biology/spines/.

摘要

动机

比较基因组学在很大程度上依赖于对大型且通常复杂的 DNA 序列的比对。从工程学的角度来看,这里的问题是提供最大的灵敏度(以找到所有可找到的)、特异性(只找到真正的同源性)和速度(以适应脊椎动物基因组的数十亿个碱基对)。

结果

Satsuma 通过新颖的策略解决了所有三个问题:(i)通过快速傅里叶变换实现的互相关;(ii)一种消除几乎所有假命中的匹配评分方案;和(iii)异步的“战舰”式搜索,允许在单个机器上使用 15 个处理器在 120 CPU 小时内对齐两个完整的鱼类基因组(470 和 217 Mb)。

可用性

Satsuma 是 Spines 软件包的一部分,用 C++ 在 Linux 上实现。最新版本的 Spines 可以根据 LGPL 许可证免费从 http://www.broadinstitute.org/science/programs/genome-biology/spines/ 下载。

相似文献

1
Genome-wide synteny through highly sensitive sequence alignment: Satsuma.通过高度敏感的序列比对进行全基因组同线性:萨塔马。
Bioinformatics. 2010 May 1;26(9):1145-51. doi: 10.1093/bioinformatics/btq102. Epub 2010 Mar 5.
2
transAlign: using amino acids to facilitate the multiple alignment of protein-coding DNA sequences.transAlign:利用氨基酸促进蛋白质编码DNA序列的多重比对。
BMC Bioinformatics. 2005 Jun 22;6:156. doi: 10.1186/1471-2105-6-156.
3
halSynteny: a fast, easy-to-use conserved synteny block construction method for multiple whole-genome alignments.halSynteny:一种用于多组全基因组比对的快速、易用的保守同线性块构建方法。
Gigascience. 2020 Jun 1;9(6). doi: 10.1093/gigascience/giaa047.
4
Accurate anchoring alignment of divergent sequences.发散序列的精确锚定比对。
Bioinformatics. 2006 Jan 1;22(1):29-34. doi: 10.1093/bioinformatics/bti772. Epub 2005 Nov 13.
5
Accurate identification of orthologous segments among multiple genomes.准确识别多个基因组之间的直系同源片段。
Bioinformatics. 2009 Apr 1;25(7):853-60. doi: 10.1093/bioinformatics/btp070. Epub 2009 Feb 2.
6
MUMmer4: A fast and versatile genome alignment system.MUMmer4:一种快速且通用的基因组比对系统。
PLoS Comput Biol. 2018 Jan 26;14(1):e1005944. doi: 10.1371/journal.pcbi.1005944. eCollection 2018 Jan.
7
GATA: a graphic alignment tool for comparative sequence analysis.GATA:一种用于比较序列分析的图形比对工具。
BMC Bioinformatics. 2005 Jan 17;6:9. doi: 10.1186/1471-2105-6-9.
8
Genome comparison without alignment using shortest unique substrings.使用最短唯一子串进行无需比对的基因组比较。
BMC Bioinformatics. 2005 May 23;6:123. doi: 10.1186/1471-2105-6-123.
9
Fast model-based protein homology detection without alignment.基于快速模型的无需比对的蛋白质同源性检测。
Bioinformatics. 2007 Jul 15;23(14):1728-36. doi: 10.1093/bioinformatics/btm247. Epub 2007 May 8.
10
JUICE: a data management system that facilitates the analysis of large volumes of information in an EST project workflow.JUICE:一个数据管理系统,可在EST项目工作流程中促进对大量信息的分析。
BMC Bioinformatics. 2006 Nov 23;7:513. doi: 10.1186/1471-2105-7-513.

引用本文的文献

1
A chromosome-scale genome assembly of the leaf roller, Eumorphobotys obscuralis (Lepidoptera: Pyralidae).卷叶蛾Eumorphobotys obscuralis(鳞翅目:螟蛾科)的染色体水平基因组组装
Sci Data. 2025 Jun 23;12(1):1070. doi: 10.1038/s41597-025-05411-z.
2
Long read genome unravels MHC I genomic architecture, evolution, and diversity loss in .长读长基因组解析了……中的主要组织相容性复合体I类基因组结构、进化及多样性丧失情况 。 (原文句末不完整,有信息缺失)
iScience. 2025 Mar 27;28(5):112301. doi: 10.1016/j.isci.2025.112301. eCollection 2025 May 16.
3
Hybrid genome assembly of the widespread bat Rhinolophus lepidus provides insights into susceptibility to SARS-CoV-2 infection and climate change threat.广泛分布的蝙蝠马铁菊头蝠的混合基因组组装为了解其对SARS-CoV-2感染的易感性和气候变化威胁提供了见解。
DNA Res. 2025 May 28;32(3). doi: 10.1093/dnares/dsaf015.
4
Population Genomics and Morphology Provide Insights into the Conservation and Diversity of .群体基因组学和形态学为……的保护和多样性提供了见解。
Insects. 2025 May 21;16(5):546. doi: 10.3390/insects16050546.
5
Chromosome-length genome assembly of the critically endangered Mountain bongo (Tragelaphus eurycerus isaaci): a resource for conservation and comparative genomics.极度濒危的山地邦戈羚(Tragelaphus eurycerus isaaci)的染色体水平基因组组装:保护和比较基因组学的资源
G3 (Bethesda). 2025 Jul 9;15(7). doi: 10.1093/g3journal/jkaf109.
6
A high-quality genome assembly of Annona squamosa (custard apple) provides functional insights into an emerging fruit crop.番荔枝(释迦果)的高质量基因组组装为一种新兴水果作物提供了功能见解。
DNA Res. 2025 May 28;32(3). doi: 10.1093/dnares/dsaf007.
7
Parallel and convergent evolution in genes underlying seasonal migration.季节性迁徙相关基因中的平行进化和趋同进化
Evol Lett. 2024 Nov 30;9(2):189-208. doi: 10.1093/evlett/qrae064. eCollection 2025 Apr.
8
Road to Extinction? Past and Present Population Structure and Genomic Diversity in the Koala.走向灭绝之路?考拉的过去与现在的种群结构及基因组多样性
Mol Biol Evol. 2025 Apr 1;42(4). doi: 10.1093/molbev/msaf057.
9
Island size shapes genomic diversity in a great speciator (Aves: ).岛屿大小塑造了一个重要物种形成者(鸟类: )的基因组多样性。
Biol Lett. 2025 Mar;21(3):20240692. doi: 10.1098/rsbl.2024.0692. Epub 2025 Mar 5.
10
Genomes of Galápagos Mockingbirds Reveal the Impact of Island Size and Past Demography on Inbreeding and Genetic Load in Contemporary Populations.加拉帕戈斯模仿鸟的基因组揭示了岛屿大小和过去的种群统计学对当代种群近亲繁殖和遗传负荷的影响。
Mol Ecol. 2025 Mar;34(5):e17665. doi: 10.1111/mec.17665. Epub 2025 Feb 6.

本文引用的文献

1
MizBee: a multiscale synteny browser.MizBee:一个多尺度同线性浏览器。
IEEE Trans Vis Comput Graph. 2009 Nov-Dec;15(6):897-904. doi: 10.1109/TVCG.2009.167.
2
Local DNA topography correlates with functional noncoding regions of the human genome.局部DNA拓扑结构与人类基因组的功能性非编码区域相关。
Science. 2009 Apr 17;324(5925):389-92. doi: 10.1126/science.1169050. Epub 2009 Mar 12.
3
The Sorghum bicolor genome and the diversification of grasses.高粱基因组与禾本科植物的多样化
Nature. 2009 Jan 29;457(7229):551-6. doi: 10.1038/nature07723.
4
The whole alignment and nothing but the alignment: the problem of spurious alignment flanks.完全对齐且只有对齐:虚假对齐侧翼的问题。
Nucleic Acids Res. 2008 Oct;36(18):5863-71. doi: 10.1093/nar/gkn579. Epub 2008 Sep 16.
5
Genome of the marsupial Monodelphis domestica reveals innovation in non-coding sequences.有袋动物家短尾负鼠的基因组揭示了非编码序列的创新。
Nature. 2007 May 10;447(7141):167-77. doi: 10.1038/nature05805.
6
Sequence alignment by cross-correlation.通过互相关进行序列比对。
J Biomol Tech. 2005 Dec;16(4):453-8.
7
Genome sequence, comparative analysis and haplotype structure of the domestic dog.家犬的基因组序列、比较分析及单倍型结构
Nature. 2005 Dec 8;438(7069):803-19. doi: 10.1038/nature04338.
8
PatternHunter II: highly sensitive and fast homology search.模式搜索器II:高度灵敏且快速的同源性搜索。
Genome Inform. 2003;14:164-75.
9
The Genomes of Oryza sativa: a history of duplications.水稻基因组:重复序列的历史
PLoS Biol. 2005 Feb;3(2):e38. doi: 10.1371/journal.pbio.0030038. Epub 2005 Feb 1.
10
Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution.鸡基因组的序列和比较分析为脊椎动物进化提供了独特的视角。
Nature. 2004 Dec 9;432(7018):695-716. doi: 10.1038/nature03154.