• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用带有开放数据集的云计算平台向生命科学专业本科生教授基因组学。

Teaching genomics to life science undergraduates using cloud computing platforms with open datasets.

机构信息

Structural & Molecular Biology Faculty of Life Sciences, UCL, London, UK.

出版信息

Biochem Mol Biol Educ. 2022 Sep;50(5):446-449. doi: 10.1002/bmb.21646. Epub 2022 Aug 16.

DOI:10.1002/bmb.21646
PMID:35972192
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9804627/
Abstract

The final year of a biochemistry degree is usually a time to experience research. However, laboratory-based research projects were not possible during COVID-19. Instead, we used open datasets to provide computational research projects in metagenomics to biochemistry undergraduates (80 students with limited computing experience). We aimed to give the students a chance to explore any dataset, rather than use a small number of artificial datasets (~60 published datasets were used). To achieve this, we utilized Google Colaboratory (Colab), a virtual computing environment. Colab was used as a framework to retrieve raw sequencing data (analyzed with QIIME2) and generate visualizations. Setting up the environment requires no prior experience; all students have the same drive structure and notebooks can be shared (for synchronous sessions). We also used the platform to combine multiple datasets, perform a meta-analysis, and allowed the students to analyze large datasets with 1000s of subjects and factors. Projects that required increased computational resources were integrated with Google Cloud Compute. In future, all research projects can include some aspects of reanalyzing public data, providing students with data science experience. Colab is also an excellent environment in which to develop data skills in multiple languages (e.g., Perl, Python, Julia).

摘要

生物化学专业的最后一年通常是进行研究的时间。然而,在 COVID-19 期间,基于实验室的研究项目是不可能进行的。因此,我们使用开放数据集为生物化学专业的本科生(具有有限计算经验的 80 名学生)提供计算型宏基因组学研究项目。我们的目标是让学生有机会探索任何数据集,而不是使用少数人工数据集(~60 个已发表的数据集被使用)。为了实现这一目标,我们利用了 Google Colaboratory(Colab),这是一种虚拟计算环境。Colab 被用作检索原始测序数据(用 QIIME2 分析)并生成可视化效果的框架。设置环境不需要事先的经验;所有学生都具有相同的驱动结构,并且可以共享笔记本(用于同步会话)。我们还使用该平台来组合多个数据集,进行元分析,并允许学生分析具有数千个主题和因素的大型数据集。需要增加计算资源的项目与 Google Cloud Compute 集成在一起。将来,所有研究项目都可以包括重新分析公共数据的某些方面,为学生提供数据科学经验。Colab 也是一个极好的环境,可以用多种语言(例如 Perl、Python、Julia)开发数据技能。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a2b/9804627/6c0b481e1e92/BMB-50-446-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a2b/9804627/cdf0e8651ce2/BMB-50-446-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a2b/9804627/6c0b481e1e92/BMB-50-446-g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a2b/9804627/cdf0e8651ce2/BMB-50-446-g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8a2b/9804627/6c0b481e1e92/BMB-50-446-g001.jpg

相似文献

1
Teaching genomics to life science undergraduates using cloud computing platforms with open datasets.利用带有开放数据集的云计算平台向生命科学专业本科生教授基因组学。
Biochem Mol Biol Educ. 2022 Sep;50(5):446-449. doi: 10.1002/bmb.21646. Epub 2022 Aug 16.
2
The ISB Cancer Genomics Cloud: A Flexible Cloud-Based Platform for Cancer Genomics Research.国际生物信息学研究所癌症基因组云平台:一个用于癌症基因组学研究的灵活的基于云的平台。
Cancer Res. 2017 Nov 1;77(21):e7-e10. doi: 10.1158/0008-5472.CAN-17-0617.
3
Cloud-based introduction to BASH programming for biologists.基于云的生物学 BASH 编程入门。
Brief Bioinform. 2024 Jul 23;25(Supplement_1). doi: 10.1093/bib/bbae244.
4
Genomics Virtual Laboratory: A Practical Bioinformatics Workbench for the Cloud.基因组学虚拟实验室:面向云端的实用生物信息学工作台。
PLoS One. 2015 Oct 26;10(10):e0140829. doi: 10.1371/journal.pone.0140829. eCollection 2015.
5
First steps into the cloud: Using Amazon data storage and computing with Python notebooks.初探云端:使用 Python 笔记本使用亚马逊数据存储和计算。
PLoS One. 2023 Feb 9;18(2):e0278316. doi: 10.1371/journal.pone.0278316. eCollection 2023.
6
Cloud bursting galaxy: federated identity and access management.云爆发星系:联合身份与访问管理。
Bioinformatics. 2020 Jan 1;36(1):1-9. doi: 10.1093/bioinformatics/btz472.
7
Reusable tutorials for using cloud-based computing environments for the analysis of bacterial gene expression data from bulk RNA sequencing.可重复使用的教程,用于使用基于云的计算环境分析来自批量 RNA 测序的细菌基因表达数据。
Brief Bioinform. 2024 May 23;25(4). doi: 10.1093/bib/bbae301.
8
CLIMB (the Cloud Infrastructure for Microbial Bioinformatics): an online resource for the medical microbiology community.CLIMB(微生物生物信息学的云基础设施):面向医学微生物学领域的在线资源。
Microb Genom. 2016 Sep 20;2(9):e000086. doi: 10.1099/mgen.0.000086. eCollection 2016 Sep.
9
Bionimbus: a cloud for managing, analyzing and sharing large genomics datasets.Bionimbus:用于管理、分析和共享大型基因组数据集的云平台。
J Am Med Inform Assoc. 2014 Nov-Dec;21(6):969-75. doi: 10.1136/amiajnl-2013-002155. Epub 2014 Jan 24.
10
Google Colab and Virtual Simulations: Practical e-Learning Tools to Support the Teaching of Thermodynamics and to Introduce Coding to Students.谷歌Colab和虚拟模拟:支持热力学教学并向学生引入编码的实用电子学习工具。
ACS Omega. 2022 Feb 18;7(8):7421-7429. doi: 10.1021/acsomega.2c00362. eCollection 2022 Mar 1.

引用本文的文献

1
Low-Cost Approaches in Neuroscience to Teach Machine Learning Using a Cockroach Model.神经科学中使用蟑螂模型教授机器学习的低成本方法。
eNeuro. 2024 Dec 17;11(12). doi: 10.1523/ENEURO.0173-24.2024. Print 2024 Dec.
2
Automated management of AWS instances for training.用于训练的AWS实例的自动化管理。
GigaByte. 2024 Aug 29;2024:gigabyte133. doi: 10.46471/gigabyte.133. eCollection 2024.
3
Teaching Medical Students to Use Supercomputers: A Personal Reflection.教医学生使用超级计算机:个人反思。

本文引用的文献

1
SARS-CoV-2 detection status associates with bacterial community composition in patients and the hospital environment.SARS-CoV-2 检测状态与患者和医院环境中的细菌群落组成相关。
Microbiome. 2021 Jun 8;9(1):132. doi: 10.1186/s40168-021-01083-0.
2
'Does anyone have any of these?': Lab-supply shortages strike amid global pandemic.“有人有这些东西吗?”:全球疫情期间实验室用品短缺
Nature. 2021 Mar 9. doi: 10.1038/d41586-021-00613-y.
3
Educating and engaging new communities of practice with high performance computing through the integration of teaching and research.
Methods Mol Biol. 2024;2716:413-420. doi: 10.1007/978-1-0716-3449-3_20.
通过教学与研究的整合,对新的高性能计算实践社区进行教育并使其参与其中。
Interface Focus. 2020 Dec 6;10(6):20200003. doi: 10.1098/rsfs.2020.0003. Epub 2020 Oct 16.
4
Multi-omics analyses of radiation survivors identify radioprotective microbes and metabolites.多组学分析辐射幸存者,鉴定辐射防护微生物和代谢物。
Science. 2020 Oct 30;370(6516). doi: 10.1126/science.aay9097.
5
QIIME 2 Enables Comprehensive End-to-End Analysis of Diverse Microbiome Data and Comparative Studies with Publicly Available Data.QIIME 2 支持对多样化微生物组数据进行全面的端到端分析,并与公共可用数据进行比较研究。
Curr Protoc Bioinformatics. 2020 Jun;70(1):e100. doi: 10.1002/cpbi.100.
6
Comparing bioinformatic pipelines for microbial 16S rRNA amplicon sequencing.比较微生物 16S rRNA 扩增子测序的生物信息学分析流程。
PLoS One. 2020 Jan 16;15(1):e0227434. doi: 10.1371/journal.pone.0227434. eCollection 2020.
7
Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2.使用QIIME 2进行可重复、交互式、可扩展和可延伸的微生物组数据科学研究。
Nat Biotechnol. 2019 Aug;37(8):852-857. doi: 10.1038/s41587-019-0209-9.
8
Qiita: rapid, web-enabled microbiome meta-analysis.Qiita:快速、支持网络的微生物组元分析。
Nat Methods. 2018 Oct;15(10):796-798. doi: 10.1038/s41592-018-0141-9. Epub 2018 Oct 1.
9
Data on the gut and saliva microbiota from a cohort of atherosclerosis patients determined by 16S rRNA gene sequencing.通过16S rRNA基因测序确定的一组动脉粥样硬化患者的肠道和唾液微生物群数据。
Data Brief. 2018 May 11;19:481-485. doi: 10.1016/j.dib.2018.05.032. eCollection 2018 Aug.
10
Gut microbiota in adolescents and the association with fatty liver: the EPOCH study.青少年肠道微生物群与脂肪肝的关系:EPOCH 研究。
Pediatr Res. 2018 Aug;84(2):219-227. doi: 10.1038/pr.2018.32. Epub 2018 Apr 18.