Suppr超能文献

无监督学习发现可解释的临床特征。

Learning to Discover Explainable Clinical Features With Minimum Supervision.

机构信息

Department of Statistics, King Abdulaziz University, Jeddah, Kingdom of Saudi Arabia.

Department of Computer Science, University of Surrey, Guildford, Surrey, UK.

出版信息

Transl Vis Sci Technol. 2022 Jan 3;11(1):11. doi: 10.1167/tvst.11.1.11.

Abstract

PURPOSE

To compare supervised transfer learning to semisupervised learning for their ability to learn in-depth knowledge with limited data in the optical coherence tomography (OCT) domain.

METHODS

Transfer learning with EfficientNet-B4 and semisupervised learning with SimCLR are used in this work. The largest public OCT dataset, consisting of 108,312 images and four categories (choroidal neovascularization, diabetic macular edema, drusen, and normal) is used. In addition, two smaller datasets are constructed, containing 31,200 images for the limited version and 4000 for the mini version of the dataset. To illustrate the effectiveness of the developed models, local interpretable model-agnostic explanations and class activation maps are used as explainability techniques.

RESULTS

The proposed transfer learning approach using the EfficientNet-B4 model trained on the limited dataset achieves an accuracy of 0.976 (95% confidence interval [CI], 0.963, 0.983), sensitivity of 0.973 and specificity of 0.991. The semisupervised based solution with SimCLR using 10% labeled data and the limited dataset performs with an accuracy of 0.946 (95% CI, 0.932, 0.960), sensitivity of 0.941, and specificity of 0.983.

CONCLUSIONS

Semisupervised learning has a huge potential for datasets that contain both labeled and unlabeled inputs, generally, with a significantly smaller number of labeled samples. The semisupervised based solution provided with merely 10% labeled data achieves very similar performance to the supervised transfer learning that uses 100% labeled samples.

TRANSLATIONAL RELEVANCE

Semisupervised learning enables building performant models while requiring less expertise effort and time by using to good advantage the abundant amount of available unlabeled data along with the labeled samples.

摘要

目的

比较监督式迁移学习和半监督学习在利用有限的光学相干断层扫描(OCT)领域数据学习深入知识的能力。

方法

本研究使用 EfficientNet-B4 的迁移学习和 SimCLR 的半监督学习。使用了最大的公共 OCT 数据集,由 108312 张图像和四个类别(脉络膜新生血管、糖尿病黄斑水肿、玻璃膜疣和正常)组成。此外,构建了两个较小的数据集,一个包含 31200 张图像的有限数据集,另一个包含 4000 张图像的迷你数据集。为了说明所开发模型的有效性,使用局部可解释模型不可知解释和类激活图作为可解释性技术。

结果

在有限数据集上使用 EfficientNet-B4 模型进行的迁移学习方法达到了 0.976 的准确率(95%置信区间[CI],0.963,0.983),敏感性为 0.973,特异性为 0.991。基于 SimCLR 的半监督解决方案使用 10%的标记数据和有限数据集的准确率为 0.946(95%CI,0.932,0.960),敏感性为 0.941,特异性为 0.983。

结论

半监督学习对于包含有标记和无标记输入的数据集具有巨大的潜力,通常情况下,只需使用少量的有标记样本。基于半监督的解决方案仅使用 10%的标记数据,就能达到与使用 100%标记样本的监督式迁移学习非常相似的性能。

翻译后记

  1. 原文中的 "SimCLR" 是一种半监督学习算法,而不是一个缩写,因此我将其翻译成中文 "SimCLR"。

  2. 原文中的 "OCT" 是 "Optical Coherence Tomography" 的缩写,因此我将其翻译成中文 "OCT"。

  3. 原文中的 "CI" 是 "Confidence Interval" 的缩写,因此我将其翻译成中文 "CI"。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4366/8762682/573638a2905e/tvst-11-1-11-f001.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验