• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

学着观察事物。

Learning to see stuff.

作者信息

Fleming Roland W, Storrs Katherine R

机构信息

Justus-Liebig-Universität Giessen, Germany.

出版信息

Curr Opin Behav Sci. 2019 Dec;30:100-108. doi: 10.1016/j.cobeha.2019.07.004.

DOI:10.1016/j.cobeha.2019.07.004
PMID:31886321
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6919301/
Abstract

Materials with complex appearances, like textiles and foodstuffs, pose challenges for conventional theories of vision. But recent advances in unsupervised deep learning provide a framework for explaining how we learn to see them. We suggest that perception does not involve estimating physical quantities like reflectance or lighting. Instead, representations emerge from learning to encode and predict the visual input as efficiently and accurately as possible. Neural networks can be trained to compress natural images or to predict frames in movies without 'ground truth' data about the outside world. Yet, to succeed, such systems may automatically discover how to disentangle distal causal factors. Such 'statistical appearance models' potentially provide a coherent explanation of both failures and successes in perception.

摘要

具有复杂外观的材料,如纺织品和食品,给传统视觉理论带来了挑战。但无监督深度学习的最新进展提供了一个框架,用于解释我们如何学会识别它们。我们认为,感知并不涉及估计诸如反射率或光照等物理量。相反,表征是通过学习尽可能高效和准确地编码和预测视觉输入而产生的。神经网络可以在没有关于外部世界的“真实”数据的情况下进行训练,以压缩自然图像或预测电影中的帧。然而,为了成功,这样的系统可能会自动发现如何解开远端因果因素。这种“统计外观模型”可能为感知中的失败和成功提供一个连贯的解释。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/2197a60026d8/gr3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/7eb35e6a7f55/gr1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/572ab0117dbe/gr2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/2197a60026d8/gr3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/7eb35e6a7f55/gr1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/572ab0117dbe/gr2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f709/6919301/2197a60026d8/gr3.jpg

相似文献

1
Learning to see stuff.学着观察事物。
Curr Opin Behav Sci. 2019 Dec;30:100-108. doi: 10.1016/j.cobeha.2019.07.004.
2
Unsupervised learning predicts human perception and misperception of gloss.无监督学习预测人类对光泽的感知和错觉。
Nat Hum Behav. 2021 Oct;5(10):1402-1417. doi: 10.1038/s41562-021-01097-6. Epub 2021 May 6.
3
Unsupervised learning reveals interpretable latent representations for translucency perception.无监督学习揭示了透明度感知的可解释潜在表示。
PLoS Comput Biol. 2023 Feb 8;19(2):e1010878. doi: 10.1371/journal.pcbi.1010878. eCollection 2023 Feb.
4
Controversial stimuli: Pitting neural networks against each other as models of human cognition.有争议的刺激:将神经网络作为人类认知模型进行相互竞争。
Proc Natl Acad Sci U S A. 2020 Nov 24;117(47):29330-29337. doi: 10.1073/pnas.1912334117.
5
Material Perception.材质感知。
Annu Rev Vis Sci. 2017 Sep 15;3:365-388. doi: 10.1146/annurev-vision-102016-061429. Epub 2017 Jul 11.
6
Building machines that learn and think like people.建造像人一样学习和思考的机器。
Behav Brain Sci. 2017 Jan;40:e253. doi: 10.1017/S0140525X16001837. Epub 2016 Nov 24.
7
Divergences in color perception between deep neural networks and humans.深度神经网络与人类在颜色感知上的差异。
Cognition. 2023 Dec;241:105621. doi: 10.1016/j.cognition.2023.105621. Epub 2023 Sep 14.
8
Brain-optimized deep neural network models of human visual areas learn non-hierarchical representations.大脑优化的人类视觉区域深度神经网络模型学习非层次化的表示。
Nat Commun. 2023 Jun 7;14(1):3329. doi: 10.1038/s41467-023-38674-4.
9
Identifying specular highlights: Insights from deep learning.识别镜面高光:深度学习的新视角。
J Vis. 2022 Jun 1;22(7):6. doi: 10.1167/jov.22.7.6.
10
Visual perception of materials and their properties.材料及其属性的视觉感知。
Vision Res. 2014 Jan;94:62-75. doi: 10.1016/j.visres.2013.11.004. Epub 2013 Nov 27.

引用本文的文献

1
Gloss discrimination: Toward an image-based perceptual model.光泽辨别:迈向基于图像的感知模型。
J Vis. 2025 Aug 1;25(10):6. doi: 10.1167/jov.25.10.6.
2
Orientation fields predict human perception of 3D shape from shading.方向场可根据阴影预测人类对三维形状的感知。
Proc Natl Acad Sci U S A. 2025 Jul 15;122(28):e2503088122. doi: 10.1073/pnas.2503088122. Epub 2025 Jul 10.
3
A simple optical flow model explains why certain object viewpoints are special.一个简单的光流模型解释了为什么某些物体视角是特殊的。

本文引用的文献

1
Distinguishing mirror from glass: A "big data" approach to material perception.区分镜子和玻璃:一种基于“大数据”的材料感知方法。
J Vis. 2022 Mar 2;22(4):4. doi: 10.1167/jov.22.4.4.
2
A Style-Based Generator Architecture for Generative Adversarial Networks.基于风格的生成对抗网络生成器架构。
IEEE Trans Pattern Anal Mach Intell. 2021 Dec;43(12):4217-4228. doi: 10.1109/TPAMI.2020.2970919. Epub 2021 Nov 3.
3
Human-level performance in 3D multiplayer games with population-based reinforcement learning.基于群体强化学习的 3D 多人游戏中的人类水平表现。
Proc Biol Sci. 2024 Jul;291(2026):20240577. doi: 10.1098/rspb.2024.0577. Epub 2024 Jul 10.
4
The attentive reconstruction of objects facilitates robust object recognition.对物体的细致重建有助于实现可靠的物体识别。
PLoS Comput Biol. 2024 Jun 13;20(6):e1012159. doi: 10.1371/journal.pcbi.1012159. eCollection 2024 Jun.
5
Head rotation and the perception of eyelid height and contour.头部转动与眼睑高度和轮廓的感知。
BMJ Open Ophthalmol. 2024 Apr 4;9(1):e001557. doi: 10.1136/bmjophth-2023-001557.
6
A role for cortical interneurons as adversarial discriminators.皮层中间神经元作为对抗性鉴别器的作用。
PLoS Comput Biol. 2023 Sep 28;19(9):e1011484. doi: 10.1371/journal.pcbi.1011484. eCollection 2023 Sep.
7
Material category of visual objects computed from specular image structure.基于镜面反射图像结构计算得到的视觉对象的材质类别。
Nat Hum Behav. 2023 Jul;7(7):1152-1169. doi: 10.1038/s41562-023-01601-0. Epub 2023 Jun 29.
8
materialmodifier: An R package of photo editing effects for material perception research.材料修饰器:用于材料感知研究的照片编辑效果 R 包。
Behav Res Methods. 2024 Mar;56(3):2657-2674. doi: 10.3758/s13428-023-02116-2. Epub 2023 May 10.
9
The Architecture of Object-Based Attention.基于客体的注意的架构
Psychon Bull Rev. 2023 Oct;30(5):1643-1667. doi: 10.3758/s13423-023-02281-7. Epub 2023 Apr 20.
10
Unsupervised learning reveals interpretable latent representations for translucency perception.无监督学习揭示了透明度感知的可解释潜在表示。
PLoS Comput Biol. 2023 Feb 8;19(2):e1010878. doi: 10.1371/journal.pcbi.1010878. eCollection 2023 Feb.
Science. 2019 May 31;364(6443):859-865. doi: 10.1126/science.aau6249.
4
Machine behaviour.机器行为。
Nature. 2019 Apr;568(7753):477-486. doi: 10.1038/s41586-019-1138-y. Epub 2019 Apr 24.
5
Neural scene representation and rendering.神经场景表示与渲染。
Science. 2018 Jun 15;360(6394):1204-1210. doi: 10.1126/science.aar6170.
6
The lawful imprecision of human surface tilt estimation in natural scenes.人类在自然场景中对表面倾斜估计的合法不精确性。
Elife. 2018 Jan 31;7:e31448. doi: 10.7554/eLife.31448.
7
A Developmental Approach to Machine Learning?一种机器学习的发展方法?
Front Psychol. 2017 Dec 5;8:2124. doi: 10.3389/fpsyg.2017.02124. eCollection 2017.
8
Principles for models of neural information processing.神经信息处理模型的原理。
Neuroimage. 2018 Oct 15;180(Pt A):101-109. doi: 10.1016/j.neuroimage.2017.08.016. Epub 2017 Aug 6.
9
Neuroscience-Inspired Artificial Intelligence.神经科学启发的人工智能。
Neuron. 2017 Jul 19;95(2):245-258. doi: 10.1016/j.neuron.2017.06.011.
10
Material Perception.材质感知。
Annu Rev Vis Sci. 2017 Sep 15;3:365-388. doi: 10.1146/annurev-vision-102016-061429. Epub 2017 Jul 11.