• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于视觉学习的图像表示。

Image representations for visual learning.

作者信息

Beymer D, Poggio T

机构信息

Department of Brain and Cognitive Science, Center for Biological and Computational Learning (CBCL) and Artificial Intelligence Laboratory, Massachusetts Institute of Technology, Cambridge 02142, USA.

出版信息

Science. 1996 Jun 28;272(5270):1905-9. doi: 10.1126/science.272.5270.1905.

DOI:10.1126/science.272.5270.1905
PMID:8658162
Abstract

Computer vision researchers are developing new approaches to object recognition and detection that are based almost directly on images and avoid the use of intermediate three-dimensional models. Many of these techniques depend on a representation of images that induce a linear vector space structure and in principle requires dense feature correspondence. This image representation allows the use of learning techniques for the analysis of images (for computer vision) as well as for the synthesis of images (for computer graphics).

摘要

计算机视觉研究人员正在开发新的目标识别和检测方法,这些方法几乎直接基于图像,并且避免使用中间三维模型。其中许多技术依赖于一种能诱导线性向量空间结构的图像表示,原则上需要密集的特征对应。这种图像表示允许使用学习技术来分析图像(用于计算机视觉)以及合成图像(用于计算机图形学)。

相似文献

1
Image representations for visual learning.用于视觉学习的图像表示。
Science. 1996 Jun 28;272(5270):1905-9. doi: 10.1126/science.272.5270.1905.
2
Learning to detect objects in images via a sparse, part-based representation.通过稀疏的、基于部分的表示来学习检测图像中的物体。
IEEE Trans Pattern Anal Mach Intell. 2004 Nov;26(11):1475-90. doi: 10.1109/TPAMI.2004.108.
3
A method and software for segmentation of anatomic object ensembles by deformable m-reps.一种通过可变形m-表示法对解剖对象集合进行分割的方法和软件。
Med Phys. 2005 May;32(5):1335-45. doi: 10.1118/1.1869872.
4
Minimal representations of 3D models in terms of image parameters under calibrated and uncalibrated perspective.在校准和未校准视角下,基于图像参数的三维模型的最小表示。
IEEE Trans Pattern Anal Mach Intell. 2004 Sep;26(9):1234-8. doi: 10.1109/TPAMI.2004.69.
5
A Hybrid Geometric Spatial Image Representation for scene classification.用于场景分类的混合几何空间图像表示。
PLoS One. 2018 Sep 12;13(9):e0203339. doi: 10.1371/journal.pone.0203339. eCollection 2018.
6
Optimal linear representations of images for object recognition.用于目标识别的图像最优线性表示。
IEEE Trans Pattern Anal Mach Intell. 2004 May;26(5):662-6. doi: 10.1109/TPAMI.2004.1273986.
7
Efficient recognition of highly similar 3D objects in range images.在距离图像中高效识别高度相似的三维物体。
IEEE Trans Pattern Anal Mach Intell. 2009 Jan;31(1):172-9. doi: 10.1109/TPAMI.2008.176.
8
Learning viewpoint invariant perceptual representations from cluttered images.从杂乱图像中学习视角不变的感知表征。
IEEE Trans Pattern Anal Mach Intell. 2005 May;27(5):753-61. doi: 10.1109/TPAMI.2005.105.
9
Understanding Deep Representations Learned in Modeling Users Likes.理解在用户喜好建模中学习到的深度表示。
IEEE Trans Image Process. 2016 Aug;25(8):3762-74. doi: 10.1109/TIP.2016.2576278. Epub 2016 Jun 7.
10
Advanced graphics technology.先进的图形技术。
IEEE Comput Graph Appl. 2010 May-Jun;30(3):96. doi: 10.1109/MCG.2010.47.

引用本文的文献

1
Overlapping representations of observed actions and action-related features.观察到的动作和与动作相关的特征的重叠表示。
Hum Brain Mapp. 2024 Feb 15;45(3):e26605. doi: 10.1002/hbm.26605.
2
Approximating the Hotelling observer with autoencoder-learned efficient channels for binary signal detection tasks.使用自动编码器学习的高效通道逼近用于二元信号检测任务的霍特林观察者。
J Med Imaging (Bellingham). 2023 Sep;10(5):055501. doi: 10.1117/1.JMI.10.5.055501. Epub 2023 Sep 26.
3
: Texture-Enhanced Deep Face Reconstruction in the Wild.野外纹理增强的深度人脸重建
Sensors (Basel). 2023 Jul 19;23(14):6525. doi: 10.3390/s23146525.
4
Shape-invariant encoding of dynamic primate facial expressions in human perception.人类感知中动态灵长类面部表情的形状不变编码。
Elife. 2021 Jun 11;10:e61197. doi: 10.7554/eLife.61197.
5
The Code for Facial Identity in the Primate Brain.灵长类大脑中的面部识别编码
Cell. 2017 Jun 1;169(6):1013-1028.e14. doi: 10.1016/j.cell.2017.05.011.
6
Unraveling flow patterns through nonlinear manifold learning.通过非线性流形学习揭示流动模式。
PLoS One. 2014 Mar 10;9(3):e91131. doi: 10.1371/journal.pone.0091131. eCollection 2014.
7
Comparison of primate prefrontal and premotor cortex neuronal activity during visual categorization.灵长类动物前额叶和运动前皮质神经元在视觉分类过程中的活动比较。
J Cogn Neurosci. 2011 Nov;23(11):3355-65. doi: 10.1162/jocn_a_00032. Epub 2011 Mar 31.
8
Classifying Facial Actions.对面部动作进行分类。
IEEE Trans Pattern Anal Mach Intell. 1999 Oct;21(10):974. doi: 10.1109/34.799905.
9
Representation of multiple, independent categories in the primate prefrontal cortex.灵长类前额叶皮层中多个独立类别的表示。
Neuron. 2010 Jun 10;66(5):796-807. doi: 10.1016/j.neuron.2010.05.005.
10
Role of ordinal contrast relationships in face encoding.顺序对比关系在面部编码中的作用。
Proc Natl Acad Sci U S A. 2009 Mar 31;106(13):5353-8. doi: 10.1073/pnas.0812396106. Epub 2009 Mar 10.