• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过组合全局动态和局部外观来学习人类动作。

Learning Human Actions by Combining Global Dynamics and Local Appearance.

出版信息

IEEE Trans Pattern Anal Mach Intell. 2014 Dec;36(12):2466-82. doi: 10.1109/TPAMI.2014.2329301.

DOI:10.1109/TPAMI.2014.2329301
PMID:26353152
Abstract

In this paper, we address the problem of human action recognition through combining global temporal dynamics and local visual spatio-temporal appearance features. For this purpose, in the global temporal dimension, we propose to model the motion dynamics with robust linear dynamical systems (LDSs) and use the model parameters as motion descriptors. Since LDSs live in a non-Euclidean space and the descriptors are in non-vector form, we propose a shift invariant subspace angles based distance to measure the similarity between LDSs. In the local visual dimension, we construct curved spatio-temporal cuboids along the trajectories of densely sampled feature points and describe them using histograms of oriented gradients (HOG). The distance between motion sequences is computed with the Chi-Squared histogram distance in the bag-of-words framework. Finally we perform classification using the maximum margin distance learning method by combining the global dynamic distances and the local visual distances. We evaluate our approach for action recognition on five short clips data sets, namely Weizmann, KTH, UCF sports, Hollywood2 and UCF50, as well as three long continuous data sets, namely VIRAT, ADL and CRIM13. We show competitive results as compared with current state-of-the-art methods.

摘要

在本文中,我们通过结合全局时间动态和局部视觉时空外观特征来解决人体动作识别问题。为此,在全局时间维度上,我们提出用鲁棒线性动力系统(LDS)来建模运动动态,并将模型参数作为运动描述符。由于 LDS 存在于非欧几里得空间中,且描述符不是向量形式,因此我们提出了一种基于平移不变子空间角的距离来测量 LDS 之间的相似性。在局部视觉维度上,我们沿着密集采样特征点的轨迹构建弯曲的时空体,并使用方向梯度直方图(HOG)对其进行描述。在词袋框架中,通过卡方直方图距离计算运动序列之间的距离。最后,我们通过结合全局动态距离和局部视觉距离,使用最大间隔距离学习方法进行分类。我们在五个短片段数据集(即 Weizmann、KTH、UCF 运动、好莱坞 2 和 UCF50)以及三个长连续数据集(即 VIRAT、ADL 和 CRIM13)上评估了我们的动作识别方法。与当前最先进的方法相比,我们展示了具有竞争力的结果。

相似文献

1
Learning Human Actions by Combining Global Dynamics and Local Appearance.通过组合全局动态和局部外观来学习人类动作。
IEEE Trans Pattern Anal Mach Intell. 2014 Dec;36(12):2466-82. doi: 10.1109/TPAMI.2014.2329301.
2
Dynamic Spatio-Temporal Bag of Expressions (D-STBoE) Model for Human Action Recognition.用于人体动作识别的动态时空词袋(D-STBoE)模型。
Sensors (Basel). 2019 Jun 21;19(12):2790. doi: 10.3390/s19122790.
3
Learning Spatio-Temporal Representations for Action Recognition: A Genetic Programming Approach.学习时空表示进行动作识别:一种遗传编程方法。
IEEE Trans Cybern. 2016 Jan;46(1):158-70. doi: 10.1109/TCYB.2015.2399172. Epub 2015 Feb 13.
4
Evaluation of color spatio-temporal interest points for human action recognition.用于人体动作识别的彩色时空兴趣点评估。
IEEE Trans Image Process. 2014 Apr;23(4):1569-80. doi: 10.1109/TIP.2014.2302677.
5
Learning sparse representations for human action recognition.学习人类动作识别的稀疏表示。
IEEE Trans Pattern Anal Mach Intell. 2012 Aug;34(8):1576-88. doi: 10.1109/TPAMI.2011.253.
6
Modeling Geometric-Temporal Context With Directional Pyramid Co-Occurrence for Action Recognition.基于方向金字塔共现的时空上下文建模方法及其在动作识别中的应用
IEEE Trans Image Process. 2014 Feb;23(2):658-72. doi: 10.1109/TIP.2013.2291319.
7
Categorizing dynamic textures using a bag of dynamical systems.使用动态系统袋对动态纹理进行分类。
IEEE Trans Pattern Anal Mach Intell. 2013 Feb;35(2):342-53. doi: 10.1109/TPAMI.2012.83.
8
Spatio-temporal Laplacian pyramid coding for action recognition.基于时空拉普拉斯金字塔的动作识别。
IEEE Trans Cybern. 2014 Jun;44(6):817-27. doi: 10.1109/TCYB.2013.2273174. Epub 2013 Jul 31.
9
Surgical gesture classification from video and kinematic data.基于视频和运动学数据的外科手势分类。
Med Image Anal. 2013 Oct;17(7):732-45. doi: 10.1016/j.media.2013.04.007. Epub 2013 Apr 28.
10
Robust video content analysis schemes for human action recognition.用于人体动作识别的稳健视频内容分析方案。
Sci Prog. 2021 Apr-Jun;104(2):368504211005480. doi: 10.1177/00368504211005480.

引用本文的文献

1
A Novel Parameter Initialization Technique Using RBM-NN for Human Action Recognition.利用 RBM-NN 的新颖参数初始化技术进行人体动作识别。
Comput Intell Neurosci. 2020 Sep 10;2020:8852404. doi: 10.1155/2020/8852404. eCollection 2020.