Gao Zan, Guo Leming, Guan Weili, Liu An-An, Ren Tongwei, Chen Shengyong
IEEE Trans Image Process. 2021;30:767-782. doi: 10.1109/TIP.2020.3038372. Epub 2020 Dec 4.
动作识别是计算机视觉和机器学习领域中一个热门的研究课题。尽管已经提出了许多动作识别方法,但只有少数研究人员关注跨域少样本动作识别,而这一任务在实际的安全监控中经常需要执行。由于动作识别、域适应和少样本学习的问题需要同时解决,跨域少样本动作识别任务是一个具有挑战性的问题。为了解决这些问题,在这项工作中,我们开发了一种新颖的端到端成对注意力对抗时空网络(PASTN)来执行跨域少样本动作识别任务,其中时空信息获取、少样本学习和视频域适应在一个统一的框架中实现。具体来说,选择Resnet-50网络作为PASTN的主干,并在2D CNN(ResNet-50)的顶层嵌入一个3D卷积块来捕捉时空表示。此外,设计了一种新颖的注意力对抗网络架构,以使具有更高域差异的时空动态动作对齐。另外,为成对网络架构设计了成对边际判别损失,以提高所学域不变时空特征的判别能力。在跨域动作识别数据集的三个公共基准上进行的大量实验结果,包括SDAI Action I、SDAI Action II和UCF50-OlympicSport,表明所提出的PASTN在准确性和计算时间方面都能显著优于当前的跨域动作识别方法。即使在SDAI Action I数据集的office1场景中,每类仅考虑两个标记的训练样本时,与TAN、TemporalPooling、I3D和P3D方法相比,PASTN的准确率分别提高了6.1%、10.9%、16.8%和14%。