• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于 DSAC 的 RGB 和 RGB-D 图像的视觉相机重定位

Visual Camera Re-Localization From RGB and RGB-D Images Using DSAC.

出版信息

IEEE Trans Pattern Anal Mach Intell. 2022 Sep;44(9):5847-5865. doi: 10.1109/TPAMI.2021.3070754. Epub 2022 Aug 4.

DOI:10.1109/TPAMI.2021.3070754
PMID:33798073
Abstract

We describe a learning-based system that estimates the camera position and orientation from a single input image relative to a known environment. The system is flexible w.r.t. the amount of information available at test and at training time, catering to different applications. Input images can be RGB-D or RGB, and a 3D model of the environment can be utilized for training but is not necessary. In the minimal case, our system requires only RGB images and ground truth poses at training time, and it requires only a single RGB image at test time. The framework consists of a deep neural network and fully differentiable pose optimization. The neural network predicts so called scene coordinates, i.e., dense correspondences between the input image and 3D scene space of the environment. The pose optimization implements robust fitting of pose parameters using differentiable RANSAC (DSAC) to facilitate end-to-end training. The system, an extension of DSAC++ and referred to as DSAC*, achieves state-of-the-art accuracy on various public datasets for RGB-based re-localization, and competitive accuracy for RGB-D based re-localization.

摘要

我们描述了一个基于学习的系统,该系统可以根据已知环境中的单个输入图像来估计相机的位置和方向。该系统在测试和训练时可灵活运用信息量,以适应不同的应用。输入图像可以是 RGB-D 或 RGB,并且可以利用环境的 3D 模型进行训练,但不是必需的。在最小的情况下,我们的系统只需要在训练时提供 RGB 图像和地面实况姿势,并且只需要在测试时提供单个 RGB 图像。该框架由一个深度神经网络和完全可微分的姿势优化组成。神经网络预测所谓的场景坐标,即输入图像和环境的 3D 场景空间之间的密集对应关系。姿势优化使用可微分 RANSAC(DSAC)实现姿势参数的稳健拟合,以促进端到端训练。该系统是 DSAC++的扩展,称为 DSAC*,在各种用于基于 RGB 的重新定位的公共数据集上实现了最先进的精度,并且在基于 RGB-D 的重新定位方面具有竞争力的精度。

相似文献

1
Visual Camera Re-Localization From RGB and RGB-D Images Using DSAC.基于 DSAC 的 RGB 和 RGB-D 图像的视觉相机重定位
IEEE Trans Pattern Anal Mach Intell. 2022 Sep;44(9):5847-5865. doi: 10.1109/TPAMI.2021.3070754. Epub 2022 Aug 4.
2
Enhanced RGB-D Mapping Method for Detailed 3D Indoor and Outdoor Modeling.用于详细3D室内和室外建模的增强型RGB-D映射方法
Sensors (Basel). 2016 Sep 27;16(10):1589. doi: 10.3390/s16101589.
3
Comparison of Graph Fitting and Sparse Deep Learning Model for Robot Pose Estimation.图形拟合与稀疏深度学习模型在机器人位姿估计中的比较。
Sensors (Basel). 2022 Aug 29;22(17):6518. doi: 10.3390/s22176518.
4
Convolution-Based Encoding of Depth Images for Transfer Learning in RGB-D Scene Classification.基于卷积的深度图像编码在 RGB-D 场景分类中的迁移学习。
Sensors (Basel). 2021 Nov 28;21(23):7950. doi: 10.3390/s21237950.
5
DPODv2: Dense Correspondence-Based 6 DoF Pose Estimation.DPODv2:基于密集对应关系的 6 自由度位姿估计。
IEEE Trans Pattern Anal Mach Intell. 2022 Nov;44(11):7417-7435. doi: 10.1109/TPAMI.2021.3118833. Epub 2022 Oct 4.
6
Absolute Camera Pose Regression Using an RGB-D Dual-Stream Network and Handcrafted Base Poses.基于 RGB-D 双流网络和手工基础姿势的绝对相机位姿回归。
Sensors (Basel). 2022 Sep 15;22(18):6971. doi: 10.3390/s22186971.
7
Multi-level feature fusion and joint refinement for simultaneous object pose estimation and camera localization.用于同时进行目标位姿估计和相机定位的多层次特征融合和联合细化。
Neural Netw. 2024 Jun;174:106238. doi: 10.1016/j.neunet.2024.106238. Epub 2024 Mar 16.
8
Geometric Integration of Hybrid Correspondences for RGB-D Unidirectional Tracking.RGB-D 单向跟踪的混合对应几何积分。
Sensors (Basel). 2018 May 1;18(5):1385. doi: 10.3390/s18051385.
9
Robust RGB-D SLAM Using Point and Line Features for Low Textured Scene.基于点线特征的鲁棒RGB-D SLAM用于低纹理场景
Sensors (Basel). 2020 Sep 2;20(17):4984. doi: 10.3390/s20174984.
10
Fully Automated DCNN-Based Thermal Images Annotation Using Neural Network Pretrained on RGB Data.基于全自动化 DCNN 的热图像注释,使用基于 RGB 数据预训练的神经网络。
Sensors (Basel). 2021 Feb 23;21(4):1552. doi: 10.3390/s21041552.

引用本文的文献

1
Video map: A realtime orthographic geo-image considering DEM and semantic information.视频地图:一种考虑数字高程模型(DEM)和语义信息的实时正射地理图像。
PLoS One. 2025 May 14;20(5):e0323669. doi: 10.1371/journal.pone.0323669. eCollection 2025.
2
Enhanced Camera Relocalization Through Optimized Accelerated Coordinate Encoding Network and Pose Solver.通过优化的加速坐标编码网络和位姿求解器实现增强的相机重定位
Sensors (Basel). 2025 Mar 19;25(6):1920. doi: 10.3390/s25061920.
3
Enhanced outdoor visual localization using Py-Net voting segmentation approach.
使用Py-Net投票分割方法增强户外视觉定位
Front Robot AI. 2024 Oct 9;11:1469588. doi: 10.3389/frobt.2024.1469588. eCollection 2024.
4
Analyzing the Impact of Objects in an Image on Location Estimation Accuracy in Visual Localization.分析图像中的物体对视觉定位中位置估计准确性的影响。
Sensors (Basel). 2024 Jan 26;24(3):816. doi: 10.3390/s24030816.
5
Multi-Session Visual SLAM for Illumination-Invariant Re-Localization in Indoor Environments.用于室内环境中光照不变重定位的多会话视觉同步定位与地图构建
Front Robot AI. 2022 Jun 16;9:801886. doi: 10.3389/frobt.2022.801886. eCollection 2022.
6
Reference Pose Generation for Long-term Visual Localization via Learned Features and View Synthesis.通过学习特征和视图合成实现长期视觉定位的参考姿态生成
Int J Comput Vis. 2021;129(4):821-844. doi: 10.1007/s11263-020-01399-8. Epub 2020 Dec 23.