• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

正雅隐形矫治器:基于图像的牙齿隐形矫正预测技术通过潜在风格操控实现。

OrthoAligner: Image-Based Teeth Alignment Prediction via Latent Style Manipulation.

出版信息

IEEE Trans Vis Comput Graph. 2023 Aug;29(8):3617-3629. doi: 10.1109/TVCG.2022.3166159. Epub 2023 Jun 29.

DOI:10.1109/TVCG.2022.3166159
PMID:35404818
Abstract

In this article, we present OrthoAligner, a novel method to predict the visual outcome of orthodontic treatment in a portrait image. Unlike the state-of-the-art method, which relies on a 3D teeth model obtained from dental scanning, our method generates realistic alignment effects in images without requiring additional 3D information as input and thus making our system readily available to average users. The key of our approach is to employ the 3D geometric information encoded in an unsupervised generative model, i.e., StyleGAN in this article. Instead of directly conducting translation in the image space, we embed the teeth region extracted from a given portrait to the latent space of the StyleGAN generator and propose a novel latent editing method to discover a geometrically meaningful editing path that yields the alignment process in the image space. To blend the edited mouth region with the original portrait image, we further introduce a BlendingNet to remove boundary artifacts and correct color inconsistency. We also extend our method to short video clips by propagating the alignment effects across neighboring frames. We evaluate our method in various orthodontic cases, compare it to the state-of-the-art and competitive baselines, and validate the effectiveness of each component.

摘要

在本文中,我们提出了一种新的方法 OrthoAligner,用于预测肖像图像中正畸治疗的视觉效果。与依赖于从牙齿扫描获得的 3D 牙齿模型的最新方法不同,我们的方法无需额外的 3D 信息作为输入即可在图像中生成逼真的对齐效果,从而使我们的系统易于为普通用户使用。我们的方法的关键是利用无监督生成模型(本文中为 StyleGAN)中编码的 3D 几何信息。我们不是直接在图像空间中进行转换,而是将从给定肖像中提取的牙齿区域嵌入到 StyleGAN 生成器的潜在空间中,并提出一种新的潜在编辑方法来发现具有几何意义的编辑路径,从而在图像空间中产生对齐过程。为了将编辑后的嘴部区域与原始肖像图像融合,我们进一步引入了一个 BlendingNet 来消除边界伪影并纠正颜色不一致。我们还通过在相邻帧之间传播对齐效果,将我们的方法扩展到短视频剪辑中。我们在各种正畸案例中评估了我们的方法,将其与最新方法和竞争基线进行了比较,并验证了每个组件的有效性。

相似文献

1
OrthoAligner: Image-Based Teeth Alignment Prediction via Latent Style Manipulation.正雅隐形矫治器:基于图像的牙齿隐形矫正预测技术通过潜在风格操控实现。
IEEE Trans Vis Comput Graph. 2023 Aug;29(8):3617-3629. doi: 10.1109/TVCG.2022.3166159. Epub 2023 Jun 29.
2
Identity preserving multi-pose facial expression recognition using fine tuned VGG on the latent space vector of generative adversarial network.基于生成对抗网络潜在空间向量的微调 VGG 进行身份保留多姿态面部表情识别。
Math Biosci Eng. 2021 Apr 28;18(4):3699-3717. doi: 10.3934/mbe.2021186.
3
DrawingInStyles: Portrait Image Generation and Editing With Spatially Conditioned StyleGAN.绘画风格:基于空间条件StyleGAN的人像图像生成与编辑
IEEE Trans Vis Comput Graph. 2023 Oct;29(10):4074-4088. doi: 10.1109/TVCG.2022.3178734. Epub 2023 Sep 1.
4
GuidedStyle: Attribute knowledge guided style manipulation for semantic face editing.引导式风格:用于语义人脸编辑的属性知识引导式风格操控。
Neural Netw. 2022 Jan;145:209-220. doi: 10.1016/j.neunet.2021.10.017. Epub 2021 Oct 28.
5
Self-Supervised Matting-Specific Portrait Enhancement and Generation.
IEEE Trans Image Process. 2022;31:5332-5342. doi: 10.1109/TIP.2022.3194711. Epub 2022 Aug 16.
6
Talk-to-Edit: Fine-Grained 2D and 3D Facial Editing via Dialog.通过对话进行精细的二维和三维面部编辑:对话式编辑
IEEE Trans Pattern Anal Mach Intell. 2024 May;46(5):3692-3706. doi: 10.1109/TPAMI.2023.3347299. Epub 2024 Apr 3.
7
Transferring of speech movements from video to 3D face space.将语音动作从视频转移到3D面部空间。
IEEE Trans Vis Comput Graph. 2007 Jan-Feb;13(1):58-69. doi: 10.1109/TVCG.2007.22.
8
Geometrically Editable Face Image Translation With Adversarial Networks.基于对抗网络的可几何编辑面部图像翻译
IEEE Trans Image Process. 2021;30:2771-2783. doi: 10.1109/TIP.2021.3052084. Epub 2021 Feb 12.
9
Temporally consistent sequence-to-sequence translation of cataract surgeries.白内障手术的时间一致的序列到序列翻译。
Int J Comput Assist Radiol Surg. 2023 Jul;18(7):1217-1224. doi: 10.1007/s11548-023-02925-y. Epub 2023 May 23.
10
Towards Disentangling Latent Space for Unsupervised Semantic Face Editing.面向无监督语义人脸编辑的潜在空间解缠。
IEEE Trans Image Process. 2022;31:1475-1489. doi: 10.1109/TIP.2022.3142527. Epub 2022 Jan 27.

引用本文的文献

1
Study on virtual tooth image generation utilizing CF-fill and Pix2pix for data augmentation.利用 CF-fill 和 Pix2pix 进行数据增强的虚拟牙齿图像生成研究。
Sci Rep. 2024 Nov 5;14(1):26772. doi: 10.1038/s41598-024-78190-z.