PCTC-Net：一种具有并行双编码器网络的裂缝分割网络，该网络融合了基于预卷积的Transformer和卷积神经网络。

PCTC-Net: A Crack Segmentation Network with Parallel Dual Encoder Network Fusing Pre-Conv-Based Transformers and Convolutional Neural Networks.

作者信息

Moon Ji-Hwan, Choi Gyuho, Kim Yu-Hwan, Kim Won-Yeol

机构信息

Department of Artificial Intelligence Engineering, Chosun University, Gwangju 61452, Republic of Korea.

Department of Computer Engineering, Chosun University, Gwangju 61452, Republic of Korea.

出版信息

Sensors (Basel). 2024 Feb 24;24(5):1467. doi: 10.3390/s24051467.

DOI:10.3390/s24051467

PMID:38475003

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10934755/

Abstract

Cracks are common defects that occur on the surfaces of objects and structures. Crack detection is a critical maintenance task that traditionally requires manual labor. Large-scale manual inspections are expensive. Research has been conducted to replace expensive human labor with cheaper computing resources. Recently, crack segmentation based on convolutional neural networks (CNNs) and transformers has been actively investigated for local and global information. However, the transformer is data-intensive owing to its weak inductive bias. Existing labeled datasets for crack segmentation are relatively small. Additionally, a limited amount of fine-grained crack data is available. To address this data-intensive problem, we propose a parallel dual encoder network fusing Pre-Conv-based Transformers and convolutional neural networks (PCTC-Net). The Pre-Conv module automatically optimizes each color channel with a small spatial kernel before the input of the transformer. The proposed model, PCTC-Net, was tested with the DeepCrack, Crack500, and Crackseg9k datasets. The experimental results showed that our model achieved higher generalization performance, stability, and F1 scores than the SOTA model DTrC-Net.

摘要

裂缝是物体和结构表面常见的缺陷。裂缝检测是一项关键的维护任务，传统上需要人工操作。大规模的人工检查成本高昂。人们进行了相关研究，试图用成本更低的计算资源取代昂贵的人力。最近，基于卷积神经网络（CNN）和变换器的裂缝分割技术因能处理局部和全局信息而受到积极研究。然而，变换器由于其较弱的归纳偏置而数据密集。现有的用于裂缝分割的标注数据集相对较小。此外，细粒度裂缝数据的数量有限。为了解决这个数据密集型问题，我们提出了一种融合基于预卷积的变换器和卷积神经网络的并行双编码器网络（PCTC-Net）。预卷积模块在变换器输入之前，使用小空间内核自动优化每个颜色通道。所提出的模型PCTC-Net在DeepCrack、Crack500和Crackseg9k数据集上进行了测试。实验结果表明，我们的模型比当前最优模型DTrC-Net具有更高的泛化性能、稳定性和F1分数。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/79c0/10934755/e72ba540a40d/sensors-24-01467-g001.jpg

相似文献

PCTC-Net: A Crack Segmentation Network with Parallel Dual Encoder Network Fusing Pre-Conv-Based Transformers and Convolutional Neural Networks.PCTC-Net：一种具有并行双编码器网络的裂缝分割网络，该网络融合了基于预卷积的Transformer和卷积神经网络。

Sensors (Basel). 2024 Feb 24;24(5):1467. doi: 10.3390/s24051467.

RUC-Net: A Residual-Unet-Based Convolutional Neural Network for Pixel-Level Pavement Crack Segmentation.RUC-Net：一种基于残差 U 型网络的用于像素级路面裂缝分割的卷积神经网络。

Sensors (Basel). 2022 Dec 21;23(1):53. doi: 10.3390/s23010053.

Improved U-net network asphalt pavement crack detection method.改进的 U-net 网络沥青路面裂缝检测方法。

PLoS One. 2024 May 31;19(5):e0300679. doi: 10.1371/journal.pone.0300679. eCollection 2024.

Pact-Net: Parallel CNNs and Transformers for medical image segmentation.Pact-Net：用于医学图像分割的并行卷积神经网络和Transformer

Comput Methods Programs Biomed. 2023 Dec;242:107782. doi: 10.1016/j.cmpb.2023.107782. Epub 2023 Sep 1.

Dual encoder network with transformer-CNN for multi-organ segmentation.基于 Transformer-CNN 的双编码器网络的多器官分割。

Med Biol Eng Comput. 2023 Mar;61(3):661-671. doi: 10.1007/s11517-022-02723-9. Epub 2022 Dec 29.

Multi-scale feature fusion for pavement crack detection based on Transformer.基于Transformer的路面裂缝检测多尺度特征融合

Math Biosci Eng. 2023 Jul 11;20(8):14920-14937. doi: 10.3934/mbe.2023668.

Multi-task approach based on combined CNN-transformer for efficient segmentation and classification of breast tumors in ultrasound images.基于卷积神经网络（CNN）与变换器（Transformer）相结合的多任务方法用于超声图像中乳腺肿瘤的高效分割与分类

Vis Comput Ind Biomed Art. 2024 Jan 26;7(1):2. doi: 10.1186/s42492-024-00155-w.

TGDAUNet: Transformer and GCNN based dual-branch attention UNet for medical image segmentation.TGDAUNet：基于 Transformer 和 GCNN 的双分支注意力 U-Net 用于医学图像分割。

Comput Biol Med. 2023 Dec;167:107583. doi: 10.1016/j.compbiomed.2023.107583. Epub 2023 Oct 21.

iU-Net: a hybrid structured network with a novel feature fusion approach for medical image segmentation.iU-Net：一种具有用于医学图像分割的新型特征融合方法的混合结构网络。

BioData Min. 2023 Feb 21;16(1):5. doi: 10.1186/s13040-023-00320-6.

DeepCrack: Learning Hierarchical Convolutional Features for Crack Detection.深度裂缝检测：学习用于裂缝检测的分层卷积特征

IEEE Trans Image Process. 2018 Oct 31. doi: 10.1109/TIP.2018.2878966.

本文引用的文献

A Survey on Vision Transformer.视觉Transformer综述

IEEE Trans Pattern Anal Mach Intell. 2023 Jan;45(1):87-110. doi: 10.1109/TPAMI.2022.3152247. Epub 2022 Dec 5.

Unified Focal loss: Generalising Dice and cross entropy-based losses to handle class imbalanced medical image segmentation.统一焦点损失：将基于 Dice 和交叉熵的损失函数推广到处理类不平衡的医学图像分割。

Comput Med Imaging Graph. 2022 Jan;95:102026. doi: 10.1016/j.compmedimag.2021.102026. Epub 2021 Dec 13.

FAT-Net: Feature adaptive transformers for automated skin lesion segmentation.FAT-Net：用于自动皮肤病变分割的特征自适应转换器。

Med Image Anal. 2022 Feb;76:102327. doi: 10.1016/j.media.2021.102327. Epub 2021 Dec 4.

Combo loss: Handling input and output imbalance in multi-organ segmentation.组合损失：处理多器官分割中的输入和输出不平衡。

Comput Med Imaging Graph. 2019 Jul;75:24-33. doi: 10.1016/j.compmedimag.2019.04.005. Epub 2019 May 9.

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation.SegNet：一种用于图像分割的深度卷积编解码器架构。

IEEE Trans Pattern Anal Mach Intell. 2017 Dec;39(12):2481-2495. doi: 10.1109/TPAMI.2016.2644615. Epub 2017 Jan 2.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

PCTC-Net：一种具有并行双编码器网络的裂缝分割网络，该网络融合了基于预卷积的Transformer和卷积神经网络。

PCTC-Net: A Crack Segmentation Network with Parallel Dual Encoder Network Fusing Pre-Conv-Based Transformers and Convolutional Neural Networks.

作者信息

机构信息

出版信息

相似文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

本文引用的文献