Half-UNet:用于医学图像分割的简化U-Net架构

Half-UNet简化了编码器和解码器,还使用了Ghost模块(GhostNet)。并重新设计的体系结构,把通道数进行统一。

论文动机

编码器的不同类型的架构图,编码器(A-C)的结构分别来源于U-Net的编码器、解码器和全的Unet结构。

下面是上图的一些结果指标

将U-Net 的编码器和解码器都视为编码器。通过设计单个解码器来聚合 C1 到 C16 的特征,其结构与 UNet 3+ 中的全尺寸特征聚合相同。编码器(A)可以达到与编码器(C)相当的性能,而编码器(B)的性能明显下降。也就是说U-Net的解码器(图中的B部分)是可以被简化的并且不影响性能。

Half-UNet

1、统一通道数

上图说明了如何在UNet3+的第三解码器层中构造全尺寸聚合特征映射。

在U-Net和UNet 3+的每一个下采样步骤中,特征通道的数量都增加了一倍,增强了特征表达的多样性。但是这增加了模型的复杂性。在 Half-UNet 中,所有特征图的通道数是统一的,也就是减少了卷积运算中的过滤器数量。

2、全尺寸特征融合

U-Net和UNet 3+都使用串联操作进行特征融合,这需要更多的内存和计算量。而加法操作不需要额外的参数和计算复杂度。将不同比例尺的特征图上采样到原始图像的大小,然后通过加操作进行特征融合。

从上图可以看到,他只用了unet的编码器部分,也就是一半的unet,所以这就是Half-UNet的由来

3、Ghost 模块

与标准卷积相比,Half-UNet 使用 Ghost 模块来减少所需的参数和 FLOP。与 GhostNet 中一样,Ghost 模块使用廉价操作的同时生成更多的特征图。

使用 s=2,其中 s 表示固有特征图比例的倒数。一半的特征图由卷积生成,另一半由深度可分离卷积生成。最后将特征图的两部分连接起来形成输出。

结果

论文使用3个数据集

定量结果

Half-UNet†:删除 Half-UNet 中的 Ghost 模块,在乳房 X 光图像方面优于 U-Net 及其变体,在肺结节图像方面比 Half-UNet 更接近U-Net。Half-UNet† 在左心室 MRI 图像方面的表现不如 Half-UNet。

与U-Net及其变体相比,Half-UNet(有无Ghost模块)具有相似的分割精度,而参数和flop分别降低了98.6%和81.8%。

Half-UNet†u 和 Half-UNet †d 的通道数在下采样后翻倍。解码器中的特征融合有两种策略:

1、Upsampling2D + 3×3 convolution,Half-UNet†u和UNet 3+是这样做的;

2、反卷积,也就是Half-UNet†_d和U-Net所做的。

可以看到Half-UNet†u和Half-UNet†d与Half-UNet†相比,增加了所需的flop和参数。

定性结果

Half-UNet、U-Net 和 UNet 3+ 在左心室 MRI 中的定性比较。Half-UNet 可以更完整地分割心内膜和心外膜边界。

进一步的研究

在Half-UNet子网络的左侧,由于双线性上采样和加法都是线性运算,因此几乎不产生参数和计算。在Half-UNet子网络的右侧部分,由于输入通道数量较少(只有64个),并且使用了Ghost模块,卷积的代价明显小于其他结构。

Half-UNet避免了上述三种网络的问题,大大降低了所需的参数和FLOPs。

总结

根据论文表述U-Net 在医学图像分割中的成功主要归功于其分而治之的解决方案,而不是特征融合。所以作者提出了Half-UNet,简化了特征融合部分。

根据我个人的理解,Half-UNet 除了大大减少了参数和FLOPs以外,应该会在分割界限不尖锐的情况表现的比unet更好。

论文地址:Half-UNet: A Simplified U-Net Architecture for Medical Image Segmentation

https://avoid.overfit.cn/post/b6a976d524644102bec313b1a28e0375


http://www.niftyadmin.cn/n/187817.html

相关文章

扩散模型的Prompt指南:如何编写一个明确提示

Prompt(提示)是扩散模型生成图像的内容来源,构建好的提示是每一个Stable Diffusion用户需要解决的第一步。本文总结所有关于提示的内容,这样可以让你生成更准确,更好的图像 一个好的提示 首先我们看看什么是好的提示…

银行数字化转型导师坚鹏:数字化时代客户体验管理与卓越厅堂服务

数字化时代客户体验管理与卓越厅堂服务课程背景: 数字化浪潮下,很多网点存在以下问题: 不清楚如何提升网点数字化客户体验? 不清楚网点数字化客户体验应用案例? 不积善成德如何打造网点卓越厅堂服务? 课…

UML中线条关系记录

背景 UML中类与类,类与接口,接口与接口的关系有:泛化(generalization),关联(association),依赖(dependency),实现(realiz…

【SQL开发实战技巧】系列(三十五):数仓报表场景☞根据条件返回不同列的数据以及Left /Full Join注意事项

系列文章目录 【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事 【SQL开发实战技巧】系列(二):简单单表查询 【SQL开发实战技巧】系列(三):SQL排序的那些事 【SQL开发实战技巧…

mybatis插件原理(自己总结)

前期需要了解的是: 1. mybatis对哪四种对象进行拦截? 1.1:ParameterHandler:对sql参数进行处理 1.2:ResultSetHandler:对结果对象进行处理 1.3:StatementHandler:对sql语句进行处…

2023-04-01:当Go语言遇见FFmpeg视频解码器,使用Go语言改写decode_video.c文件,提升视频解码效率与开发体验。

2023-04-01:当Go语言遇见FFmpeg视频解码器,使用Go语言改写decode_video.c文件,提升视频解码效率与开发体验。 答案2023-04-01: 步骤如下: 1.导入必要的依赖库,包括 fmt、os、unsafe 和其它 FFmpeg 库相关…

css优先级和async/await

css的六大优先级 第一优先级:无条件优先的属性只需要在属性后面使用**!important**。它会覆盖页面内任何位置定义的元素样式。ie6不支持该属性。第二优先级:在html中给元素标签加style,即内联样式。该方法会造成css难以管理&…

SpringBoot配置文件中的数据加密

在SpringBoot开发过程中配置文件是明文存放在application.yml或者application.properties文件中,这种配置方式会带来一定的安全隐患,本章将对这个问题提出一个简单的解决方案。 1,编码 首先需要确定一个加密解密方式,本文采用RS…