U-Net——《U-Net: Convolutional Networks for Biomedical Image Segmentation》(MICCA 2015)

news/2024/5/20 9:58:25 标签: 图像分割, 语义分割, 人工智能, Unet

U-net: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

  • 医学图像分割
  • 1. U-Net——《U-Net: Convolutional Networks for Biomedical Image Segmentation》(MICCA(国际医学图像计算和计算机辅助干预会议)2015)
  • 2. FusionNet——《FusionNet: A deep fully residual convolutional neural network for image segmentation in connectomics》(主题CVPR 2016)

医学图像分割

  • 难点

    • 数据量少。一些挑战赛只提供不到1 0 0例的数据
    • 图片尺寸大。单张图片尺寸大、分辨率高,对模型的处理速度有一定的要求
    • 要求高。医学图像边界模糊、梯度复杂,对算法的分割准确度要求极高
    • 多模态。以I SLES脑梗竞赛为例,其官方提供了CBF , MTT , CBV , TMAX , CTP等多种模态的数据
      在这里插入图片描述
  • ISBI:IEEE International Symposium on Biomedical Imaging(IEEE国际生物医学影像研讨会)

    • ISBI是IEEE信号处理协会(SPS)和IEEE医学与生物学工程学会(EMBS)的一项联合计划。要求高质
      量的论文,包括图像形成和重建,图像处理和分析,动态成像,可视化,图像质量评估,大图像数据的机器学习以及物理,生物学和统计建模。

1. U-Net——《U-Net: Convolutional Networks for Biomedical Image Segmentation》(MICCA(国际医学图像计算和计算机辅助干预会议)2015)

  • 标题:SegNet:一种用于图像分割的深度卷积编码器-解码器结构

  • 论文:https://arxiv.org/pdf/1505.04597v1.pdf

  • 代码:

    • https://github.com/labmlai/annotated_deep_learning_paper_implementations
    • https://github.com/milesial/Pytorch-UNet
  • 研究成果及意义:

    • 1.赢得了ISBI cell tracking challenge 2015
    • 2.速度快,对一个512*512的图像,使用一块GPU只需要不到一秒的时间
    • 3.成为大多做医疗影像语义分割任务的baseline,也启发了大量研究者去思考U型语义分割网络
    • 4.UNet结合了低分辨率信息(提供物体类别识别依据)和高分辨率信息(提供精准分割定位依
      据),完美适用于医学图像分割
  • 摘要:

    • 主要贡献:本文提出了一个网络和训练策略,使用数据增强,以便更有效的使用可用的带标签
      样本
    • 网络结构:网络由两部分组成,定义一个收缩路径来获取全局信息,同时定义一个对称的扩张
      路径用以精确定位
    • 网络效果:该网络可以用很少的图片进行端到端训练,处理速度也比较快
    • 实验结果:以很大的优势赢得了2015 ISBI细胞跟踪挑战赛
  • 引言

    • Ciresan等人在滑动窗口设置中训练网络,以某一像素的领域(patch)作为输入,用于预测每个像素的类别标签。网络的优点有:
      • 网络具有局部感知能力
      • 用于训练的样本数量远大于训练图像的数量
      • 改网络获得EM分割挑战ISBI 2012冠军
    • 改网络中有两点明显的不足:
      • 改网络运行效率很慢。对于每个领域,网络都要运行一次,且对于领域重叠部分,网络会进行重复运算
      • 网络需要在精确的定位和获取上下文信息之间平衡。越大的patch需要越多的最大池化层,这会降低定位的准确度,而小的patch使得网络获取较少的上下文信息。
    • 我们在FCN基础上建立了一个更加优雅的框架,我们修改并扩展了这个框架,使其可以仅使用少量训练图片就可以工作,获得更高的分割准确率,改进思想:
      • 设计了一个完全对称的U型结构,可以更好的融合图片特征
        在这里插入图片描述
      • 在上采样部分也包括大量特征通道,使网络能够将全局信息传播到更高的分辨率层
      • 采用镜像输入图像的方式进行补全缺失内容(是针对卷积操作存在两个问题: 1.图像越来越小;2.图像边界信息丢失,即有些图像角落和边界的信息发挥作用较少,文章中是说:细胞中心具有上下文信息帮忙分类,边界没有很好的上下文信息,所以需要补全 )
        在这里插入图片描述
        图中(镜像操作):将边缘部分对称反转padding图像边缘,通过卷积核保持最后的特征图大小不变
      • 数据增强:用随机变形,对细胞分割很有效
      • 设计了加权损失函数(连接细胞的权重大些)
        在这里插入图片描述
        在这里插入图片描述
        加权损失: d 1 ( x ) d_1(x) d1x表示图中某一背景像素点到离这个点最近的细胞边界的距离, d 2 ( x ) d_2(x) d2x表示离这个像素点第二近的细胞的距离。即在细胞边界附近的像素点给的权重会大一些,离细胞比较远的像素点会小一点。如果同类细胞贴的比较近,可能就会增大训练的难度,减少准确率,毕竟卷积会考虑该像素点周围的一些特征,而两个相同的类的细胞贴在一起,就容易误判,所以对这种两个相同类贴在一起的细胞边界,给予较大的权重,使得训练之后分割更准确

2. FusionNet——《FusionNet: A deep fully residual convolutional neural network for image segmentation in connectomics》(主题CVPR 2016)

  • 标题:学习反卷积网络的语义分割
  • 论文:https://arxiv.org/ftp/arxiv/papers/1612/1612.05360.pdf
  • 代码:https://github.com/GunhoChoi/FusionNet-Pytorch
  • 摘要:
    • 主要贡献:本文提出了一种新的深度神经网络FusionNet,用于自动分割连接组学数据中的神经元结构
    • 主要方法:引入了基于求和的跳跃连接,允许更深入的网络结构以实现更精确的分割
    • 实验结果:通过与ISBI-EM分割挑战中的最新方法比较,我们展示了方法的新性能。还展示了两个其他任务的分割结果,包括细胞膜和细胞体的分割以及细胞形态学的统计分析
      在这里插入图片描述

http://www.niftyadmin.cn/n/819363.html

相关文章

2022最新款,官宣100000个跨年红包封面,直接领!!

今年过年我想要一点与众不同是哪“亿”点点呢?想要酣畅淋漓地回顾过往想要满怀希冀地展望未来还想要一款纪念此刻的红包封面好!全都满足!下方公众号回复【红包封面】即可免费领取!红米手机1月8日,10:00CELINE思琳1月7日…

HDMapNet: An Online HD Map Construction and Evaluation Framework:将高精地图工作交给感知去做

构建高清地图往往都是公司的高清地图团队的任务,但是需要很大的工作量,并且道路变化会增加标注的工作量,实时的建立高清地图,将任务交给感知,是个很有意义和挑战的事! arxiv地址: https://arxiv.org/pdf/21…

中枪了。。。

——fin.——作者:了不起本文属公众号:了不起的程序员原创作品承蒙厚爱,请多关照-今日话题-#以上成语你中枪了吗#欢迎水友们评论区留言讨论~写在最后了不起的程序员摸鱼基地成立了!!!了不起的程序员读者交流…

tf.roll:tensorflow 中对多维Tensor移位

1. 函数说明 先说结论: tf.roll(t, shift[1, -2], axis[0, 1]): shift:正值表示右(或下)移,负值表示左(或上)移 axis:tensor不只一行时:0轴表示列&#xff0c…

GitHub 颜值这么高的播放器,太爱了!

背景先采访下,圈友们有多少平时听音乐的,还有多少人用过网易云音乐?打开手机的应用商店,查看音乐榜,网易云都是高居榜单前列。传统的 app 界面大家看的都比较多,今天给大家介绍一款开源的音乐的播放器---Ye…

[BEV系列]BEVFormer: Learning Bird’s-Eye-ViewRepresentation from Multi-Camera Images viaSpatiotemporal

论文链接:https://arxiv.org/pdf/2203.17270v1.pdf 代码链接:https://github.com/zhiqi-li/BEVFormer 1. 摘要(Abstract) 3D视觉感知任务,包括基于多摄像头图像的3D检测和地图分割,对于自动驾驶系统至关重要…

如此牛b的背景特效,你确定不想要?

点击蓝字 关注我们将前端实验室设为星标精品文章第一时间阅读大家好,我是前端实验室的大师兄!今天直上主题:particles.jsA lightweight JavaScript library for creating particles.一个轻量级的创建粒子背景的 JavaScript 库。简介particles.js用来在 w…

python通过索引列表去获取列表的数据

方法1:[::2] 如果索引是有等差数列:比如[2,4,6,8] [::2]:每隔2个取一个 a [1,2,3,4,5] print(a[::2])输出 [1, 3, 5]方法2:for循环: b[0,2] a [elem0,elem1,elem2] sublist [a[i] for i in b]方法3:it…