语义分割网络之PSPnet

news/2024/5/20 7:35:07 标签: 语义分割, PSPnet, FCN, Mask RCNN, Pyramid Scene Parsin

一.提出背景

       基于FCN全卷积网络的分割面临诸多问题,这篇文章从多尺度入手,提出了金字塔模型来提取多尺度的信息,达到了 State-of-the-art 的结果

       论文:PSPnetPyramid Scene Parsing Network 【点击下载】

       Caffe代码:【Github】


二.算法框架

       算法细节比较多,这里我主要强调以下几个关键点:

       1)通过多尺度 Pooling 的方式得到不同 Scale 的 Feature,Concat 得到判别的多尺度特征;

     

       2)加入额外的深度监督 Loss

        

三.数据训练

1)下载 Github 代码

      按照 readme 说明文件进行编译和运行,不多说。

      原版本支持 cuda7.5 和 cudnn v4,高版本的童鞋可以【下载这个版本】。

      下载 matio

   ./configure
   $ make
   $ make install


2)准备训练数据

      自己标注训练数据,参考 VOC Segment 格式。

      标注工具:

      【LabelImgPlus】 风格与LabelImg 一致,可以载入文件夹批量标定;

      【Labelme】 MIT的开源工具,单张标注,可以自己扩展;

      【CityScapesTool】 CityScapes 数据集自带的脚本,包括 Annotation、格式转换等脚本;


3)准备训练模型

      训练模型:下载

      注意,如果训练自己的数据,需要准备好初始化 caffemodel,避免过拟合。


四.测试结果

       训练完给出~


http://www.niftyadmin.cn/n/904585.html

相关文章

DM8168的SPI接口

1. 2. 3 4 5 6 7 8 9 10 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. END

Bitmap缩放(三)

质量压缩 public class MainActivity extends AppCompatActivity {Overrideprotected void onCreate(Bundle savedInstanceState) {super.onCreate(savedInstanceState);setContentView(R.layout.activity_main);ImageView imageView findViewById(R.id.image);Bitmap bm Bit…

人群密度估计-Crowd Density

一. 应用背景在安防大背景下,对敏感区域人流量的管控是一个重要的课题,防止人群骚乱、踩踏现象的发生,对非预期的人员汇聚进行预警等等,最常用的方法是检测到每个目标,然后借助 Perspective 矩阵完成到实际位置的映射&…

DM8168 EVM OMX



冲刺2-8

搭建一个大的app框架 将每一个小功能联系起来 组成一个 功能齐全 又相互联系 的整体 在这个过程中,明显显示出了功能的 模块化 但有些不协调 转载于:https://www.cnblogs.com/hxyz/p/11015130.html

COM载板设计之二:电源与复位

3.1 电源一般要求 COM Express是单电源供电:12VDC,/-5%。有些厂家的模块电源适应范围可能会更宽一些,COM Express模块消耗功率一般在25到50W范围。 如果有一些暂停功能(RAM暂停,磁盘暂停,按键唤醒&#x…

TynSerial流的序列(还原)

TynSerial流的序列(还原) procedure TForm1.ToolButton18Click(Sender: TObject); varserial: TynSerial;ms, ms2: TMemoryStream; beginserial : TynSerial.Create;ms:TMemoryStream.Create;ms2:TMemoryStream.Create;serial.WriteStream(stream, ms); …