语义分割,实例分割,全景分割梳理

语义分割(semantic segmentation)

实例分割(instance segmentation)

全景分割(Panoptic Segmentation)

下面基于Panoptic Segmentation这篇论文进行这几个概念的梳理

论文链接:https://openaccess.thecvf.com/content_CVPR_2019/papers/Kirillov_Panoptic_Segmentation_CVPR_2019_paper.pdf

论文提出并研究了一个称之为全景分割(Panoptic Segmentation,PS)的任务。全景分割统一了语义分割(为每个像素分配一个类标签)和实例分割(检测和分割每个对象实例)这两个典型的不同任务

Figure 1. 给定图像(a);标签如(b)为语义分割(每个像素的类别标签);标签如(c) 实例分割(每个对象掩码和类别标签);标签如(d)提议的全景分割任务(每像素类别+实例标签);全景分割任务:(1) 包括stuff和thing的类别;(2) 使用简单但通用的格式;(3) 为所有类别引入统一的评估指标。全景分割概括了语义分割实例分割,我们期待统一的任务将带来新的挑战,并促成创新的新方法。 

上图中thing指代诸如人、动物、工具之类的可数对象,stuff是指具有相似纹理或材料的无定形区域,例如草、天空、道路。

(1)语义分割实例分割区别联系

总的而言,目前的分割任务主要有两种: 语义分割实例分割

语义分割是对图像中的每个像素都划分出对应的类别,即实现像素级别的分类; 而类的具体对象,即为实例

语义分割实例分割的区别又是什么

语义分割会为图像中的每个像素分配一个类别,但是同一类别之间的对象不会区分。而实例分割,只对特定的物体进行分类。这看起来与目标检测相似,不同的是目标检测输出目标的边界框和类别,实例分割输出的是目标的Mask和类别

语义分割、分类和定位、目标检测和实例分割的比较 

(2)语义分割实例分割经典网络

1.语义分割

<1>全卷积网络FCN https://arxiv.org/pdf/1411.4038.pdf

全卷积网络可以有效地学习,使每个像素的任务,如语义分割密集的预测。 

将全连接层转换为卷积层使分类网能够输出热力图。增加层和空间损耗(如上图所示)为端到端密集学习提供了一个高效的机器。 

<2>U-Net https://arxiv.org/pdf/1505.04597.pdf

<3>SegNethttps://browse.arxiv.org/pdf/1511.00561.pdf

<4>空洞卷积Dilated Convolutionshttps://browse.arxiv.org/pdf/1511.07122.pdf

<5>DeepLab v1-v3+

v1:https://browse.arxiv.org/pdf/1412.7062v3.pdf

v2:https://browse.arxiv.org/pdf/1606.00915.pdf

v3:https://browse.arxiv.org/pdf/1706.05587.pdf

v3+:https://browse.arxiv.org/pdf/1802.02611.pdf

<6>RefineNethttps://browse.arxiv.org/pdf/1611.06612.pdf

<7>PSPNet(Pyramid Scene Parsing Network)https://browse.arxiv.org/pdf/1612.01105.pdf

2.实例分割

<1>两阶段Mask R-CNNhttps://browse.arxiv.org/pdf/1703.06870.pdf

<2>Instance-sensitive FCNhttps://browse.arxiv.org/pdf/1603.08678.pdf

<3>FCIShttps://browse.arxiv.org/pdf/1611.07709.pdf

<4>YOLACT: Real-time Instance Segmentationhttps://browse.arxiv.org/pdf/1904.02689v2.pdf

<5>PolarMaskhttps://browse.arxiv.org/pdf/1909.13226.pdf

<6>SOLO: Segmenting Objects by Locationshttps://browse.arxiv.org/pdf/1912.04488.pdf

<7>RDSNethttps://browse.arxiv.org/pdf/1912.05070.pdf

<8>PointRendhttps://browse.arxiv.org/pdf/1912.08193.pdf

<9>BlendMaskhttps://browse.arxiv.org/pdf/2001.00309.pdf


http://www.niftyadmin.cn/n/5072441.html

相关文章

【Java 进阶篇】HTML 图片标签详解

HTML&#xff08;超文本标记语言&#xff09;是构建Web页面的标准语言&#xff0c;它包含了许多标签&#xff0c;用于定义和排列页面内容。在Web开发中&#xff0c;显示图像是非常常见的需求之一&#xff0c;为此HTML提供了<img>标签来插入图像。本文将详细介绍HTML图片标…

面试算法18:有效的回文

题目 给定一个字符串&#xff0c;请判断它是不是回文。假设只需要考虑字母和数字字符&#xff0c;并忽略大小写。例如&#xff0c;"Was it a cat I saw&#xff1f;"是一个回文字符串&#xff0c;而"race a car"不是回文字符串。 分析 判断一个字符串是…

完美解决 flex 实现一行三个,显示多行,左对齐

效果图 代码 <body><section class"content"><div class"item">元素</div><div class"item">元素</div><div class"item">元素</div><div class"item">元素</di…

宠物社区风格 商业版(GBK)Discuz模板

仿爱宠乐园宠物社区风格Discuz模板&#xff0c;商业版&#xff08;GBK&#xff09;Discuz模板。 1、版本支持&#xff1a;discuzx3.0版本&#xff0c;discuzx3.1版本&#xff0c;discuzx3.2版本&#xff0c;discuzx3.3版本&#xff0c;discuzx3.4版本。包括网站首页&#xff0…

32、Flink table api和SQL 之用户自定义 Sources Sinks实现及详细示例

Flink 系列文章 1、Flink 部署、概念介绍、source、transformation、sink使用示例、四大基石介绍和示例等系列综合文章链接 13、Flink 的table api与sql的基本概念、通用api介绍及入门示例 14、Flink 的table api与sql之数据类型: 内置数据类型以及它们的属性 15、Flink 的ta…

Linux深度学习:除基本命令操作外的实用操作

Linux深度学习&#xff1a;除基本命令操作外的实用操作 软件安装systemctl软连接日期、时区IP地址、主机名网络传输下载和网络请求端口 进程管理主机状态系统资源监控磁盘信息监控网络状态监控 环境变量上传、下载压缩、解压root用户、用户、用户组管理查看、修改权限控制 软件…

服务器配置openvpn,ssh连接断开

ip rule add from 192.168.1.11 table 128&#xff08;服务器IP&#xff09; ip route add table 128 to 192.168.1.0/24 dev eth0&#xff08;服务器网段&#xff09; ip route add table 128 default via 192.168.1.1&#xff08;服务器网关&#xff09;

MFC ExtTextOut函数学习

ExtTextOut - 扩展的文本输出&#xff1b; win32 api的声明如下&#xff1b; ExtTextOut( DC: HDC; {设备环境句柄} X, Y: Integer; {起点坐标} Options: Longint; {选项} Rect: PRect; {指定显示范围; 0 表示限制范围} Str: PChar; {字符串…