语义分割新范式:上海 AI Lab 联合北邮、商汤提出StructToken

来源:投稿 作者:xin
编辑:学姐

Motivation

本文将当前语义分割的方法分为两类,一类是静态逐像素分类方法(static per-pixel classification),另一类为动态逐像素分类方法(dynamic per-pixel classification)。目前基于静态逐像素分类的方法,仅通过探索像素表示的信息融合,扩大每个像素的接受域,使尾部的卷积网络可以更精细的逐像素分类,生成更精细的得分图。然而这类工作侧重于提高逐像素的表示能力,并没有考虑图像中的结构信息。基于动态分类的方法虽然可以通过分类器与特征映射的交互更新可学习标记,提升模型性能。虽然此类方法分类器是动态的,但它仍然作用于每个像素,逐像素分类的性质不会改变,依旧破坏了图像中的结构信息。故本文跳出原有的语义分割框架,从更拟人化的角度考虑语义分割任务。提出了带有结构先验的StructToken。与静态逐像素分类和动态逐像素分类方法不同的是,本文的方法根据结构先验为每个类生成一个粗略的掩码,然后再逐步细化该掩码。(图1展示了三种语义分割方式)

Method

下面介绍本文提出的三种Interaction方法。

Cross-Slice Extraction: 本方法是自注意力的一种拓展,将backbone提取的特征F映射为v、k,将可学习结构Token S映射为q。通过交叉注意力机制学习新的结构化Token S{}'。计算公式如下:

 Self-Slice Extraction:本方法与Cross-Slice Extraction类似,只不过先将特征与结构Token S在通道维度上进行拼接,然后采用自注意力机制学习新的结构化Token S{}'

Result:

表1、表2、表3展示了提出模型在3个数据集上的结果,可以看出,在3个数据集上都达到了SOTA的结果。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“500”获取AI必读高分论文合集

(包含语义分割等多个细分方向)

码字不易,欢迎大家点赞评论收藏!


http://www.niftyadmin.cn/n/229901.html

相关文章

PixiJS 渲染优化

最近做在线CAD可视化与编辑,对前端的可视化渲染技术进行了选型,对于二维CAD来说一般用canvas就够了,但是canvas每一次平移,缩放,更新数据都需要重新计算渲染所有的图形数据,数据一多就显得非常卡。如果使用…

AE开发20210531之色彩设置、渐变色、符号颜色、属性框内数据操作、另存图层、设计添加属性对话框

笔记选择ID变化后,清空symbol,添加进新的来,渐变色设置符号颜色对属性框中数据进行操作另存图层,save方法savelayer打开属性对话框自己设计添加属性对话框课程设计下一节课,图层的渲染点符号,线符号&#x…

C++基础学习笔记(八)——提高编程PART3

参考链接:https://www.bilibili.com/video/BV1et411b73Z/p237&spm_id_frompageDriver&vd_sourceb4d9cee68649c8adcb1e266f7147cd5c 4 STL- 函数对象 4.1 函数对象 4.1.1 函数对象概念 概念: 重载函数调用操作符的类,其对象常称为…

全自动运行(FAO)场景说明

全自动运行场景说明——运营调整 (一) 场景描述 中心调度人员可通过跳停、扣车、人工替换计划运行图(可用于临时调整运营车次和临时交路)、选择列车增加/删减(实现加开、替开等运营需求)、提前发车、调整站停时间、改变列车目的…

MySQL数据库:索引

一、索引简介 1.概念 索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。可以对表中的一列或多列创建索引,并指定索引的类型,各类索引有各自的数据结构实现。 相当于是给数据库中的数据建立了一个目录,通过目录可以知道…

讯飞 语音唤醒 Android SDK

语音唤醒 Android SDK 文档 | 讯飞开放平台文档中心https://www.xfyun.cn/doc/asr/awaken/Android-SDK.html前往控制台,设置唤醒关键词: 控制台-讯飞开放平台https://console.xfyun.cn/services/awaken注意,可以对唤醒词进行评估&#xff0c…

C语言基础应用(四)选择结构

引言: 在日常生活中,我们时时刻刻面临着选择,在C语言中,如果我们需要判断条件从而实现不同的要求,我们就需要使用选择结构。 注:以下代码均未导入头文件,如果读者使用了代码,请记得…

分治算法思想,分治算法解题步骤与题目索引(C++,不断更新)

分治算法 分治算法(Divide and Conquer)是一种解决问题的思想,它将一个大问题分解成若干个较小的子问题,然后对这些子问题进行解决,最后将子问题的解合并得到原问题的解。分治算法的核心思想是将复杂问题简化&#xff…