CV计算机视觉每日开源代码Paper with code速览-2023.11.15

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构:CNN】PadChannel: Improving CNN Performance through Explicit Padding Encoding

  • 论文地址:https://arxiv.org//pdf/2311.07623

  • 开源代码:GitHub - AussieSeaweed/pad-channel: Encoding padding statuses as an input channel for enhanced performance in convolutional neural networks

2.【语义分割】(ICLR2024)Test-Time Training for Semantic Segmentation with Output Contrastive Loss

  • 论文地址:https://arxiv.org//pdf/2311.07877

  • 开源代码:GitHub - dazhangyu123/OCL: Test-Time Training for Semantic Segmentation with Output Contrastive Loss

3.【医学图像分割:3D】Assessing Test-time Variability for Interactive 3D Medical Image Segmentation with Diverse Point Prompts

  • 论文地址:https://arxiv.org//pdf/2311.07806

  • 开源代码(即将开源):GitHub - MedICL-VU/variability: Assessing Test-time Variability for Interactive 3D Medical Image Segmentation with Diverse Point Prompts

4.【多模态】Instant3D: Instant Text-to-3D Generation

  • 论文地址:https://arxiv.org//pdf/2311.08403

  • 工程主页:Instant3D: Instant Text-to-3D Generation

  • 代码即将开源

5.【多模态】Towards Open-Ended Visual Recognition with Large Language Model

  • 论文地址:https://arxiv.org//pdf/2311.08400

  • 开源代码:GitHub - bytedance/OmniScient-Model: This repo contains the code for our paper Towards Open-Ended Visual Recognition with Large Language Model

6.【多模态】Improving Image Captioning via Predicting Structured Concepts

  • 论文地址:https://arxiv.org//pdf/2311.08223

  • 开源代码(即将开源):GitHub - wangting0/SCP-WGCN: official code of "Improving Image Captioning via Predicting Structured Concepts"

7.【多模态】Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding

  • 论文地址:https://arxiv.org//pdf/2311.08046

  • 开源代码:GitHub - PKU-YuanGroup/Chat-UniVi: Chat-UniVi: Unified Visual Representation Empowers Large Language Models with Image and Video Understanding

8.【多模态】One-2-3-45++: Fast Single Image to 3D Objects with Consistent Multi-View Generation and 3D Diffusion

  • 论文地址:https://arxiv.org//pdf/2311.07885

  • 工程主页:One-2-3-45++

  • 开源代码(即将开源):GitHub - SUDO-AI-3D/One2345plus

9.【多模态】Vision-Language Instruction Tuning: A Review and Analysis

  • 论文地址:https://arxiv.org//pdf/2311.08172

  • 开源代码(即将开源):GitHub - palchenli/VL-Instruction-Tuning

10.【多模态】Follow-Up Differential Descriptions: Language Models Resolve Ambiguities for Image Classification

  • 论文地址:https://arxiv.org//pdf/2311.07593

  • 开源代码:GitHub - BatsResearch/fudd: Follow-Up Differential Descriptions: Language Models Resolve Ambiguities for Image Classification

11.【三维重建】DynamicSurf: Dynamic Neural RGB-D Surface Reconstruction with an Optimizable Feature Grid

  • 论文地址:https://arxiv.org//pdf/2311.08159

  • 工程主页:DynamicSurf: Dynamic Neural RGB-D Surface Reconstruction with an Optimizable Feature Grid.

  • 代码即将开源

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.11.14

CV计算机视觉每日开源代码Paper with code速览-2023.11.13

CV计算机视觉每日开源代码Paper with code速览-2023.11.10


http://www.niftyadmin.cn/n/5194750.html

相关文章

ACWSpring1.3

首先,前端写ajax写上我们的访问路径(就在我们前端的源代码里面),我们建了两个包pkController用于前端页面url映射过来一层一层找到我们的RestController返回bot1里面有键值,返回的这就是一个session对象bot1这个map.前端拿到我们bot1里的两个值给到我们前端显示出来 1准备页面:…

相机内参及其内参影响因素的几点思考

目录 理论推导之从相机坐标系到像素坐标系 机械参数对相机内参的影响 Resize与Crop对相机内参的影响 参考文献 理论推导之从相机坐标系到像素坐标系 相机内参的意义即从相机坐标系到像素坐标系的表达,其中共涉及到三个坐标系:相机坐标系、成像坐标系…

AIGC ChatGPT4 读取接口文件并进行可视化分析

数据分析的过程中,对数据文件进行可视化分析是每个数据分析师必备的技能。如下图数据源。 现在需要对各地区的销量进行汇总,使用Python来进行分析。 但是又不想写代码,或者不会Python代码,可以用ChatGPT4来帮我们完成代码的编写。 完整的Python代码: import pandas as p…

Linux 基本语句_11_无名管道文件复制

父子进程&#xff1a; 父子进程的变量之间存在着读时共享&#xff0c;写时复制原则 无名管道&#xff1a; 无名管道仅能用于有亲缘关系的进程之间通信如父子进程 代码&#xff1a; #include <stdio.h> #include <unistd.h> #include <sys/types.h> #inc…

Spring IOC - Bean的生命周期之依赖注入

在Spring启动流程中&#xff0c;创建的factoryBean是DefaultListableBeanFactory&#xff0c;其类图如下所示&#xff1a; 可以看到其直接父类是AbstractAutoireCapableBeanFactory&#xff0c;他主要负责完成Bean的自动装配和创建工作。 具体来说&#xff0c;AbstractAutowire…

C++ const与符号表

fun_cpp.cpp //const修饰的全局变量 默认是内部链接&#xff08;只在当前源文件有效 不能直接用于其他源文件&#xff09; const int num_pp 100;//如果必须用在其他源文件 使用只读的全局变量 必须加extern将num转换成外部链接 //extern const int num_pp 100;main_cpp.cpp…

03_面向对象高级_多态

多态 1. 什么是多态&#xff1f; “多态” 是在 “继承” 的基础上实现的一种现象&#xff0c;具体表现为&#xff1a;对象多态、行为多态。 public class HelloWorld {public static void main(String[] args) {// 1. 对象多态Human h1 new Student();Human h2 new Teach…

【MySQL】insert和select单表查询详解(包含大量示例,看了必会)

insert和select 前言正式开始Create全列插入指定列插入多行插入插入失败就更新替换 Retrieveselect语法简介开始查询全列查询指定列查询select后面跟表达式对结果去重条件查询 查询的示例英语不及格的同学及英语成绩 ( < 60 )语文成绩在 [80, 90] 分的同学及语文成绩数学成绩…