CV计算机视觉每日开源代码Paper with code速览-2023.10.18

 精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【语义分割】IDRNet: Intervention-Driven Relation Network for Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.10755

  • 开源代码:https://github.com/SegmentationBLWX/sssegmentation

2.【医学图像分割:3D】Towards Generic Semi-Supervised Framework for Volumetric Medical Image Segmentation

  • 论文地址:https://arxiv.org//pdf/2310.11320

  • 开源代码:https://github.com/xmed-lab/GenericSSL

3.【多模态】Set-of-Mark Prompting Unleashes Extraordinary Visual Grounding in GPT-4V

  • 论文地址:https://arxiv.org//pdf/2310.11441

  • 工程主页:SoM-GPT4V

  • 开源代码(暂未开源):https://github.com/microsoft/SoM

4.【多模态】EvalCrafter: Benchmarking and Evaluating Large Video Generation Models

  • 论文地址:https://arxiv.org//pdf/2310.11440

  • 工程主页:EvalCrafter

  • 开源代码(即将开源):https://github.com/EvalCrafter/EvalCrafter

5.【多模态】Knowledge Extraction and Distillation from Large-Scale Image-Text Colonoscopy Records Leveraging Large Language and Vision Models

  • 论文地址:https://arxiv.org//pdf/2310.11173

  • 开源代码:https://github.com/shuowang26/EndoKED

6.【数字人】CorrTalk: Correlation Between Hierarchical Speech and Facial Activity Variances for 3D Animation

  • 论文地址:https://arxiv.org//pdf/2310.11295

  • 工程主页:CorrTalk

  • 开源代码(即将开源):https://github.com/zjchu/CorrTalk

7.【单目3D目标检测】MonoSKD: General Distillation Framework for Monocular 3D Object Detection via Spearman Correlation Coefficient

  • 论文地址:https://arxiv.org//pdf/2310.11316

  • 开源代码:https://github.com/Senwang98/MonoSKD

8.【自动驾驶:Occupancy Prediction】LiDAR-based 4D Occupancy Completion and Forecasting

  • 论文地址:https://arxiv.org//pdf/2310.11239

  • 开源代码(即将开源):https://github.com/ai4ce/Occ4cast

9.【视频生成】LAMP: Learn A Motion Pattern for Few-Shot-Based Video Generation

  • 论文地址:https://arxiv.org//pdf/2310.10769

  • 工程主页:LAMP: Learn A Motion Pattern for Few-Shot-Based Video Generation

  • 开源代码:https://github.com/RQ-Wu/LAMP

论文已打包,点击进入—>下载界面

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.10.17

CV计算机视觉每日开源代码Paper with code速览-2023.10.16

CV计算机视觉每日开源代码Paper with code速览-2023.10.13

使用目标之间的先验关系提升目标检测器性能

港科大提出适用于夜间场景语义分割的无监督域自适应新方法

HSN:微调预训练ViT用于目标检测和语义分割,华南理工和阿里巴巴联合提出

EViT:借鉴鹰眼视觉结构,南开大学等提出ViT新骨干架构,在多个任务上涨点

如何优雅地读取网络的中间特征?


http://www.niftyadmin.cn/n/5102781.html

相关文章

什么是CRM系统营销归因?

在市场营销预算缩减的环境下,每个渠道都需要展示可量化的结果。CRM客户管理系统中的营销归因功能,让市场部的每一个决策都充满智慧。下面我们详细说说什么是CRM系统营销归因? 技术的进步,也让商业模式发生了巨变。曾经需要挨家挨…

代碼隨想錄算法訓練營|第三十九天|738.单调递增的数字、968.监控二叉树、第八章 贪心算法總結。刷题心得(c++)

目录 讀題 738.单调递增的数字 自己看到题目的第一想法 看完代码随想录之后的想法 968.监控二叉树 自己看到题目的第一想法 看完代码随想录之后的想法 738.单调递增的数字 - 實作 思路 Code 968.监控二叉树 - 實作 思路 Code 贪心算法 總結 贪心理论基础 貪心…

比例夹管阀及其高精度压力和流量控制解决方案

摘要:针对卫生和无菌流体系统中柔性管路内的压力和流量控制,本文介绍了采用电控夹管阀的高精度控制解决方案。解决方案基于反馈控制原理,采用压力传感器或流量传感器进行测量并反馈给程序控制器,控制器驱动夹管阀来改变柔性管路的…

ARM 堆栈寻址类型区分

文章目录 堆栈指向分类堆栈指向数据分类满递增与满递减空递增与空递减 堆栈指向分类 根据堆栈指针的指向的方向不同,可以划分为向上生成型和向下生成型。 向上生成型: 随着数据的入栈,堆栈的指针逐渐增大,称为:递增…

《数据结构、算法与应用C++语言描述》使用C++语言实现数组循环队列

《数据结构、算法与应用C语言描述》使用C语言实现数组循环队列 定义 队列的定义 队列(queue)是一个线性表,其插入和删除操作分别在表的不同端进行。插入元素的那一端称为队尾(back或rear),删除元素的那一…

网络通信——与WEB服务器交换数据(三十)

1. 与WEB服务器交换数据 1.1 知识点 (1)可以通过地址重写的方式进行Web Server的访问; (2)可以采用POST方式进行请求的提交; (3)可以读取网络上的图片信息; 1.2 具体…

【python】制作一个windows端自动化工具!

作为一名自动化工程师,这一章,带大家来看看我是如何制作一个windows端的自动化工具,本章节内容我会从基础的环境配置、基础模块介绍、框架设计、实际运用等方面来讲解,对于想要未来从事该行业的人来说,希望这篇文章能给…

分享一个简单容易上手的CSS框架:Pure.Css

雅虎(Yahoo!)创建了一个简单的CSS框架,被称为Pure.css(https://purecss.io/),以提供一套基础样式集,可作为网页开发的起点。Pure.css旨在轻量、模块化和响应式,使构建快速加载、适用…