CV计算机视觉每日开源代码Paper with code速览-2023.11.21

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【基础网络架构:Transformer】Multi-entity Video Transformers for Fine-Grained Video Representation Learning

  • 论文地址:https://arxiv.org//pdf/2311.10873

  • 开源代码:GitHub - facebookresearch/video_rep_learning: SSL Video Representation Learning project

2.【异常检测】NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation

  • 论文地址:https://arxiv.org//pdf/2311.11961

  • 开源代码(即将开源):GitHub - donghao51/NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation

3.【语义分割】Generalized Category Discovery in Semantic Segmentation

  • 论文地址:https://arxiv.org//pdf/2311.11525

  • 开源代码(即将开源):GitHub - JethroPeng/GCDSS: The official code implementation of Generalized Category Discovery in Semantic Segmentation

4.【3D目标检测】Sparse4D v3: Advancing End-to-End 3D Detection and Tracking

  • 论文地址:https://arxiv.org//pdf/2311.11722

  • 开源代码:GitHub - linxuewu/Sparse4D: Sparse4D v1 & v2

5.【点云】Point Cloud Self-supervised Learning via 3D to Multi-view Masked Autoencoder

  • 论文地址:https://arxiv.org//pdf/2311.10887

  • 开源代码(即将开源):GitHub - Zhimin-C/Multiview-MAE

6.【点云3D目标检测】Domain Generalization of 3D Object Detection by Density-Resampling

  • 论文地址:https://arxiv.org//pdf/2311.10845

  • 代码即将开源

7.【医学图像分割】SA-Med2D-20M Dataset: Segment Anything in 2D Medical Imaging with 20 Million masks

  • 论文地址:https://arxiv.org//pdf/2311.11969

  • 开源代码:GitHub - OpenGVLab/SAM-Med2D: Official implementation of SAM-Med2D

8.【多模态】VLM-Eval: A General Evaluation on Video Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.11865

  • 代码即将开源

9.【多模态】LION : Empowering Multimodal Large Language Model with Dual-Level Visual Knowledge

  • 论文地址:https://arxiv.org//pdf/2311.11860

  • 开源代码(即将开源):GitHub - rshaojimmy/JiuTian: JiuTian, a Multimodal Large Language Model from HITSZ

10.【多模态】CORE-MM: Complex Open-Ended Reasoning Evaluation For Multi-Modal Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.11567

  • 工程主页:CORE-MM: Complex Open-ended Reasoning Evaluation for Multi-modal LargeLanguage Models

  • 开源代码(即将开源):GitHub - core-mm/core-mm

11.【多模态】GPT-4V(ision) for Robotics: Multimodal Task Planning from Human Demonstration

  • 论文地址:https://arxiv.org//pdf/2311.12015

  • 工程主页:https://microsoft.github.io/GPT4Vision-Robot-Manipulation-Prompts/

  • 代码即将开源

12.【数字人】Semantic-Preserved Point-based Human Avatar

  • 论文地址:https://arxiv.org//pdf/2311.11614

  • 开源代码(即将开源):GitHub - l1346792580123/spa

13.【自动驾驶】A Language Agent for Autonomous Driving

  • 论文地址:https://arxiv.org//pdf/2311.10813

  • 开源代码:GitHub - USC-GVL/Agent-Driver: A Language Agent for Autonomous Driving

14.【Diffusion】Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model

  • 论文地址:https://arxiv.org//pdf/2311.11638

  • 开源代码(即将开源):GitHub - ChunmingHe/Reti-Diff

15.【人体姿态估计】Multiple View Geometry Transformers for 3D Human Pose Estimation

  • 论文地址:https://arxiv.org//pdf/2311.10983

  • 开源代码(即将开源):GitHub - XunshanMan/MVGFormer

16.【人群计数】Evaluating Supervision Levels Trade-Offs for Infrared-Based People Counting

  • 论文地址:https://arxiv.org//pdf/2311.11974

  • 开源代码(即将开源):tortueTortue/IRPeopleCounting · GitHub

17.【图像修复】Deep Equilibrium Diffusion Restoration with Parallel Sampling

  • 论文地址:https://arxiv.org//pdf/2311.11600

  • 开源代码(即将开源):GitHub - caojiezhang/DeqIR: PyTorch implementation of "Deep Equilibrium Diffusion Restoration with Parallel Sampling"

18.【NeRF】Entangled View-Epipolar Information Aggregation for Generalizable Neural Radiance Fields

  • 论文地址:https://arxiv.org//pdf/2311.11845

  • 开源代码(即将开源):GitHub - tatakai1/EVENeRF

19.【三维重建】LiDAR-HMR: 3D Human Mesh Recovery from LiDAR

  • 论文地址:https://arxiv.org//pdf/2311.11971

  • 开源代码(即将开源):GitHub - soullessrobot/LiDAR-HMR: Code and data for LiDAR-HMR: 3D Human Mesh Recovery from LiDAR

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

CV计算机视觉每日开源代码Paper with code速览-2023.11.17

CV计算机视觉每日开源代码Paper with code速览-2023.11.16


http://www.niftyadmin.cn/n/5216704.html

相关文章

力扣labuladong——一刷day54

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、力扣1660. 纠正二叉树二、力扣100. 相同的树三、力扣572. 另一棵树的子树四、力扣101. 对称二叉树 前言 判断树是否相等,就直接遍历就可以。判断…

Goby 漏洞发布|Splunk Enterprise XSLT 命令执行漏洞(CVE-2023-46214)

漏洞名称:Splunk Enterprise XSLT 命令执行漏洞(CVE-2023-46214) English Name:Splunk Enterprise XSLT Command Execute Vulnerability (CVE-2023-46214) CVSS core: 8.0 影响资产数:134567 漏洞描述:…

【Bootloader学习理解学习--加强版】

笔者在接着聊一下bootloader,主要针对MCU的Bootloader。 笔者之前介绍过一篇Bootloader文章,主要是其概念、一些升级包的格式和升级流程,本次接着来说一下。 1、MCU代码运行方式 之前文章也介绍过,MCU的代码运行方式有两种&…

wandb使用教程_笔记

from kaggle_secrets import UserSecretsClient #kaggle 可忽略 import wandb#####user_secrets UserSecretsClient() #### kaggle secret_value_0 user_secrets.get_secret("wandb_key") ### kaggle,此次为wandb_api wandb.login(keysecret_value_0) #…

机器学习【04重要】pycharm中关闭jupyter服务器

直接关掉pycharm 不行 点红方块关闭 不行 我们曲线进行 我们的方法成功截图 实现全程不在服务器上操作 首先点击下图 点击退出,即可 查看端口

nginx的一些命令

linux start nginx 开启 /usr/sbin/nginx(直接启动) nginx -s stop 停止 /usr/local/nginx/sbin/nginx -s stop nginx -s quit 安全停止,保存信息 nginx -s reload 当配置信息修改,需要重新载入这些配置时使用此命令 nginx -s re…

虹科分享 | AR世界揭秘:从二维码的起源到数据识别与位姿技术的奇妙融合!

引言:探索AR的神奇世界,我们将从二维码的诞生谈起。在这个科技的海洋中,二维码是如何帮助AR实现数据获取与位姿识别的呢?让我们一起揭开这层神秘的面纱! 一、二维码的由来 二维码是将数据存储在图形中的技术&#xff…

Thymeleaf文档链接(中文文档、官方英文文档)

中文文档:https://fanlychie.github.io/post/thymeleaf.html 官方英文文档:Documentation - Thymeleaf