CV计算机视觉每日开源代码Paper with code速览-2023.10.16

 精华置顶

墙裂推荐!小白如何1个月系统学习CV核心知识:链接

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【目标检测】Rank-DETR for High Quality Object Detection

  • 论文地址:https://arxiv.org//pdf/2310.08854

  • 开源代码(即将开源):https://github.com/LeapLabTHU/Rank-DETR

2.【语义分割】SSG2: A new modelling paradigm for semantic segmentation

  • 论文地址:https://arxiv.org//pdf/2310.08671

  • 开源代码(即将开源):GitHub - feevos/ssg2: Official code repository for the publication "SSG2: A New Modelling Paradigm for Semantic Segmentation"

 3.【域自适应】SIDE: Self-supervised Intermediate Domain Exploration for Source-free Domain Adaptation

  • 论文地址:https://arxiv.org//pdf/2310.08928

  • 开源代码:GitHub - se111/SIDE

4.【多模态】Hypernymy Understanding Evaluation of Text-to-Image Models via WordNet Hierarchy

  • 论文地址:https://arxiv.org//pdf/2310.09247

  • 开源代码:GitHub - yandex-research/text-to-img-hypernymy: Official code for "Hypernymy Understanding Evaluation of Text-to-Image Models via WordNet Hierarchy"

5.【多模态】Extending Multi-modal Contrastive Representations

  • 论文地址:https://arxiv.org//pdf/2310.08884

  • 开源代码:GitHub - MCR-PEFT/Ex-MCR

6.【多模态】From CLIP to DINO: Visual Encoders Shout in Multi-modal Large Language Models

  • 论文地址:https://arxiv.org//pdf/2310.08825

  • 开源代码(即将开源):GitHub - YuchenLiu98/COMM: Pytorch code for paper From CLIP to DINO: Visual Encoders Shout in Multi-modal Large Language Models

7.【多模态】Making Multimodal Generation Easier: When Diffusion Models Meet LLMs

  • 论文地址:https://arxiv.org//pdf/2310.08949

  • 开源代码:GitHub - zxy556677/EasyGen: The official code for paper "Making Multimodal Generation Easier: When Diffusion Models Meet LLMs"

8.【GAN】Feature Proliferation -- the "Cancer" in StyleGAN and its Treatments

  • 论文地址:https://arxiv.org//pdf/2310.08921

  • 开源代码:GitHub - songc42/Feature-proliferation

9.【深度补全】LRRU: Long-short Range Recurrent Updating Networks for Depth Completion

  • 论文地址:https://arxiv.org//pdf/2310.08956

  • 工程主页:LRRU: Long-short Range Recurrent Updating Networks for Depth Completion

  • 开源代码(即将开源):GitHub - YufeiWang777/LRRU: Official implementation of ``LRRU: Long-short Range Recurrent Updating Networks for Depth Completion'', ICCV 2023.

论文已打包,点击进入—>下载界面

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

港科大提出适用于夜间场景语义分割的无监督域自适应新方法

HSN:微调预训练ViT用于目标检测语义分割,华南理工和阿里巴巴联合提出

EViT:借鉴鹰眼视觉结构,南开大学等提出ViT新骨干架构,在多个任务上涨点

如何优雅地读取网络的中间特征?

CV计算机视觉每日开源代码Paper with code速览-2023.10.13

CV计算机视觉每日开源代码Paper with code速览-2023.10.12

CV计算机视觉每日开源代码Paper with code速览-2023.10.11

CV计算机视觉每日开源代码Paper with code速览-2023.10.10


http://www.niftyadmin.cn/n/5096787.html

相关文章

Python 中,常见的单例模式实现方式

使用模块: # mysingleton.pyclass MySingleton:def __init__(self):self.value Nonemy_singleton MySingleton()在其他地方导入这个模块时,my_singleton 对象将在应用中保持唯一。 使用装饰器: def singleton(cls):instances {}def get_in…

WordPress 常规设置页面调用媒体中心上传图片插入URL(新版可用)

首先,我们需要在主题或插件文件夹中创建一个 JavaScript 文件(如:media-uploader.js),该文件中包含如下代码。 /*** 媒体中心上传 js **/ jQuery(document).ready(function($){var mediaUploader;$(#upload_image_but…

全流量安全分析发现内部系统外联异常

内部系统外连监控的重要性在于保护企业的信息安全和预防数据泄露,以下是几个重要的理由: 1、检测异常活动:通过监控内部系统的外连连接,可以及时发现是否有未经授权或异常的链接尝试。这可能表示存在恶意软件、黑客攻击或内部员工…

oracle实验四

创建文件 (1)为 ORCL 数据库创建一个名为 BOOKTBS1 的永久性表空间,数据文件为’d:\bt01.dbf’ ,大小为100M,区采用自动扩展方式(即自动分配), 段采用自动管理方式; &am…

Kylin麒麟操作系统(基于Linux)下的环境变量配置,重启生效

对于Kylin麒麟操作系统(基于Linux)下的环境变量配置,重启生效, 可以按照下面的步骤进行设置: 步骤 1:编辑/etc/profile文件 打开终端,以超级用户权限运行以下命令,使用vim编辑/etc/…

云帆在线学习考试系统介绍

随着网络技术的不断发展,越来越多的人开始意识到在线学习和考试的重要性。在这个数字化时代,借助互联网平台,人们可以轻松地获取各种知识和技能,提升自己的竞争力。而云帆在线学习考试系统正是在这样的背景下应运而生的。云帆在线…

Java时间处理---Java8中时区相关类库介绍

前言 在Java8以前,我们对于时区的处理通常是为时间转换类设置指定TimeZone,然后进行时区时间转换。 而在Java8中不仅对时间日期进行了细粒度处理,有无时区,时区处理也进行了更加细粒度的优化。 在之前我们介绍的新类库中基本都…

数字孪生技术在智慧城市应用的推进建议

(一)坚持需求牵引,强场景重实效 必须始终坚持以人为本、场景导向、需求牵引,站在供给侧结构性改革的角度,突出以用促建,强调建用并重,真正发挥数字孪生城市应用建设的实效。从构建数字孪生创新…