浅谈CVPR2022的几个研究热点-程序员宅基地

技术标签: 论文阅读  深度学习  人工智能  杂项  大数据  

CVPR2022刚刚结束,作为影响力最广的视觉盛会,今年又有一批优秀的工作被展示出来。相信关注视觉最新研究进展的各位小伙伴,已经磨拳擦掌,准备向CVPR2023投稿了。基于今年的工作,到底哪些领域是CVPR关注的热点?哪些领域的工作,接受度更高,oral的比例更大呢?基于CVPR官方最新的统计信息,我将跟大家聊聊CVPR的一些研究热点,希望对那些计划投下一轮CVPR的同学提供一点参考信息。


1. 十大热点研究领域

首先,我们基于oral论文的统计信息,按照接收论文比重以及所述领域进行排序,得到的十个热点领域,包括:多角度三维视觉,图像与视频合成,识别检测分类与检索,深度网络结构设计,视觉与语言处理交叉,低质量数据视觉分析,形状分析,迁移学习,视频分析与理解,姿态估计。

1036bbf0426d4826a52aca4395e002d6.png

图1. 十大研究热点领域(Oral)

当我们统计全部接收论文时,统计数据在顺序上会有一点变化,包括:识别检测分类与检索,图像与视频合成,多角度三维视觉,低质量数据视觉分析,视觉与语言处理交叉,形状分析,迁移学习,深度网络结构设计,自监督与非监督学习,视频分析与理解。

ce8491382f574f8e81fa8c34917c1369.png

图2. 十大研究热点领域(All)

可以看到,两个排序对应的研究热点问题,具有极高的重复性。结合两个表,偏重于应用层面的角度对热点进行总结,我从中选出五个热点研究方向,供计划投稿的同学参考:

  • 多角度三维视觉
  • 图像与视频合成
  • 识别检测分类与检索
  • 视觉与语言处理交叉
  • 低质量数据视觉分析

2. Best Paper

CVPR2022的Best paper list包含四篇文章,分别为:

Best Paper Award: Learning to Solve Hard Minimal Problems

Best Paper Honorable Mention: Dual-Shutter Optical Vibration Sensing

Best Student Paper Award: EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation

Best Student Paper Honorable Mention: Ref-NeRF: Structured View-Dependent Appearance for Neural Radiance Fields

最佳论文为《Learning to Solve Hard Minimal Problems》。粗看了下,不是很懂,大概是在对优化问题领域做了一些偏理论性的工作,引入了几何优化的一些工具。《Dual-Shutter Optical Vibration Sensing》是关于三维激光扫描的技术。《EPro-PnP: Generalized End-to-End Probabilistic Perspective...》基于多点透视理论,提出一种从图像中估计物体的三维姿态的方法。《Ref-NeRF》基本就是NeRF算法的变种研究。从最佳论文的侧重可以知道,CVPR比较青睐三维视觉相关研究。另外,会前呼声较高的Kaiming老师的《Masked Autoencoders Are Scalable Vision Learners》也是值得深入学习的。基于MAE提出一种基于patch预测的编解码结构,对于数据图像内容理解具有极好的预测与重建性能。该论文被列为最佳论文候选。


3. 个人关注

因为我个人最近一直在做颜色迁移,光照优化一类的工作,所以比较关注low-level vision领域。今年CVPR在该领域录取了19篇oral以及91篇poster,接收文章数不能算少。我将对应的19篇oral文章抄写在这里,方便之后学习。

[1] Robust Equivariant Imaging: A Fully Unsupervised Framework for Learning To Image From Noisy and Partial Measurements. (去噪+超分辨率用于图像增强技术)

[2] Bijective Mapping Network for Shadow Removal. (消除影子)

[3] Event-Aided Direct Sparse Odometry. (稀疏点云加强)

[4] MAXIM: Multi-Axis MLP for Image Processing.(通用图像质量增强算法)

[5] Details or Artifacts: A Locally Discriminative Learning Approach to Realistic Image Super-Resolution.(超分辨率)

[6] Dual Adversarial Adaptation for Cross-Device Real-World Image Super-Resolution. (超分辨率)

[7] ELIC: Efficient Learned Image Compression With Unevenly Grouped Space-Channel Contextual Adaptive Coding. 

[8] Discrete Cosine Transform Network for Guided Depth Map Super-Resolution. (超分辨率)

[9] Deep Rectangling for Image Stitching: A Learning Baseline.(图像拼接)

[10] CamLiFlow: Bidirectional Camera-LiDAR Fusion for Joint Optical Flow and Scene Flow Estimation. (光流优化)

[11] Toward Fast, Flexible, and Robust Low-Light Image Enhancement. (低光增强)

[12] Faithful Extreme Rescaling via Generative Prior Reciprocated Invertible Represe-ntations.

[13] Learning Trajectory-Aware Transformer for Video Super-Resolution. (超分辨率)

[14] SphereSR: 360deg Image Super-Resolution With Arbitrary Projection via Continuous Spherical Image Representation.(超分辨率)

[15] Parametric Scattering Networks. (优化的学习结构)

[16] Target-Aware Dual Adversarial Learning and a Multi-Scenario Multi-Modality Benchmark To Fuse Infrared and Visible for Object Detection. (低光环境下的对象探测)

[17] Learning to Deblur Using Light Field Generated and Real Defocus Images. (去模糊)

[18] Burst Image Restoration and Enhancement. (图像重建)

[19 ]Restormer: Efficient Transformer for High-Resolution Image Restoration. (去模糊)

在low-level vision领域,超分辨率仍然占有较大的比重。一些工作包括去模糊,质量增强,细节重建等,本质上还是和超分辨率技术有紧密的联系。看来,未来做low-level vision,大概率要利用到超分辨率算法。从部分论文可以看出,三维视觉已经结合到low-level vision领域。针对深度图,全景照片等具有三维属性的数据,进行细节重建,运动补偿等计算,也是很不错的研究方向。

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/aliexken/article/details/125457742

智能推荐

18个顶级人工智能平台-程序员宅基地

文章浏览阅读1w次,点赞2次,收藏27次。来源:机器人小妹  很多时候企业拥有重复,乏味且困难的工作流程,这些流程往往会减慢生产速度并增加运营成本。为了降低生产成本,企业别无选择,只能自动化某些功能以降低生产成本。  通过数字化..._人工智能平台

electron热加载_electron-reloader-程序员宅基地

文章浏览阅读2.2k次。热加载能够在每次保存修改的代码后自动刷新 electron 应用界面,而不必每次去手动操作重新运行,这极大的提升了开发效率。安装 electron 热加载插件热加载虽然很方便,但是不是每个 electron 项目必须的,所以想要舒服的开发 electron 就只能给 electron 项目单独的安装热加载插件[electron-reloader]:// 在项目的根目录下安装 electron-reloader,国内建议使用 cnpm 代替 npmnpm install electron-relo._electron-reloader

android 11.0 去掉recovery模式UI页面的选项_android recovery 删除 部分菜单-程序员宅基地

文章浏览阅读942次。在11.0 进行定制化开发,会根据需要去掉recovery模式的一些选项 就是在device.cpp去掉一些选项就可以了。_android recovery 删除 部分菜单

mnn linux编译_mnn 编译linux-程序员宅基地

文章浏览阅读3.7k次。https://www.yuque.com/mnn/cn/cvrt_linux_mac基础依赖这些依赖是无关编译选项的基础编译依赖• cmake(3.10 以上)• protobuf (3.0 以上)• 指protobuf库以及protobuf编译器。版本号使用 protoc --version 打印出来。• 在某些Linux发行版上这两个包是分开发布的,需要手动安装• Ubuntu需要分别安装 libprotobuf-dev 以及 protobuf-compiler 两个包•..._mnn 编译linux

利用CSS3制作淡入淡出动画效果_css3入场效果淡入淡出-程序员宅基地

文章浏览阅读1.8k次。CSS3新增动画属性“@-webkit-keyframes”,从字面就可以看出其含义——关键帧,这与Flash中的含义一致。利用CSS3制作动画效果其原理与Flash一样,我们需要定义关键帧处的状态效果,由CSS3来驱动产生动画效果。下面讲解一下如何利用CSS3制作淡入淡出的动画效果。具体实例可参考刚进入本站时的淡入效果。1. 定义动画,名称为fadeIn@-webkit-keyf_css3入场效果淡入淡出

计算机软件又必须包括什么,计算机系统应包括硬件和软件两个子系统,硬件和软件又必须依次分别包括______?...-程序员宅基地

文章浏览阅读2.8k次。计算机系统应包括硬件和软件两个子系统,硬件和软件又必须依次分别包括中央处理器和系统软件。按人的要求接收和存储信息,自动进行数据处理和计算,并输出结果信息的机器系统。计算机是脑力的延伸和扩充,是近代科学的重大成就之一。计算机系统由硬件(子)系统和软件(子)系统组成。前者是借助电、磁、光、机械等原理构成的各种物理部件的有机组合,是系统赖以工作的实体。后者是各种程序和文件,用于指挥全系统按指定的要求进行..._计算机系统包括硬件系统和软件系统 软件又必须包括

随便推点

进程调度(一)——FIFO算法_进程调度fifo算法代码-程序员宅基地

文章浏览阅读7.9k次,点赞3次,收藏22次。一 定义这是最早出现的置换算法。该算法总是淘汰最先进入内存的页面,即选择在内存中驻留时间最久的页面予以淘汰。该算法实现简单,只需把一个进程已调入内存的页面,按先后次序链接成一个队列,并设置一个指针,称为替换指针,使它总是指向最老的页面。但该算法与进程实际运行的规律不相适应,因为在进程中,有些页面经常被访问,比如,含有全局变量、常用函数、例程等的页面,FIFO 算法并不能保证这些页面不被淘汰。这里,我_进程调度fifo算法代码

mysql rownum写法_mysql应用之类似oracle rownum写法-程序员宅基地

文章浏览阅读133次。rownum是oracle才有的写法,rownum在oracle中可以用于取第一条数据,或者批量写数据时限定批量写的数量等mysql取第一条数据写法SELECT * FROM t order by id LIMIT 1;oracle取第一条数据写法SELECT * FROM t where rownum =1 order by id;ok,上面是mysql和oracle取第一条数据的写法对比,不过..._mysql 替换@rownum的写法

eclipse安装教程_ecjelm-程序员宅基地

文章浏览阅读790次,点赞3次,收藏4次。官网下载下载链接:http://www.eclipse.org/downloads/点击Download下载完成后双击运行我选择第2个,看自己需要(我选择企业级应用,如果只是单纯学习java选第一个就行)进入下一步后选择jre和安装路径修改jvm/jre的时候也可以选择本地的(点后面的文件夹进去),但是我们没有11版本的,所以还是用他的吧选择接受安装中安装过程中如果有其他界面弹出就点accept就行..._ecjelm

Linux常用网络命令_ifconfig 删除vlan-程序员宅基地

文章浏览阅读245次。原文链接:https://linux.cn/article-7801-1.htmlifconfigping <IP地址>:发送ICMP echo消息到某个主机traceroute <IP地址>:用于跟踪IP包的路由路由:netstat -r: 打印路由表route add :添加静态路由路径routed:控制动态路由的BSD守护程序。运行RIP路由协议gat..._ifconfig 删除vlan

redux_redux redis-程序员宅基地

文章浏览阅读224次。reduxredux里要求把数据都放在公共的存储区域叫store里面,组件中尽量少放数据,假如绿色的组件要给很多灰色的组件传值,绿色的组件只需要改变store里面对应的数据就行了,接着灰色的组件会自动感知到store里的数据发生了改变,store只要有变化,灰色的组件就会自动从store里重新取数据,这样绿色组件的数据就很方便的传到其它灰色组件里了。redux就是把公用的数据放在公共的区域去存..._redux redis

linux 解压zip大文件(解决乱码问题)_linux 7za解压中文乱码-程序员宅基地

文章浏览阅读2.2k次,点赞3次,收藏6次。unzip版本不支持4G以上的压缩包所以要使用p7zip:Linux一个高压缩率软件wget http://sourceforge.net/projects/p7zip/files/p7zip/9.20.1/p7zip_9.20.1_src_all.tar.bz2tar jxvf p7zip_9.20.1_src_all.tar.bz2cd p7zip_9.20.1make && make install 如果安装失败,看一下报错是不是因为没有下载gcc 和 gcc ++(p7_linux 7za解压中文乱码