M1�� - 程序员宅基地

使用跨模态交互进行领域自适应动作识别的方法

{yang-lj,hyf,sugano,ysato}@iis.u-tokyo.ac.jp147220在对齐之前进行交互：利用跨模态知识进行领域自适应动作识别0杨丽金，黄一飞*，菅野祐介，佐藤洋一，东京大学工业科学研究所0摘要0无监督领域自适应视频动作识别...

基于学习记忆的图像Transformer模型的微调

标签： 5个标签摘要引言规范化

1234568790 *Input MemoryInput MemoryMLPInput MemoryInput Memory121550使用可学习记忆的图像Transformer微调0Mark Sandler Andrey Zhmoginov Max Vladymyrov Andrew JacksonGoogle Inc....

多视点立体深度估计的统一表示方法

标签：重新思考多视点立体深度估计统一表示性能验证

8645重新思考多视点立体的深度估计：一种统一的表示彭瑞1王荣杰2王振宇1赖亚文1王荣刚1，2 1北京大学电子与计算机工程学院2程鹏实验室[email protected]@pkusz.edu.cnhttps://github....

神经纹理提取与分布操作：明确控制可控人物图像合成中的姿势和外貌

标签：神经纹理提取人物图像合成任务外貌控制

135350神经纹理提取和分布用于可控人物图像合成0任宇睿 1 范晓青 1 格力 1 刘珊 2 李天华 3 , 101 北京大学电子与计算机工程学院 2 腾讯美国 3 北京大学信息科学技术高等研究院[email protected] ...

带有重叠注意力的全局匹配光流估计

标签：全局匹配光流估计深度神经网络匹配优化方法重叠注意力性能提升

jhkijkih175920带有重叠注意力的全局匹配光流估计0Shiyu Zhao 1,* Long Zhao 2 Zhixing Zhang 1 Enyu Zhou 3 Dimitris Metaxas 101 罗格斯大学 2 谷歌研究 3 商汤研究0摘要0光流估计是计算机视觉...

文档去畸变与识别的傅里叶文档恢复网络

标签：鲁棒文档去畸变傅里叶文档恢复网络三维坐标损失

Abstract45730用于鲁棒文档去畸变和识别的傅里叶文档恢复0薛楚晖1，田子辰1，詹方能1，陆世健1，白松201南洋理工大学，2字节跳动[email protected]，{zichen.tian,shijian.lu,fnzhan}@ntu.edu.sg，songbai.site...

差异注意力的全景分割联合预测模型

标签：全景分割联合预测差异注意力预测模型深度估计改进安全有效的自主系统

26270差异注意力下的全景分割联合预测0Colin Graber 1 Cyril Jazra 1 Wenjie Luo 2 Liangyan Gui 1 Alexander Schwing 101 伊利诺伊大学香槟分校 2 Waymo0摘要0对于安全有效的自主性，预测表示是...

全局感知的低重叠度RGB-D扫描注册方法

标签：场景注册方法全局信息引导注册保持几何和光度对齐基准数据集实验

{sunche,jiayunde,guoyi,wuyuwei}@bit.edu.cn63570全局感知的重叠度较低的RGB-D扫描注册0北京理工大学计算机学院智能信息技术北京市实验室，中国北京市，100081，中国。...为此，我们构建了一个场景推理网络来构建代表...

动态场景下的单应性估计方法及其应用

标签：动态场景波特兰州立大学张舒谷歌

1动态场景波特兰州立大学{hoanl，fliu}@ cs.pdx.edu张舒谷歌[email protected]研究[email protected]摘要单应性估计是许多计算机视觉问题中的一个重要步骤。最近，与传统方法相比然而，这些新...

无监督视频表示学习的进化损失

标签：多模态分布匹配视频表示学习自监督任务

==......11330无监督视频表示学习的进化损失0AJ Piergiovanni，Anelia Angelova，Michael S.Ryoo Google研究{ajpiergi,anelia,mryoo}@google.com0摘要0我们提出了一种从大规模未标记的视频数据中学习视频表示的...

通过四阶段发展网络进行身高准确估计

标签：人体身高估计（8字）深度图像（4字）网络架构（4字）准确性提高（4字）单个深度图像（6字）

In the ﬁeld of three-dimensional reconstruction, medicaltreatment, clothes sizing, etc., human height data is indis-pensable. In most of the cases, we will require the testedperson to stand up ...

基于无约束多视角视频的四维动态事件可视化

标签：四维可视化多视角视频数据驱动方法动态事件时空探索

{aayushb,mpvo,yaser,deva,srinivas}@cs.cmu.eduhttp://www.cs.cmu.edu/˜aayushb/Open4D/(1)(2)(3)153660来自无约束多视角视频的动态事件的四维可视化0Aayush Bansal Minh Vo Yaser Sheikh Deva Ramanan ...

通过离散假设和测试搜索的光度立体表面法线估计

标签：光度立体表面法线估计离散假设测试搜索反射场景

……123110通过离散假设和测试搜索的光度立体0Kenji Enomoto 1 Michael Waechter 1 Kiriakos N. Kutulakos 2 Yasuyuki Matsushita 101 大阪大学 2 多伦多大学0摘要0本文考虑的问题是在已知的远程光照...

Support image & keypointsPredicted keypoints FSKD with Outputperception is inferior to biological perception [51]. Inspiredby the progress in few-shot learning [25,26,41,45,49,58],we propose Few-shot ...

基于相似度的轨迹预测提高对跟踪误差的鲁棒性

标签：轨迹预测相似度矩阵鲁棒性提高多智能体错误减少

…………65730到底是谁的轨迹？通过基于相似度的轨迹预测提高对跟踪误差的鲁棒性0翁新硕1,3，鲍里斯∙伊万诺维奇3，克里斯∙基塔尼1，马可∙帕沃内2，301卡内基梅隆大学机器人研究所，2斯坦福大学航空航天系，3...

视频推理加速：稀疏帧差异的DeltaCNN

标签：稀疏帧差异推断视频数据处理稀疏特征更新加速视频推理

12497DeltaCNN：视频中稀疏帧差异的端到端CNN推断Mathias Parger1 Chengcheng Tang2 Christopher D.Twigg2 Cem Keskin2Robert Wang2 Markus Steinberger11格拉茨理工大学，2Meta Reality Labs1{mathias.parger，...

快速收敛的基于查询的目标检测器：AdaMixer

标签：基于查询的目标检测器快速收敛 AdaMixer 图像特征

44.146.747.053640AdaMixer：一种快速收敛的基于查询的目标检测器0高子腾 1 王立民 1 韩兵 2 郭胜 201. 新型软件技术国家重点实验室，南京大学，中国 2. 蚂蚁集团，MYbank，中国0摘要0传统的目标检测器...

单目视频重建高保真度数字化人物形象

标签：自旋转视频时空一致的几何形状隐式和显式表示高保真度的重建单目视频的重建

56050SelfRecon：从单目视频中重建您的数字化人物形象0Boyi Jiang 1,2 Yang Hong 1 Hujun Bao 3 Juyong Zhang 1*01中国科学技术大学2图像导数公司3浙江大学0摘要0我们提出了SelfRecon，一种结合隐式和...

基于学习神经组成表示的人体4D建模方法(H4D)

标签：个文件的5个标签 4D人体建模深度学习动态人体表示 SMPL参数模型

19355H4D：通过学习神经组成表示进行人体4D建模蒋伯彦1张银达2魏兴奎1薛向阳1付延伟11复旦大学2谷歌摘要尽管基于深度学习的3D重建取得了令人印象深刻的结果，但直接学习以详细几何形状建模4D人体捕捉的技术本文提出...

PointGroup：一种用于3D实例分割的自底向上的架构

标签： 3D实例分割端到端架构分组点实例质心性能优化

4867PointGroup：用于3D实例分割的李江1赵恒双1史绍帅1刘舒2傅志荣1贾雅嘉1，21香港中文大学2SmartMore@ [email protected]@ee.cuhk.edu.hk摘要实例分割是场景理解的一项重要任务相对于成熟的...

量子计算中的点集对应问题及其应用

arg minq∈Bn qTPq,(1)(2)In their seminal paper, Farhi et al. [26] have shownthat the adiabatic principle (2) can be used for solvingNP-complete optimisation problems and laid the founda-tion for ...

MPM：细胞跟踪中基于运动和位置图的联合表示方法

标签：细胞跟踪方法运动和位置图细胞分裂多目标跟踪卷积神经网络

3823MPM：用于细胞跟踪的运动和位置图的联合表示Junya Hayashida Kazuya Nishimura Ryoma Bise九州大学，福冈，日本，{[email protected]}摘要传统的细胞跟踪方法在每个帧中检测多个细胞（检测），然后在连续...

神经轨迹先验的运行时优化方法及其在非刚性运动恢复和场景流融合中的应用

标签：经先验迹估计经网络空信息数据先验

…165320轨迹估计的神经先验0Chaoyang Wang 1 Xueqian Li 2 , 3 Jhony Kaesemodel Pontes 3 Simon Lucey 1201 卡内基梅隆大学 2 阿德莱德大学 3 Argo [email protected] { xueqian.li, ...

生成先验引导的无监督图像到图像翻译的通用框架

标签：基于生成先验图像翻译框架无监督翻译复杂域映射高质量多样化

18332基于生成先验的无监督图像到图像转换帅杨黎明姜紫薇刘晨换来南洋理工大学S-Lab{shuai.yang，liming002，ziwei.liu，ccloy} @ ntu.edu.sg近域远域极远域男性→女性猫→人脸狗→鸟鸟→汽车女性→男性人脸→猫鸟→...

频域人群计数方法的简单、有效和高效性能

标签：频域舒伟波1 大学计算机科学系摘要密度图

19618频域舒伟波1，万佳1，陈凯2，邝森1，安东尼B。...坚实的理论分析最终成为一个易于实现的损失函数，它在训练过程中只需要标准的张量运算。我们证明了我们的损失函数是地面实况和预测密度图（在它们的所有子区域上...

基于ViT的持续学习的元注意力

{mqxue,haofeizhang,sjie,brooksong}@zju.edu.cn1500基于ViT的持续学习的元注意力0薛梦琪 1 ，张浩飞 1 ，宋杰 1 ，† ，宋明丽 1 ，201 浙江大学 2 阿里巴巴-浙江大学前沿技术联合研究所，浙江大学0...

iPLAN：交互式布局规划

标签： iPLAN 交互式布局规划深度学习自动生成布局人机交互生成模型

77930iPLAN：交互式和过程化布局规划0Feixiang He Universityof Leeds, [email protected] HuangUniversity of Leeds, [email protected] Wang * Universityof Leeds, UK0h.e.wang...

记忆定位：基于元学习的语义分割泛化方法

标签：记忆定位学习语义分割的泛化深度神经网络语义分割的泛化能力

Read(Source Domain)Update(Target Domain)Categorical MemoryInputEncoderDecoderSegmentation Net.Virtual ⋯pected and unseen data, especially for replacing human taskssuch as medical diagnosing or ...

"基于视觉变换器的无检测图像字幕生成模型ViTCAP及其语义概念注入

标签：语义概念注入无检测器图像字幕生成纯视觉变换器概念令牌网络性能改进

( ResBlocks or ViT )REG.FEAT.OD TAGSGRID FEAT.Concept Tokens( ViT/b )Feature MapsREG. OPE.Grid FEAT.Figure 1. Comparisons of different image captioning models.Top: A general image captioning pipeline....

基于神经压缩的特征学习用于视频恢复

标签：经压缩的特征学习征恢复复方法缩模块特征保留

Noise frame Noise frame features temporal features ෤(c) t-SNE visualization of , ෤, and ෤features 58720基于神经压缩的特征学习用于视频恢复0Cong Huang 1 * Jiahao Li 2 Bin Li 2 Dong Liu 1...

”M1��“ 的搜索结果