{yang-lj,hyf,sugano,ysato}@iis.u-tokyo.ac.jp147220在对齐之前进行交互:利用跨模态知识进行领域自适应动作识别0杨丽金,黄一飞*,菅野祐介,佐藤洋一,东京大学工业科学研究所0摘要0无监督领域自适应视频动作识别...
{yang-lj,hyf,sugano,ysato}@iis.u-tokyo.ac.jp147220在对齐之前进行交互:利用跨模态知识进行领域自适应动作识别0杨丽金,黄一飞*,菅野祐介,佐藤洋一,东京大学工业科学研究所0摘要0无监督领域自适应视频动作识别...
1234568790 *Input MemoryInput MemoryMLPInput MemoryInput Memory121550使用可学习记忆的图像Transformer微调0Mark Sandler Andrey Zhmoginov Max Vladymyrov Andrew JacksonGoogle Inc....
8645重新思考多视点立体的深度估计:一种统一的表示彭瑞1王荣杰2王振宇1赖亚文1王荣刚1,2 1北京大学电子与计算机工程学院2程鹏实验室[email protected]@pkusz.edu.cnhttps://github....
135350神经纹理提取和分布用于可控人物图像合成0任宇睿 1 范晓青 1 格力 1 刘珊 2 李天华 3 , 101 北京大学电子与计算机工程学院 2 腾讯美国 3 北京大学信息科学技术高等研究院[email protected] ...
jhkijkih175920带有重叠注意力的全局匹配光流估计0Shiyu Zhao 1,* Long Zhao 2 Zhixing Zhang 1 Enyu Zhou 3 Dimitris Metaxas 101 罗格斯大学 2 谷歌研究 3 商汤研究0摘要0光流估计是计算机视觉...
Abstract45730用于鲁棒文档去畸变和识别的傅里叶文档恢复0薛楚晖1,田子辰1,詹方能1,陆世健1,白松201南洋理工大学,2字节跳动[email protected],{zichen.tian,shijian.lu,fnzhan}@ntu.edu.sg,songbai.site...
26270差异注意力下的全景分割联合预测0Colin Graber 1 Cyril Jazra 1 Wenjie Luo 2 Liangyan Gui 1 Alexander Schwing 101 伊利诺伊大学香槟分校 2 Waymo0摘要0对于安全有效的自主性,预测表示是...
{sunche,jiayunde,guoyi,wuyuwei}@bit.edu.cn63570全局感知的重叠度较低的RGB-D扫描注册0北京理工大学计算机学院智能信息技术北京市实验室,中国北京市,100081,中国。...为此,我们构建了一个场景推理网络来构建代表...
1动态场景波特兰州立大学{hoanl,fliu}@ cs.pdx.edu张舒谷歌[email protected]研究[email protected]摘要单应性估计是许多计算机视觉问题中的一个重要步骤。最近,与传统方法相比然而,这些新...
==......11330无监督视频表示学习的进化损失0AJ Piergiovanni,Anelia Angelova,Michael S.Ryoo Google研究{ajpiergi,anelia,mryoo}@google.com0摘要0我们提出了一种从大规模未标记的视频数据中学习视频表示的...
In the field of three-dimensional reconstruction, medicaltreatment, clothes sizing, etc., human height data is indis-pensable. In most of the cases, we will require the testedperson to stand up ...
{aayushb,mpvo,yaser,deva,srinivas}@cs.cmu.eduhttp://www.cs.cmu.edu/˜aayushb/Open4D/(1)(2)(3)153660来自无约束多视角视频的动态事件的四维可视化0Aayush Bansal Minh Vo Yaser Sheikh Deva Ramanan ...
……123110通过离散假设和测试搜索的光度立体0Kenji Enomoto 1 Michael Waechter 1 Kiriakos N. Kutulakos 2 Yasuyuki Matsushita 101 大阪大学 2 多伦多大学0摘要0本文考虑的问题是在已知的远程光照...
Support image & keypointsPredicted keypoints FSKD with Outputperception is inferior to biological perception [51]. Inspiredby the progress in few-shot learning [25,26,41,45,49,58],we propose Few-shot ...
…………65730到底是谁的轨迹?通过基于相似度的轨迹预测提高对跟踪误差的鲁棒性0翁新硕1,3,鲍里斯∙伊万诺维奇3,克里斯∙基塔尼1,马可∙帕沃内2,301卡内基梅隆大学机器人研究所,2斯坦福大学航空航天系,3...
12497DeltaCNN:视频中稀疏帧差异的端到端CNN推断Mathias Parger1 Chengcheng Tang2 Christopher D.Twigg2 Cem Keskin2Robert Wang2 Markus Steinberger11格拉茨理工大学,2Meta Reality Labs1{mathias.parger,...
44.146.747.053640AdaMixer:一种快速收敛的基于查询的目标检测器0高子腾 1 王立民 1 韩兵 2 郭胜 201. 新型软件技术国家重点实验室,南京大学,中国 2. 蚂蚁集团,MYbank,中国0摘要0传统的目标检测器...
56050SelfRecon:从单目视频中重建您的数字化人物形象0Boyi Jiang 1,2 Yang Hong 1 Hujun Bao 3 Juyong Zhang 1*01中国科学技术大学2图像导数公司3浙江大学0摘要0我们提出了SelfRecon,一种结合隐式和...
19355H4D:通过学习神经组成表示进行人体4D建模蒋伯彦1张银达2魏兴奎1薛向阳1付延伟11复旦大学2谷歌摘要尽管基于深度学习的3D重建取得了令人印象深刻的结果,但直接学习以详细几何形状建模4D人体捕捉的技术本文提出...
4867PointGroup:用于3D实例分割的李江1赵恒双1史绍帅1刘舒2傅志荣1贾雅嘉1,21香港中文大学2SmartMore@ [email protected]@ee.cuhk.edu.hk摘要实例分割是场景理解的一项重要任务相对于成熟的...
arg minq∈Bn qTPq,(1)(2)In their seminal paper, Farhi et al. [26] have shownthat the adiabatic principle (2) can be used for solvingNP-complete optimisation problems and laid the founda-tion for ...
3823MPM:用于细胞跟踪的运动和位置图的联合表示Junya Hayashida Kazuya Nishimura Ryoma Bise九州大学,福冈,日本,{[email protected]}摘要传统的细胞跟踪方法在每个帧中检测多个细胞(检测),然后在连续...
…165320轨迹估计的神经先验0Chaoyang Wang 1 Xueqian Li 2 , 3 Jhony Kaesemodel Pontes 3 Simon Lucey 1201 卡内基梅隆大学 2 阿德莱德大学 3 Argo [email protected] { xueqian.li, ...
18332基于生成先验的无监督图像到图像转换帅杨黎明姜紫薇刘晨换来南洋理工大学S-Lab{shuai.yang,liming002,ziwei.liu,ccloy} @ ntu.edu.sg近域远域极远域男性→女性猫→人脸狗→鸟鸟→汽车女性→男性人脸→猫鸟→...
19618频域舒伟波1,万佳1,陈凯2,邝森1,安东尼B。...坚实的理论分析最终成为一个易于实现的损失函数,它在训练过程中只需要标准的张量运算。 我们证明了我们的损失函数是地面实况和预测密度图(在它们的所有子区域上...
{mqxue,haofeizhang,sjie,brooksong}@zju.edu.cn1500基于ViT的持续学习的元注意力0薛梦琪 1 ,张浩飞 1 ,宋杰 1 ,† ,宋明丽 1 ,201 浙江大学 2 阿里巴巴-浙江大学前沿技术联合研究所,浙江大学0...
77930iPLAN:交互式和过程化布局规划0Feixiang He Universityof Leeds, [email protected] HuangUniversity of Leeds, [email protected] Wang * Universityof Leeds, UK0h.e.wang...
Read(Source Domain)Update(Target Domain)Categorical MemoryInputEncoderDecoderSegmentation Net.Virtual ⋯pected and unseen data, especially for replacing human taskssuch as medical diagnosing or ...
( ResBlocks or ViT )REG.FEAT.OD TAGSGRID FEAT.Concept Tokens( ViT/b )Feature MapsREG. OPE.Grid FEAT.Figure 1. Comparisons of different image captioning models.Top: A general image captioning pipeline....
Noise frame Noise frame features temporal features (c) t-SNE visualization of , , and features 58720基于神经压缩的特征学习用于视频恢复0Cong Huang 1 * Jiahao Li 2 Bin Li 2 Dong Liu 1...