matlab dpm目标检测,车辆目标检测-程序员宅基地

技术标签: matlab dpm目标检测  

原标题:车辆目标检测

车辆是视频场景中最关键的对象之一,车辆 和 人 是视频检测永恒的话题。

车辆检测是车辆分析中关键的一步,是后续进行 的基础。

关于检测的方法和框架有很多,不外乎是特征训练和分类,这里推荐两篇综述性文章:

[1] Benenson R, Omran M, Hosang J, et al.Ten Years of Pedestrian Detection, What Have We Learned?[M]// Computer Vision - ECCV 2014 Workshops. Springer International Publishing, 2014:613-627.

http://rodrigob.github.io/documents/2014_eccvw_ten_years_of_pedestrian_detection_with_supplementary_material.pdf

[2] P.Dollar, C. Wojek,B. Schiele, et al.Pedestrian detection: an evaluation of the state of the art[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(4): 743-761.

http://vision.ucsd.edu/~pdollar/files/papers/DollarPAMI12peds.pdf

•开放检测算法框架及代码:

关于目标检测的框架及代码非常多,这里列出来几个:

名声在外的 DPM

Deformable Part Models,专业做行人检测,对于车辆检测等刚体目标 并无太多优势。

参考代码:https://people.eecs.berkeley.edu/~rbg/latent/index.html

INRIA Object Detection and Localization Toolkit

基于HOG特征的行人检测方法,由Dalal于 2005年

参考代码:http://pascal.inrialpes.fr/soft/olt/

doppia code

这是一个代码集合,2015年更新,内容包含:

a) Pedestrian detection at 100 frames per second, R. Benenson. CVPR, 2012.

b) 实时的 Stixels estimation without depth map computation.

c) Fast stixels estimation for fast pedestrian detection.

d) Seeking the strongest rigid detector.

e) Ten years of pedestrian detection, what have we learned?

f) Face detection without bells and whistles.

下载地址:https://bitbucket.org/rodrigob/doppia

Pitor Dollar Detector

有一个代码集合,大牛名字命名,全称为:Piotr’s Computer Vision Matlab Toolbox

下载地址:https://pdollar.github.io/toolbox/

•开放训练数据集 (行人检测):

MIT 行人数据集

MIT 早期公开数据集(2000年),共924张行人图片(ppm格式,宽高为64×128),只含正面和背面两个视角,无负样本,未区分训练集和测试集。

该数据集目前已很少使用,但由于公开较早,影响力比较大,因此作者把它列在第一个。

下载地址:http://cbcl.mit.edu/software-datasets/PedestrianData.html

Caltech Pedestrian 行人数据集

该数据库是目前规模较大的行人数据库(2014年),采用车载摄像头拍摄,约10个小时左右,视频的分辨率为640×480,30帧/秒。

标注了约250,000帧(约137分钟),350000个矩形框,2300个行人,提供了相应的Matlab工具包。

下载地址:

http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/

NICTA 行人数据集

目前规模较大的静态图像行人数据库,25551张含单人的图片,5207张高分辨率非行人图片(2008年)。

数据库中已分好训练集和测试集,方便不同分类器的比较。

下载地址:http://www.nicta.com.au/category/research/computer-vision/tools/automap-datasets/

INRIA Person

目前使用最多的静态行人检测数据集,由“HOG+SVM”的作者Dalal创建(2005年)。

训练集有正样本614张(包含2416个行人),负样本1218张;测试集有正样本288张(包含1126个行人),负样本453张。

下载地址:http://pascal.inrialpes.fr/data/human/

另外,还有TUD、ETHZ、USC、CVC等数据集,当然你可能也知道大名鼎鼎的 ImageNet(里面会有少部分行人),当然公版数据集也仅仅在于自己测试用,想要得到更好的检测效果,你必须训练自己的数据集。

•开放训练数据集 (车辆检测):

MIT - CBCL 车辆数据集

由 MIT 提供的车辆数据集(2000年),主要用于车辆检测和识别中,共有516张128*128格式为ppm的图像。

下载地址:http://cbcl.mit.edu/software-datasets/CarData.html

KITTI

这是一个测试交通场景中 车辆检测、追踪、语义分割等算法的公开数据集。由丰田汽车主导,目前在测试自动驾驶等识别算法中应用比较多。

实际上,KITTI 已经成为 ADAS行业的 实际效果检测标准。

下载地址:http://www.cvlibs.net/datasets/kitti/index.php

UA-DETRAC

车辆检测和跟踪的大规模数据集,可以作为 KITTI 的补充。

数据集主要拍摄于北京和天津的道路过街天桥(京津冀场景有福了),并 手动标注了 8250 个车辆 和 121万目标对象外框。

附带的 Toolkit 统一了数据接口,里面包含了几种 State-Of-The-Art 的检测和跟踪方法(大家可以进行测试比较)。

数据集:DETRAC-Train-Images (5.22GB, 60 sequences)

DETRAC-Test-Images (3.94GB, 40 sequences)

检测:DETRAC-Train-Detections (DPM, ACF, R-CNN, CompACT)

DETRAC-Test-Detections (DPM, ACF, R-CNN, CompACT)

下载地址:http://detrac-db.rit.albany.edu/

• ACF 算法

ACF是指 Aggregate Channel Features,包含在 Piotr Dollar 工具箱内(目前更新至3.50),作为目标检测算法,在行人检测领域有不错的表现。

这里我们把他应用在车检上,借助 DETRAC 数据集进行训练。

Piotr Dollar 工具箱采用 Matlab接口,因此,在实际应用中需要 封装为 C++接口 ,基本步骤如下:

1. 安装Matlab编译器

命令行输入mex -setup,根据提示安装matlab compilers;

注意选择compiler类型,matlab自带的编辑器 或者对应你用的VS版本。

2. 安装生成器

命令行中输入mbuild -setup。

3. 生成c++库文件

调用命令mcc -W cpplib:XXX -T link:lib XXX.m;

前面的XXX表示生成的dll文件名,后面的XXX.m对应matlab源文件,生成后文件包括:XXX(.h. lib .dll)。

关于 Matlab 的其他调用方式 根据需要也可以尝试。

数据训练:

作者采用 Detrac 数据进行训练,具体训练过程按住不表,直接看 检测效果(近端检测还是很不错的):

责任编辑:

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_34853336/article/details/116073826

智能推荐

Linux查看登录用户日志_怎么记录linux设备 发声的登录和登出-程序员宅基地

文章浏览阅读8.6k次。一、Linux记录用户登录信息文件1  /var/run/utmp----记录当前正在登录系统的用户信息;2  /var/log/wtmp----记录当前正在登录和历史登录系统的用户信息;3  /var/log/btmp:记录失败的登录尝试信息。二、命令用法1.命令last,lastb---show a listing of la_怎么记录linux设备 发声的登录和登出

第四章笔记:遍历--算法学中的万能钥匙-程序员宅基地

文章浏览阅读167次。摘要:1. 简介 2. 公园迷宫漫步 3. 无线迷宫与最短(不加权)路径问题 4. 强连通分量1. 简介在计算机科学裡,树的遍历(也称为树的搜索)是圖的遍歷的一种,指的是按照某种规则,不重复地访问某种樹的所有节点的过程。具体的访问操作可能是检查节点的值、更新节点的值等。不同的遍历方式,其访问节点的顺序是不一样的。两种著名的基本遍历策略:深度优先搜索(DFS) 和 广度优先搜索(B...

【案例分享】使用ActiveReports报表工具,在.NET MVC模式下动态创建报表_activereports.net 实现查询报表功能-程序员宅基地

文章浏览阅读591次。提起报表,大家会觉得即熟悉又陌生,好像常常在工作中使用,又似乎无法准确描述报表。今天我们来一起了解一下什么是报表,报表的结构、构成元素,以及为什么需要报表。什么是报表简单的说:报表就是通过表格、图表等形式来动态显示数据,并为使用者提供浏览、打印、导出和分析的功能,可以用公式表示为:报表 = 多样的布局 + 动态的数据 + 丰富的输出报表通常包含以下组成部分:报表首页:在报表的开..._activereports.net 实现查询报表功能

Ubuntu18.04 + GNOME xrdp + Docker + GUI_docker xrdp ubuntu-程序员宅基地

文章浏览阅读6.6k次。最近实验室需要用Cadence,这个软件的安装非常麻烦,每一次配置都要几个小时,因此打算把Cadence装进Docker。但是Cadence运行时需要GUI,要对Docker进行一些配置。我们实验室的服务器运行的是Ubuntu18.04,默认桌面GNOME,Cadence装进Centos的Docker。安装Ubuntu18.04服务器上安装Ubuntu18.04的教程非常多,在此不赘述了安装..._docker xrdp ubuntu

iOS AVFoundation实现相机功能_ios avcapturestillimageoutput 兼容性 ios17 崩溃-程序员宅基地

文章浏览阅读1.8k次,点赞2次,收藏2次。首先导入头文件#import 导入头文件后创建几个相机必须实现的对象 /** * AVCaptureSession对象来执行输入设备和输出设备之间的数据传递 */ @property (nonatomic, strong) AVCaptureSession* session; /** * 输入设备 */_ios avcapturestillimageoutput 兼容性 ios17 崩溃

Oracle动态性能视图--v$sysstat_oracle v$sysstat视图-程序员宅基地

文章浏览阅读982次。按照OracleDocument中的描述,v$sysstat存储自数据库实例运行那刻起就开始累计全实例(instance-wide)的资源使用情况。 类似于v$sesstat,该视图存储下列的统计信息:1>.事件发生次数的统计(如:user commits)2>._oracle v$sysstat视图

随便推点

Vue router报错:NavigationDuplicated {_name: "NavigationDuplicated", name: "NavigationDuplicated"}的解决方法_navigationduplicated {_name: 'navigationduplicated-程序员宅基地

文章浏览阅读7.6k次,点赞2次,收藏9次。我最近做SPA项目开发动态树的时候一直遇到以下错误:当我点击文章管理需要跳转路径时一直报NavigationDuplicated {_name: “NavigationDuplicated”, name: “NavigationDuplicated”}这个错误但是当我点击文章管理后,路径跳转却是成功的<template> <div> 文章管理页面 <..._navigationduplicated {_name: 'navigationduplicated', name: 'navigationduplic

Webrtc回声消除模式(Aecm)屏蔽舒适噪音(CNG)_webrtc aecm 杂音-程序员宅基地

文章浏览阅读3.9k次。版本VoiceEngine 4.1.0舒适噪音生成(comfort noise generator,CNG)是一个在通话过程中出现短暂静音时用来为电话通信产生背景噪声的程序。#if defined(WEBRTC_ANDROID) || defined(WEBRTC_IOS)static const EcModes kDefaultEcMode = kEcAecm;#elsestati..._webrtc aecm 杂音

医学成像原理与图像处理一:概论_医学成像与图像处理技术知识点总结-程序员宅基地

文章浏览阅读6.3k次,点赞9次,收藏19次。医学成像原理与图像处理一:概论引言:本系列博客为医学成像原理与图像处理重要笔记,由于是手写,在此通过扫描录入以图片的形式和电子版增补内容将其进行组织和共享。前半部分内容为图像处理基础内容,包括图像的灰度级处理、空间域滤波、频率域滤波、图像增强和分割等;后半部分内容为医学影象技术,包括常规胶片X光机、CR、DR、CT、DSA等X射线摄影技术、超声成像技术、磁共振成像(MRI)技术等。本篇主要内容是概论。_医学成像与图像处理技术知识点总结

notepad++ v8.5.3 安装插件,安装失败怎么处理?下载进度为0怎么处理?_nodepa++-程序员宅基地

文章浏览阅读591次,点赞13次,收藏10次。notepad++ v8.5.3 安装插件,下载进度为0_nodepa++

hive某个字段中包括\n(和换行符冲突)_hive sql \n-程序员宅基地

文章浏览阅读2.1w次。用spark执行SQL保存到Hive中: hiveContext.sql(&quot;insert overwrite table test select * from aaa&quot;)执行完成,没报错,但是核对结果的时候,发现有几笔数据超出指定范围(实际只包含100/200)最终排查到是ret_pay_remark 字段包含换行符,解决方案:执行SQL中把特殊字符替换掉regexp_replace(..._hive sql \n

印象笔记05:如何打造更美的印象笔记超级笔记_好的印象笔记怎么做的-程序员宅基地

文章浏览阅读520次,点赞10次,收藏8次。印象笔记05:如何打造更美的印象笔记超级笔记本文介绍印象笔记的具体使用,如何打造更美更实用的笔记。首先想要笔记更加好看和实用,我认为要使用超级笔记。所谓超级笔记就是具有很多便捷功能的笔记。_好的印象笔记怎么做的

推荐文章

热门文章

相关标签