OpenCV4学习笔记(34)——Farneback稠密光流算法-程序员宅基地

技术标签: 计算机视觉  学习笔记  opencv  

在上次的博文OpenCV4学习笔记(33)——KLT稀疏光流跟踪算法中,整理记录的OpenCV中对于KLT稀疏光流跟踪的实现,同时也提到了光流跟踪算法除了稀疏光流跟踪以外,还有稠密光流跟踪算法。所以今天要整理的笔记内容就是在OpenCV中对于稠密光流跟踪算法的实现。

先来回顾一下KLT稀疏光流跟踪算法,它是基于shi-tomas角点检测来实现的,只需要每个特征角点的邻域空间窗口内的局部信息来实现光流跟踪。这种基于局部点的光流跟踪方法带来的优点是运行速度快,但是缺点则是跟踪效果较为一般。

而Farneback稠密光流算法则是基于前后两帧图像中所有像素点的移动估算算法,通过前后两帧图像中所有像素点的位移矢量来实现光流跟踪。由于Fb稠密光流算法需要检测所有像素点的光流,所以其效果比稀疏光流算法要更好,但是相对而言其速度更慢,如果没有经过特殊优化的化是不适合用于实时处理的。

Farneback稠密光流算法的主要实现思路是通过每个像素点的邻域信息(由邻域像素点的像素值大小和位置来确定权重)来对该像素点的坐标位置进行多项式展开,得到一个以原坐标(x0,y0)为自变量,新坐标(x,y)为因变量的多项式,并代入坐标数据来求取该像素点在x和y方向上的移动量(dx,dy)。这样就得到了每个像素点在前后两帧图像中的位移矢量,包含振幅和相位。

如果我们将每个像素点位移矢量的振幅和相位信息转化为H、S、V三通道信息,就可以在视频流中直观地观察运动物体的运动情况了,也就实现了对于运动物体的稠密光流跟踪。

在OpenCV中提供了calcOpticalFlowFarneback()这个API来进行稠密光流的计算,这个API使用的是图像金字塔的FB稠密光流算法,它是对上一帧和当前帧图像分别建立图像金字塔,再分别对两个图像金字塔自顶向底地对同一层图像进行FB算法的计算。由于在低分辨率层图像中,运动速度较快的物体不易逃脱检测窗口的捕捉,有利于检测运动程度较大的目标,所以使用图像金字塔的FB稠密光流算法相比一般的FB稠密光流算法具有更好的鲁棒性,能够允许目标比较大程度的运动。

calcOpticalFlowFarneback()的参数含义如下:

第一个参数prev:输入的上一帧图像,为8位单通道图;

第二个参数next:输入的当前帧(或者叫下一帧)图像,为8位单通道图;

第三个参数flow:输出的光流矩阵,其尺寸和输入图像一致,矩阵中每个元素都是一个Point2f类型的点,表示在输入图像中相同位置的像素点在上一帧和当前帧图像中分别在x方向和y方向的位移,即(dx,dy);

第四个参数pyr_scale:生成图像金字塔时上下两层的缩放比例,取值范围是0~1;当该参数为0.5时,即为经典的图像金字塔;

第五个参数level:生成的图像金字塔的层数;当level=0时表示不使用图像金字塔的FB稠密光流算法;一般取level=3;

第六个参数winsize:表示滤波和检测的窗口大小,该参数越大对噪声抑制能力越强,并且能够检测快速移动目标(目标像素点不会移出窗口),但会引起运动区域的模糊;

第七个参数iterations:对每层金字塔图像进行FB算法时的迭代次数;

第八个参数poly_n:对当前像素点进行多项式展开时所选用的邻域大小,该参数值越大,运动区域模糊程度越大,对目标运动检测更稳定,会产生更鲁棒的算法和更模糊的运动场,官方推荐poly_n = 5或7;

第九个参数poly_sigma:进行多项式展开时的高斯系数;推荐值为:当poly_n = 5时,poly_sigma = 1.1;当poly_n = 7时,poly_sigma = 1.5;

第十个参数flag:进行光流估算的滤波器,有以下两种选择:
(1)OPTFLOW_USE_INITIAL_FLOW使用输入流作为初始流近似值,并使用盒子滤波器进行光流估算;
(2)OPTFLOW_FARNEBACK_GAUSSIAN使用高斯滤波器进行光流估算,高斯滤波器相比盒子滤波器的估算结果更精确,但运行速度较慢。

下面是具体的代码演示:

	VideoCapture capture;
	//capture.open("D:\\opencv_c++\\opencv_tutorial\\data\\images\\video.avi");
	capture.open("D:\\OpenCV\\opencv\\sources\\samples\\data\\vtest.avi");
	if (!capture.isOpened())
	{
    
		return 0;
	}
	Mat pre_gray, now_gray;
	capture.read(pre_gray);
	cvtColor(pre_gray, pre_gray, COLOR_BGR2GRAY);
	Mat flow = Mat::zeros(pre_gray.size(), CV_32FC2);

	Mat frame, move_x, move_y;
	move_x = Mat::zeros(flow.size(), CV_32F);
	move_y = Mat::zeros(flow.size(), CV_32F);
	while (capture.read(frame))
	{
    
		cvtColor(frame, now_gray, COLOR_BGR2GRAY);
		calcOpticalFlowFarneback(pre_gray, now_gray, flow, 0.5, 3, 9, 1, 7, 1.5, OPTFLOW_FARNEBACK_GAUSSIAN);
		for (int row = 0; row < flow.rows; row++)
		{
    
			for (int col = 0; col < flow.cols; col++)
			{
    
				//遍历光流矩阵,将x和y方向上的移动值分别存放为独立的矩阵
				Point2f move_x_y = flow.at<Point2f>(row, col);
				move_x.at<float>(row, col) = move_x_y.x;
				move_y.at<float>(row, col) = move_x_y.y;
			}
		}

		Mat mag, ang;
		cartToPolar(move_x, move_y, mag, ang);		//将移动矢量从笛卡尔坐标转换极坐标,输出像素点移动的幅度和相位(弧度)
		Mat H, S, V;
		//以相位值来确定色调H,像素点的不同移动方向形成不同颜色
		H = ang * 180 / CV_PI / 2;			//将弧度转为角度,且在OpenCV中H取值范围是0~180°
		convertScaleAbs(H, H);
		//饱和度S设置最大255,色彩最浓,有利于观察
		S = Mat::zeros(move_x.size(), CV_8UC1);
		S = Scalar(255);
		//亮度V由像素点的移动幅度决定,幅度越大则亮度越大
		normalize(mag, V, 0, 255, NORM_MINMAX);
		convertScaleAbs(V, V);

		vector<Mat> HSV(3);
		HSV[0] = H;
		HSV[1] = S;
		HSV[2] = V;
		Mat result;
		merge(HSV, result);
		//转换到RGB色彩空间进行显示
		cvtColor(result, result, COLOR_HSV2BGR);
		imshow("result", result);

		char ch = cv::waitKey(20);
		if (ch == 27)
		{
    
			break;
		}
		//将当前帧图像,置为上一帧图像
		swap(pre_gray, now_gray);

	}
	capture.release();

当调用calcOpticalFlowFarneback()后,我们得到一个包含x、y两个方向移动量的矩阵,于是我们通过双重for循环来遍历光流矩阵,将x和y方向上的移动量分别存放到两个独立的矩阵中去。这两个矩阵相当于位移矢量在x、y方向的分量,组合起来就表示每个像素点在前后两帧图像中移动的位移矢量。

接着,再通过cartToPolar()这个API,将上述得到的两个位移矢量分量从笛卡尔坐标系变换到极坐标系中,从而得到位移矢量的振幅和相位。
cartToPolar()这个API的参数如下:
第一个参数x:输入的x分量数据,也就是dx;
第二个参数y:输入的y分量数据,也就是dy;
第三个参数magnitude:输出的振幅信息;
第四个参数angle:输出的相位信息。

随后我们将振幅和相位信息转化到HSV空间中。由于相位和色调的取值范围都是 0~2Π ,所以可以利用相位信息来计算出色调H的值,计算公式为H = ang * 180 / CV_PI / 2,将相位由弧度转为角度,且在OpenCV中色调H取值范围是0~180°,所以再除以2。这样通过不同方向的位移计算得到的色调H是不一样的,就给不同移动方向的像素点分配了不同显示色彩,便于观察。

对于饱和度S,我们统一设置为最大值255,用最浓的色彩来显示同样便于我们观察。

最后通过振幅来计算亮度V,也就是将振幅归一化到0~255之间,如果振幅越大则亮度V越大,也就是目标物体的运动程度越大,则显示得更亮。

最后将得到的HSV图像转化为RGB图像,就能够直观得显示出对运动物体的光流跟踪效果了。

下面是演示效果的截图:
在这里插入图片描述
在这里插入图片描述
从效果图中可以看出,Farneback稠密光流跟踪算法能够将视频中走动的人检测出来,而且不同方向和不同运动程度都能够直观地显示出来,这样我们就可以实现基于Farneback稠密光流算法的运动检测。然而,这种方式实现运动检测的实时性很差,在视频播放过程可以看出非常明显的卡顿现象,可能在运算速度上的缺陷也一定程度上限制了Farneback算法的应用吧。

好的,今天的笔记就记录到这里,下次有空再来写博客啦~

PS:本人的注释比较杂,既有自己的心得体会也有网上查阅资料时摘抄下的知识内容,所以如有雷同,纯属我向前辈学习的致敬,如果有前辈觉得我的笔记内容侵犯了您的知识产权,请和我联系,我会将涉及到的博文内容删除,谢谢!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45224869/article/details/105100996

智能推荐

linux安装gcc-c++报错Unable to locate package gcc-c+-程序员宅基地

文章浏览阅读1.1w次,点赞21次,收藏19次。报错如图,我刚开始也很莫名其妙,为什么变成了gcc-c+呢,另一个+呢?最后才发现ubuntu比较特殊。。。需要变成2条指令才能安装以下2条指令就相当于sudo apt-get install gcc-c++,分别执行完成就好啦,安装成功!sudo apt-get install gccsudo apt-get install g++..._unable to locate package gcc-c+

java/jsp/ssm高考志愿填报系统【2024年毕设】-程序员宅基地

文章浏览阅读64次。springboot基于Springboot的旅游景区指南系统的设计与实现。springboot基于springboot的旅游平台管理系统。开发软件:eclipse/myeclipse/idea。springboot基于android的运动管理软件。ssm基于微信小程序的多多母婴购物商城的设计与。springboot基于vue的游戏社交平台。springboot同城驴友社区的开发与实现。springboot在线音乐系统的设计与实现。springboot微信小程序的新闻管理系统。

超强大的数学计算器——WolframAlpha(含安卓下载连接)_wolfram alpha 安卓版-程序员宅基地

文章浏览阅读7.1k次,点赞13次,收藏56次。利用该计算器求导、积分、微分、解方程、绘制图像(函数图像、波特图、根轨迹等)、泰勒展开、极限、矩阵内容_wolfram alpha 安卓版

猿创征文|Android 11.0 默认开启无障碍服务权限和打开默认apk无障碍服务_android11 无障碍权限-程序员宅基地

文章浏览阅读2.2k次,点赞2次,收藏2次。在第三方app开发中,需要开启无障碍服务功能,就不需要在代码中开启无障碍服务了,为了简便就需要在系统中开启无障碍服务_android11 无障碍权限

mysql left/right join算法效率分析_Mysql left join,right join,inner join的效率比较-程序员宅基地

文章浏览阅读995次。一.Join语法概述join 用于多表中字段之间的联系,语法如下:... FROM table1 INNER|LEFT|RIGHT JOIN table2 ON conditionatable1:左表;table2:右表。JOIN 按照功能大致分为如下三类:INNER JOIN(内连接,或等值连接):取得两个表中存在连接匹配关系的记录。LEFT JOIN(左连接):取得左表(table1)完全记录..._left join和right join和inner join的效率

随便推点

Teamcity为Azure的git源颁发ssh-rsa证书,使用ssl-keygen在macos下操作

执行这段将会要求输入旧密码和新密码两次,新密码可以和旧密码相同,这样会覆盖id_rsa文件.这个文件就是tc能支持的私钥了.更换了符合他要求的证书也是有一多半的情况不正常,但实则是微软服务的问题,是服务器都拿去跑算力了还是短暂的系统问题不确定.也可以使用puttygen转换私钥格式为PEM的,比ssh-keygen麻烦一些需要先转换成ppk文件才可以.以下记录生成符合SSH-RSA2的 SHA256或者512的方法,以符合微软的标准.回车后会要求输入生成的路径,会给出提示,默认回车即可。

数据库管理-第179期 分库分表vs分布式(20240430

本期简单讲了下分库分表和分布式的一些异同,也扩展了一下自己对分布式数据库的一些期望。

Android 网络连接工具类 Utility-程序员宅基地

文章浏览阅读240次。** * Utility class for http request. * */ public class Utility { private static RequestParameters mRequestHeader = new RequestParameters(); public static final String BOUN..._androidutility怎么用

邮件乱码产生的原因及其分析_发邮件乱码-程序员宅基地

文章浏览阅读2k次。本文主要介绍邮件乱码产生的主要原因及几种解决方法:   E-mail编码标准   由于一个汉字是用两个扩展 ASCII码表示,对DOS、Windows及Unix系统来说,所有英文字母及符号都是用ASCII码来代表,ASCII码只用到每个字节的前7位。而一些电脑系统在通信时不使用8-bit clean传输方式,无法处理8位的数据或把8位数据当作7位来处理,数据就会被破坏。对电子邮件来说,有时_发邮件乱码

51单片机的定时器2的配置_51单片机定时器2-程序员宅基地

文章浏览阅读8k次,点赞25次,收藏125次。学过一段时间单片机的你发现,中断服务函数可以在主函数进行的同时,进行一些对时间要求高的模块的配置时,则要用到定时器中断。而如果你要实现多个功能的操作,会使用多个定时器是必要的STC89C51单片机所有的资源中最不好搞清楚的就是定时器2,尤其是对于那些以前从来没有玩过单片机的新手。定时器2是新增资源,也是51单片机定时器里面功能最强大的一个定时器。​ 定时器2有三个模式,在这里我们只是介绍系统的简单配置与将定时器2当成一般递增/递减计数器的使用代码,剩下的模式可以自己查阅手册:​ 下面我带着大家简单配置一_51单片机定时器2

Spring Boot 如何实现缓存预热

监听 ContextRefreshedEvent 或 ApplicationReadyEvent 等应用上下文初始化完成事件。

推荐文章

热门文章

相关标签