OpenCV4学习笔记(34)——Farneback稠密光流算法-程序员宅基地

技术标签: 计算机视觉  学习笔记  opencv  

在上次的博文OpenCV4学习笔记(33)——KLT稀疏光流跟踪算法中,整理记录的OpenCV中对于KLT稀疏光流跟踪的实现,同时也提到了光流跟踪算法除了稀疏光流跟踪以外,还有稠密光流跟踪算法。所以今天要整理的笔记内容就是在OpenCV中对于稠密光流跟踪算法的实现。

先来回顾一下KLT稀疏光流跟踪算法,它是基于shi-tomas角点检测来实现的,只需要每个特征角点的邻域空间窗口内的局部信息来实现光流跟踪。这种基于局部点的光流跟踪方法带来的优点是运行速度快,但是缺点则是跟踪效果较为一般。

而Farneback稠密光流算法则是基于前后两帧图像中所有像素点的移动估算算法,通过前后两帧图像中所有像素点的位移矢量来实现光流跟踪。由于Fb稠密光流算法需要检测所有像素点的光流,所以其效果比稀疏光流算法要更好,但是相对而言其速度更慢,如果没有经过特殊优化的化是不适合用于实时处理的。

Farneback稠密光流算法的主要实现思路是通过每个像素点的邻域信息(由邻域像素点的像素值大小和位置来确定权重)来对该像素点的坐标位置进行多项式展开,得到一个以原坐标(x0,y0)为自变量,新坐标(x,y)为因变量的多项式,并代入坐标数据来求取该像素点在x和y方向上的移动量(dx,dy)。这样就得到了每个像素点在前后两帧图像中的位移矢量,包含振幅和相位。

如果我们将每个像素点位移矢量的振幅和相位信息转化为H、S、V三通道信息,就可以在视频流中直观地观察运动物体的运动情况了,也就实现了对于运动物体的稠密光流跟踪。

在OpenCV中提供了calcOpticalFlowFarneback()这个API来进行稠密光流的计算,这个API使用的是图像金字塔的FB稠密光流算法,它是对上一帧和当前帧图像分别建立图像金字塔,再分别对两个图像金字塔自顶向底地对同一层图像进行FB算法的计算。由于在低分辨率层图像中,运动速度较快的物体不易逃脱检测窗口的捕捉,有利于检测运动程度较大的目标,所以使用图像金字塔的FB稠密光流算法相比一般的FB稠密光流算法具有更好的鲁棒性,能够允许目标比较大程度的运动。

calcOpticalFlowFarneback()的参数含义如下:

第一个参数prev:输入的上一帧图像,为8位单通道图;

第二个参数next:输入的当前帧(或者叫下一帧)图像,为8位单通道图;

第三个参数flow:输出的光流矩阵,其尺寸和输入图像一致,矩阵中每个元素都是一个Point2f类型的点,表示在输入图像中相同位置的像素点在上一帧和当前帧图像中分别在x方向和y方向的位移,即(dx,dy);

第四个参数pyr_scale:生成图像金字塔时上下两层的缩放比例,取值范围是0~1;当该参数为0.5时,即为经典的图像金字塔;

第五个参数level:生成的图像金字塔的层数;当level=0时表示不使用图像金字塔的FB稠密光流算法;一般取level=3;

第六个参数winsize:表示滤波和检测的窗口大小,该参数越大对噪声抑制能力越强,并且能够检测快速移动目标(目标像素点不会移出窗口),但会引起运动区域的模糊;

第七个参数iterations:对每层金字塔图像进行FB算法时的迭代次数;

第八个参数poly_n:对当前像素点进行多项式展开时所选用的邻域大小,该参数值越大,运动区域模糊程度越大,对目标运动检测更稳定,会产生更鲁棒的算法和更模糊的运动场,官方推荐poly_n = 5或7;

第九个参数poly_sigma:进行多项式展开时的高斯系数;推荐值为:当poly_n = 5时,poly_sigma = 1.1;当poly_n = 7时,poly_sigma = 1.5;

第十个参数flag:进行光流估算的滤波器,有以下两种选择:
(1)OPTFLOW_USE_INITIAL_FLOW使用输入流作为初始流近似值,并使用盒子滤波器进行光流估算;
(2)OPTFLOW_FARNEBACK_GAUSSIAN使用高斯滤波器进行光流估算,高斯滤波器相比盒子滤波器的估算结果更精确,但运行速度较慢。

下面是具体的代码演示:

	VideoCapture capture;
	//capture.open("D:\\opencv_c++\\opencv_tutorial\\data\\images\\video.avi");
	capture.open("D:\\OpenCV\\opencv\\sources\\samples\\data\\vtest.avi");
	if (!capture.isOpened())
	{
    
		return 0;
	}
	Mat pre_gray, now_gray;
	capture.read(pre_gray);
	cvtColor(pre_gray, pre_gray, COLOR_BGR2GRAY);
	Mat flow = Mat::zeros(pre_gray.size(), CV_32FC2);

	Mat frame, move_x, move_y;
	move_x = Mat::zeros(flow.size(), CV_32F);
	move_y = Mat::zeros(flow.size(), CV_32F);
	while (capture.read(frame))
	{
    
		cvtColor(frame, now_gray, COLOR_BGR2GRAY);
		calcOpticalFlowFarneback(pre_gray, now_gray, flow, 0.5, 3, 9, 1, 7, 1.5, OPTFLOW_FARNEBACK_GAUSSIAN);
		for (int row = 0; row < flow.rows; row++)
		{
    
			for (int col = 0; col < flow.cols; col++)
			{
    
				//遍历光流矩阵,将x和y方向上的移动值分别存放为独立的矩阵
				Point2f move_x_y = flow.at<Point2f>(row, col);
				move_x.at<float>(row, col) = move_x_y.x;
				move_y.at<float>(row, col) = move_x_y.y;
			}
		}

		Mat mag, ang;
		cartToPolar(move_x, move_y, mag, ang);		//将移动矢量从笛卡尔坐标转换极坐标,输出像素点移动的幅度和相位(弧度)
		Mat H, S, V;
		//以相位值来确定色调H,像素点的不同移动方向形成不同颜色
		H = ang * 180 / CV_PI / 2;			//将弧度转为角度,且在OpenCV中H取值范围是0~180°
		convertScaleAbs(H, H);
		//饱和度S设置最大255,色彩最浓,有利于观察
		S = Mat::zeros(move_x.size(), CV_8UC1);
		S = Scalar(255);
		//亮度V由像素点的移动幅度决定,幅度越大则亮度越大
		normalize(mag, V, 0, 255, NORM_MINMAX);
		convertScaleAbs(V, V);

		vector<Mat> HSV(3);
		HSV[0] = H;
		HSV[1] = S;
		HSV[2] = V;
		Mat result;
		merge(HSV, result);
		//转换到RGB色彩空间进行显示
		cvtColor(result, result, COLOR_HSV2BGR);
		imshow("result", result);

		char ch = cv::waitKey(20);
		if (ch == 27)
		{
    
			break;
		}
		//将当前帧图像,置为上一帧图像
		swap(pre_gray, now_gray);

	}
	capture.release();

当调用calcOpticalFlowFarneback()后,我们得到一个包含x、y两个方向移动量的矩阵,于是我们通过双重for循环来遍历光流矩阵,将x和y方向上的移动量分别存放到两个独立的矩阵中去。这两个矩阵相当于位移矢量在x、y方向的分量,组合起来就表示每个像素点在前后两帧图像中移动的位移矢量。

接着,再通过cartToPolar()这个API,将上述得到的两个位移矢量分量从笛卡尔坐标系变换到极坐标系中,从而得到位移矢量的振幅和相位。
cartToPolar()这个API的参数如下:
第一个参数x:输入的x分量数据,也就是dx;
第二个参数y:输入的y分量数据,也就是dy;
第三个参数magnitude:输出的振幅信息;
第四个参数angle:输出的相位信息。

随后我们将振幅和相位信息转化到HSV空间中。由于相位和色调的取值范围都是 0~2Π ,所以可以利用相位信息来计算出色调H的值,计算公式为H = ang * 180 / CV_PI / 2,将相位由弧度转为角度,且在OpenCV中色调H取值范围是0~180°,所以再除以2。这样通过不同方向的位移计算得到的色调H是不一样的,就给不同移动方向的像素点分配了不同显示色彩,便于观察。

对于饱和度S,我们统一设置为最大值255,用最浓的色彩来显示同样便于我们观察。

最后通过振幅来计算亮度V,也就是将振幅归一化到0~255之间,如果振幅越大则亮度V越大,也就是目标物体的运动程度越大,则显示得更亮。

最后将得到的HSV图像转化为RGB图像,就能够直观得显示出对运动物体的光流跟踪效果了。

下面是演示效果的截图:
在这里插入图片描述
在这里插入图片描述
从效果图中可以看出,Farneback稠密光流跟踪算法能够将视频中走动的人检测出来,而且不同方向和不同运动程度都能够直观地显示出来,这样我们就可以实现基于Farneback稠密光流算法的运动检测。然而,这种方式实现运动检测的实时性很差,在视频播放过程可以看出非常明显的卡顿现象,可能在运算速度上的缺陷也一定程度上限制了Farneback算法的应用吧。

好的,今天的笔记就记录到这里,下次有空再来写博客啦~

PS:本人的注释比较杂,既有自己的心得体会也有网上查阅资料时摘抄下的知识内容,所以如有雷同,纯属我向前辈学习的致敬,如果有前辈觉得我的笔记内容侵犯了您的知识产权,请和我联系,我会将涉及到的博文内容删除,谢谢!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_45224869/article/details/105100996

智能推荐

远程桌面服务器连接失败,Windows服务器远程桌面连接失败是什么原因-程序员宅基地

文章浏览阅读6.1k次。1、先通过显示器直接连接的方式连接到那台连接出错的服务器上。登陆以后,在桌面上的此电脑图标上面点右键,选择属性。2、然后在属性页面中我们可以看到对应的系统版本是Windows Server 2016。CPU是intel xeon型号,内存是16g。这个时候我们点击它左上角的远程设置。3、在远程设置界面,我们可以看到,它默认的设置是允许远程到这台服务器上,但是它下面勾选了”仅允许运行使用网络级别身份..._远程桌面服务无法加入服务器 win-th0hfpjn9vr 上的连接代理。 错误: 当前异步消息

ApacheCN 翻译活动进度公告 2019.6.15-程序员宅基地

文章浏览阅读109次。Special Sponsors我们组织了一个开源互助平台,方便开源组织和大 V 互相认识,互相帮助,整合资源。请回复这个帖子并注明组织/个人信息来申请加入。请回复这个帖子来推荐希望翻译的内容。如果大家遇到了做得不错的教程或翻译项目,也可以推荐给我们。我们会联系项目的维护者,一起把...

Python培训课程深圳,群年轻人正在追捧Python-程序员宅基地

文章浏览阅读182次。记者 | 伍洋宇 袁伟腾编辑 | 文姝琪1李楠打算年底换份新工作,Python方向的、纯软件岗位,发挥空间更大的全栈开发工程师就很不错,目标月薪一万二。这使得他在今年下半年开始系统学习Python。因为本科是计算机专业,期间也自学过Python这门语言,李楠选择了继续自学。学Python真的有用吗?“当然有用啦,没用谁去学它啊。”今年24岁、刚刚毕业一年的李楠这么说。目前他在一家智能硬件公司做嵌入式开发软件工程师,月薪一万,工作是“往硬件里面写软件”,他觉得太枯燥了。“代码都是写好的,基..

Ubuntu下安装R,升级R版本,安装Rstudio,安装Rstudio Server以及安装Shiny Server_marutter-ubuntu-rrutter-focal.list-程序员宅基地

文章浏览阅读2.9k次。一、安装R只需要一步命令:sudo apt-get install r-base二、升级R版本第一步给Ubuntu指定PPA:sudo add-apt-repository ppa:marutter/rrutter第二步:sudo apt-get update第三步:sudo apt-get upgrade三、安装Rstudio直接去Rstudio官网下载最新版的Rst..._marutter-ubuntu-rrutter-focal.list

Redis5.0集群搭建(Redis Cluster)_rediscluster搭建 5.0-程序员宅基地

文章浏览阅读9.1k次。Redis5.0集群搭建RedisCluster_rediscluster搭建 5.0

题目-java基础_面向过程的程序设计是把计算机程序视为一系列的命令集合-程序员宅基地

文章浏览阅读405次。多线程和单线程线程不是越多越好,假如你的业务逻辑全部是计算型的(CPU密集型),不涉及到IO,并且只有一个核心。那肯定一个线程最好,多一个线程就多一点线程切换的计算,CPU不能完完全全的把计算能力放在业务计算上面,线程越多就会造成CPU利用率(用在业务计算的时间/总的时间)下降。但是在WEB场景下,业务并不是CPU密集型任务,而是IO密集型的任务,一个线程是不合适,如果一个线程在等待数据时,把CPU的计算能力交给其他线程,这样也能充分的利用CPU资源。但是线程数量也要有个限度,一般线程数有一个公式:最佳启_面向过程的程序设计是把计算机程序视为一系列的命令集合

随便推点

储能8串电池用140W DCDC电路2 USB_A 2个 TYPE-C 2A2C_pl56002-程序员宅基地

文章浏览阅读78次。储能8串电池,输出是2个C口,2个USBA口,功率是C1:140W,C2:100W,A1:18W,A2:18W.A1,A2不降功率,使用IP2736,IP2723T,IP2163,_pl56002

python3.8.1手机版下载-Python官方下载|Python最新版 V3.8.1 -推背图下载站-程序员宅基地

文章浏览阅读2k次。Python最新版是一款功能强大脚本编程软件。Python最新版它可以帮助编程人员更加便捷的进行代码编写,适合完成各种高层任务,兼容所有的操作系统中使用,因为它的便捷性,在程序员中得到广泛的应用,新入门的编程学习者可以使用它快速学习,欢迎前来下载!功能特点1、简单易学Python极其容易上手,因为Python有极其简单的说明文档 。2、免费开源Python是FLOSS(自由/开放源码软件)之一。3..._手机版python官网下载

Unity3D学习之(坦克大战解析)-程序员宅基地

文章浏览阅读3.9k次。欢迎大家光临我的博客!对坦克大战项目的解析:一、游戏模块主要是:注册模块、登录模块、我方模块、和敌方模块。①注册模块:可以跳转到登录界面!②登录模块:可以跳转到游戏界面!③我方模块:可以前后左右移动,可以发射子弹,可以死亡销毁。④敌方模块:可以可以发射子弹,追踪我方的位置,也可以随机出现,可以死亡销毁。 二、所用到的技术①键盘事件 //敌我双方通过键盘上下左右键的移动②位移 ...

【linux】进程和线程的几种状态及状态切换_linux线程状态-程序员宅基地

文章浏览阅读3.6k次,点赞46次,收藏54次。进程和线程的状态_linux线程状态

Java/Mysql数据库+SSM+学生信息管理系统 11578(免费领源码)计算机毕业设计项目推荐上万套实战教程JAVA、PHP,node.js,C++、python、大屏可视化等-程序员宅基地

文章浏览阅读1.1k次,点赞22次,收藏20次。免费领取项目源码,请关注●点赞●收藏并私信博主,谢谢~本系统以实际运用为开发背景,通过系统管理员可以对所有的学生和教师等人员以及学生相关联的一些学生管理、分配任务、完成任务、打卡签到、师生交流等数据信息进行统一的管理,方便资料的保留。教师和学生可以通过注册,然后登录到系统当中,对分配任务、完成任务、打卡签到以及师生交流这些信息进行查询管理。总的来说,系统的前台是通过Java页面展示,后台使用SSM这个框架,数据库采用目前流行的开源关系型数据库MYSQL。

如何在群辉NAS系统下安装cpolar套件,并使用cpolar内网穿透?_在群晖nas安装cpolar套件-程序员宅基地

文章浏览阅读1.2k次,点赞39次,收藏34次。群晖作为大容量存储系统,既可以作为个人的私有存储设备,也可以放在小型企业中作为数据中心使用。其强大的数据存储和管理功能,让其还能够胜任更多任务。但由于群晖的应用场景所限,这些功能通常只能在局域网内实现,想要让群晖NAS存储的数据能在公网访问到,我们可以借助cpolar的辅助,轻松实现在公共互联网访问内网群晖NAS上的数据。在这之前,我们还是需要了解下cpolar的基本操作方式。_在群晖nas安装cpolar套件