4、树莓派人脸识别-人脸检测与识别实践部分_基于qt+树莓派实现人脸识别-程序员宅基地

技术标签: 学习  python  

如果你需要做树莓派的课程设计(或者说计算机系统综合课程设计),那这几篇博客一定适合你。一开始做课设的时候对硬件、组装、烧录等等词语都很陌生,老师也不会进行过多的辅导,很多同学迷迷糊糊的不知道自己该干嘛,下面是对我课程设计的一个总结,希望对大家有所帮助。
1、树莓派树莓派人脸识别-硬件组装+系统烧录
2、树莓派人脸识别-树莓派人脸识别-环境搭建、相机测试
3、树莓派人脸识别-原理及问题小结
4、树莓派人脸识别-人脸检测与识别实践部分
5、树莓派人脸识别-课程设计报告

传统的人脸识别算法一般需要较高的计算资源,在树莓派上实现会很卡,下面是极简版的人脸识别。

代码文件夹链接如下链接: https://pan.baidu.com/s/1sWnvG7ChoFbkMUAs6nSCsQ?pwd=rdmt

参考文章:https://www.instructables.com/Real-time-Face-Recognition-an-End-to-end-Project/

运行代码:

  1. 拷贝文件目录到树莓派,打开命令行,进入文件目录
  2. ptyhon 01_face_dataset.py (这里输入python 01 之后按tab会自动补齐文件名)
  3. 输入id (任意数字,1-10最佳)
  4. 等待摄像头拍照,照片会存进dataset文件夹,名字跟id和顺序有关
  5. python 02_face_training.py (这里输入python 02 之后按tab会自动补齐文件名)
  6. 训练好的文件会放在trainer文件夹内
  7. python 03_face_recognition.py (这里输入python 03 之后按tab会自动补齐文件名)
  8. 这里会打开摄像头,面部贴近摄像头会显示识别信息,id对应03_face_recognition.py代码中的names数组名字,中文会乱码所以直接用英文缩写就好(比如 张三改成San Zhang )

1、01_face_dataset(捕捉人脸存储到文件用于训练,保存到dataset文件夹)

  1. 下面这段代码使用 OpenCV 捕获摄像头中的视频帧,并利用 haarcascade_frontalface_default.xml 文件来进行人脸检测。
  2. 每输入一个数字人脸ID,并在数据集文件夹中创建一个名为 “User.[face_id].[count].jpg” 的新文件来保存每个采集到的人脸样本。
  3. 程序将等待直到采集到30个人脸样本或按下 ESC 键,然后清理资源并退出程序。
# 从多个用户中捕获多个人脸并将其存储在数据库(数据集目录)中
# ==> 人脸将存储在目录:dataset/(如果不存在,请创建它)
# ==> 每个人脸将有一个唯一的数字ID,如1、2、3等

# 代码原作者:Anirban Kar (https://github.com/thecodacus/Face-Recognition)

import cv2
import os

# 获取默认摄像头
cam = cv2.VideoCapture(0)
# 设置视频宽度
cam.set(3, 640)
# 设置视频高度
cam.set(4, 480)

# 加载人脸检测器
face_detector = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 对于每个人,请输入一个数字人脸ID
face_id = input('\n 请输入用户ID,然后按 <回车> 键 ==>  ')

print("\n [INFO] 初始化人脸采集,请直视摄像头并等待...")
# 初始化每个用户的人脸样本计数器
count = 0

while(True):
    # 读取视频帧
    ret, img = cam.read()
    # 垂直翻转视频图像
    img = cv2.flip(img, -1)
    img = cv2.flip(img, 0)
    # 转换为灰度图像
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 检测人脸
    faces = face_detector.detectMultiScale(gray, 1.3, 5)

    for (x,y,w,h) in faces:
        # 在图像上绘制矩形,标记出人脸位置
        cv2.rectangle(img, (x,y), (x+w,y+h), (255,0,0), 2)
        # 增加采集到的人脸计数器
        count += 1

        # 将采集到的人脸样本保存到数据集文件夹中
        # 文件名格式为 "User.[face_id].[count].jpg"
        cv2.imwrite("dataset/User." + str(face_id) + '.' + str(count) + ".jpg", gray[y:y+h,x:x+w])

        # 显示人脸采集过程
        cv2.imshow('image', img)

    # 等待100毫秒并检测键盘输入,如果按下 ESC 键则退出程序
    k = cv2.waitKey(100) & 0xff
    if k == 27:
        break
    
    # 如果采集到的人脸样本数达到30个,则停止采集
    elif count >= 30:
        break

# 清理资源
print("\n [INFO] 程序已退出并清理资源")
cam.release()
cv2.destroyAllWindows()

2、02_face_training(训练人脸数据,保存到trainer文件夹)

  1. 下面这段代码通过调用 OpenCV 的人脸识别器和人脸检测器,对存储在数据库中的多个人脸图像进行训练。
  2. 函数 getImagesAndLabels() 用于获取数据库中的人脸图像和对应的标签数据。
  3. 然后,使用 LBPH 识别器对这些人脸图像进行训练,并将训练好的模型保存到 trainer/trainer.yml 文件中。
  4. 最后,程序输出训练过的人脸数量,并退出程序。
import cv2
import numpy as np
from PIL import Image
import os

# 存储人脸图像的路径
path = 'dataset'

# 创建 LBPH 人脸识别器和人脸检测器
recognizer = cv2.face.LBPHFaceRecognizer_create()
detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml");

# 获取人脸图像和标签数据的函数
def getImagesAndLabels(path):

    imagePaths = [os.path.join(path,f) for f in os.listdir(path)]     
    faceSamples=[]
    ids = []

    for imagePath in imagePaths:

        # 将图像转换为灰度图像,并将其转换为 NumPy 数组
        PIL_img = Image.open(imagePath).convert('L') # 将图像转换为灰度图像
        img_numpy = np.array(PIL_img,'uint8')

        # 解析图像文件名以获取人脸ID
        id = int(os.path.split(imagePath)[-1].split(".")[1])
        # 使用人脸检测器检测人脸
        faces = detector.detectMultiScale(img_numpy)

        # 将人脸图像和ID添加到列表中
        for (x,y,w,h) in faces:
            faceSamples.append(img_numpy[y:y+h,x:x+w])
            ids.append(id)

    return faceSamples,ids

print ("\n [INFO] 训练人脸数据,这会花费一些时间,请等待...")
# 获取人脸图像和标签数据
faces,ids = getImagesAndLabels(path)
# 使用 LBPH 识别器进行训练
recognizer.train(faces, np.array(ids))

# 将训练好的模型保存到 trainer/trainer.yml 文件中
recognizer.write('trainer/trainer.yml')

# 打印训练过的人脸数量并退出程序
print("\n [INFO] {0} 个人脸已训练完毕,程序即将退出。".format(len(np.unique(ids))))

3、03_face_recognition

  1. 下面这段代码使用 cv2.VideoCapture 实时获取摄像头捕获的视频图像,然后使用人脸检测器检测图像中的人脸。
  2. 对于检测到的每个人脸,使用训练好的 LBPH 人脸识别器进行识别。
  3. 如果置信度(confidence)小于100,则认为识别成功,并根据 ID 获取对应的名字。否则,将 ID 设置为 “unknown”。
  4. 最后,在图像上显示出识别结果。
  5. 程序会持续地从摄像头中获取图像,并进行实时的人脸识别,直到用户按下 ESC 键退出程序。
import cv2
import numpy as np
import os 

# 加载训练好的 LBPH 人脸识别器
recognizer = cv2.face.LBPHFaceRecognizer_create()
recognizer.read('trainer/trainer.yml')

# 加载人脸检测器
cascadePath = "haarcascade_frontalface_default.xml"
faceCascade = cv2.CascadeClassifier(cascadePath);

# 定义字体
font = cv2.FONT_HERSHEY_SIMPLEX

# 初始化 ID 计数器
id = 0

# ID 对应的名字,例如:Marcelo 的 ID 为 1,对应的 names 列表中的第一个元素,以此类推。
names = ['None', 'Marcelo', 'Paula', 'Ilza', 'Z', 'W'] 

# 初始化并启动实时视频采集
cam = cv2.VideoCapture(0)
cam.set(3, 640) # 设置视频宽度
cam.set(4, 480) # 设置视频高度

# 定义最小窗口大小以被识别为人脸
minW = 0.1*cam.get(3)
minH = 0.1*cam.get(4)

while True:

    ret, img =cam.read()
     # 垂直翻转视频图像
    img = cv2.flip(img, -1)
    img = cv2.flip(img, -1)

    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

    # 使用人脸检测器检测人脸
    faces = faceCascade.detectMultiScale( 
        gray,
        scaleFactor = 1.2,
        minNeighbors = 5,
        minSize = (int(minW), int(minH)),
       )

    for(x,y,w,h) in faces:

        # 在图像上绘制矩形,标记出人脸位置
        cv2.rectangle(img, (x,y), (x+w,y+h), (0,255,0), 2)

        # 对每个人脸进行识别
        id, confidence = recognizer.predict(gray[y:y+h,x:x+w])

        # 如果置信度小于100,则认为识别成功
        if (confidence < 100):
            id = names[id] # 获取 ID 对应的名字
            confidence = "  {0}%".format(round(100 - confidence))
        else:
            id = "unknown"
            confidence = "  {0}%".format(round(100 - confidence))
        
        # 在图像上显示出识别结果
        cv2.putText(img, str(id), (x+5,y-5), font, 1, (255,255,255), 2)
        cv2.putText(img, str(confidence), (x+5,y+h-5), font, 1, (255,255,0), 1)  
    
    cv2.imshow('camera',img) 

    # 按下 ESC 键退出程序
    k = cv2.waitKey(10) & 0xff 
    if k == 27:
        break

# 清理资源
print("\n [INFO] 退出程序并清理资源")
cam.release()
cv2.destroyAllWindows()

到这里已经完成了树莓派人脸识别的课程设计,但是并不能得到很好地GPA。

故很容易想到用pyqt做一个简单界面,链接数据库做数据的存储(mysql并不能正确配置armhf,所以用平替MariaDB尝试了一下,体验很差),经过笔者的尝试效果并不理想,如果你是使用8核的主板可以尝试一下,4核真的很卡,所以我不建议在这里花时间去做。

所以这里建议直接在自己的笔记本电脑上做其他的人脸识别实验

  1. (CSDN上可以搜到,有人做了很系统的总结)Python3.0+OpenCV4+PyQt5+Mysql8+dlib+conda环境的人脸识别,其中环境使用Anaconda配置的虚拟环境,活体检测使用的dlib眨眼检测(一般我们使用的都是普通的2D相机,不同于景深信息相机和3D结构光相机,不能很好的进行活体检测),界面设计用QT Designer,人脸识别主要使用OpenCV库的一些函数,效果比较好的是ResNet-SSD残差网络,使用affine transformations进行仿射变换,使用2015Google的FaceNet做人脸识别,使用SVM只支持向量机更好的处理向量数据,使用PyMysql操作数据库。
  2. (Kaggle上直接找Olivetti数据集,里面有人做的案例可以参考)使用现有的数据集比如Olivetti数据集(40人x10张人脸灰度图-不同时间、表情、细节),做PCA主要成分分析,在数量足够多的情况下进行局部特征分析、全局分析和混合分析找到三种模型中accury交叉验证准确率得分最高的模型,进行参数优化得到最优的模型用于人脸识别实验的结果。

上面两个实验提供了两个很好地思路,一种是实体的检测,一种是照片的检测,这里想到之前机器视觉有人答辩的时候老师问他准确率怎么有90+,正常70就很好了,他直接懵(因为他用的是手机照片放在摄像头做的测试,环境影响不大所以检测差不不大,实际使用实体人脸的话准确率也在60左右。)


到这里满绩完全没有问题,如果你想让老师眼前一亮到时候科研项目、保研考研一类看好你,可以往下看,

你可以在自己的论文内加入一些比较权威的内容,比如在bilibili上搜CVPR论文,之后关注加v拿资料,可以在论文内找找看有没有感兴趣的加到自己的课程设计内,比如人脸识别&检测、人脸生成&合成&重建&编辑、人脸反欺骗这这些方面入手。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_53377464/article/details/133885291

智能推荐

c# 调用c++ lib静态库_c#调用lib-程序员宅基地

文章浏览阅读2w次,点赞7次,收藏51次。四个步骤1.创建C++ Win32项目动态库dll 2.在Win32项目动态库中添加 外部依赖项 lib头文件和lib库3.导出C接口4.c#调用c++动态库开始你的表演...①创建一个空白的解决方案,在解决方案中添加 Visual C++ , Win32 项目空白解决方案的创建:添加Visual C++ , Win32 项目这......_c#调用lib

deepin/ubuntu安装苹方字体-程序员宅基地

文章浏览阅读4.6k次。苹方字体是苹果系统上的黑体,挺好看的。注重颜值的网站都会使用,例如知乎:font-family: -apple-system, BlinkMacSystemFont, Helvetica Neue, PingFang SC, Microsoft YaHei, Source Han Sans SC, Noto Sans CJK SC, W..._ubuntu pingfang

html表单常见操作汇总_html表单的处理程序有那些-程序员宅基地

文章浏览阅读159次。表单表单概述表单标签表单域按钮控件demo表单标签表单标签基本语法结构<form action="处理数据程序的url地址“ method=”get|post“ name="表单名称”></form><!--action,当提交表单时,向何处发送表单中的数据,地址可以是相对地址也可以是绝对地址--><!--method将表单中的数据传送给服务器处理,get方式直接显示在url地址中,数据可以被缓存,且长度有限制;而post方式数据隐藏传输,_html表单的处理程序有那些

PHP设置谷歌验证器(Google Authenticator)实现操作二步验证_php otp 验证器-程序员宅基地

文章浏览阅读1.2k次。使用说明:开启Google的登陆二步验证(即Google Authenticator服务)后用户登陆时需要输入额外由手机客户端生成的一次性密码。实现Google Authenticator功能需要服务器端和客户端的支持。服务器端负责密钥的生成、验证一次性密码是否正确。客户端记录密钥后生成一次性密码。下载谷歌验证类库文件放到项目合适位置(我这边放在项目Vender下面)https://github.com/PHPGangsta/GoogleAuthenticatorPHP代码示例://引入谷_php otp 验证器

【Python】matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距-程序员宅基地

文章浏览阅读4.3k次,点赞5次,收藏11次。matplotlib.plot画图横坐标混乱及间隔处理_matplotlib更改横轴间距

docker — 容器存储_docker 保存容器-程序员宅基地

文章浏览阅读2.2k次。①Storage driver 处理各镜像层及容器层的处理细节,实现了多层数据的堆叠,为用户 提供了多层数据合并后的统一视图②所有 Storage driver 都使用可堆叠图像层和写时复制(CoW)策略③docker info 命令可查看当系统上的 storage driver主要用于测试目的,不建议用于生成环境。_docker 保存容器

随便推点

网络拓扑结构_网络拓扑csdn-程序员宅基地

文章浏览阅读834次,点赞27次,收藏13次。网络拓扑结构是指计算机网络中各组件(如计算机、服务器、打印机、路由器、交换机等设备)及其连接线路在物理布局或逻辑构型上的排列形式。这种布局不仅描述了设备间的实际物理连接方式,也决定了数据在网络中流动的路径和方式。不同的网络拓扑结构影响着网络的性能、可靠性、可扩展性及管理维护的难易程度。_网络拓扑csdn

JS重写Date函数,兼容IOS系统_date.prototype 将所有 ios-程序员宅基地

文章浏览阅读1.8k次,点赞5次,收藏8次。IOS系统Date的坑要创建一个指定时间的new Date对象时,通常的做法是:new Date("2020-09-21 11:11:00")这行代码在 PC 端和安卓端都是正常的,而在 iOS 端则会提示 Invalid Date 无效日期。在IOS年月日中间的横岗许换成斜杠,也就是new Date("2020/09/21 11:11:00")通常为了兼容IOS的这个坑,需要做一些额外的特殊处理,笔者在开发的时候经常会忘了兼容IOS系统。所以就想试着重写Date函数,一劳永逸,避免每次ne_date.prototype 将所有 ios

如何将EXCEL表导入plsql数据库中-程序员宅基地

文章浏览阅读5.3k次。方法一:用PLSQL Developer工具。 1 在PLSQL Developer的sql window里输入select * from test for update; 2 按F8执行 3 打开锁, 再按一下加号. 鼠标点到第一列的列头,使全列成选中状态,然后粘贴,最后commit提交即可。(前提..._excel导入pl/sql

Git常用命令速查手册-程序员宅基地

文章浏览阅读83次。Git常用命令速查手册1、初始化仓库git init2、将文件添加到仓库git add 文件名 # 将工作区的某个文件添加到暂存区 git add -u # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,不处理untracked的文件git add -A # 添加所有被tracked文件中被修改或删除的文件信息到暂存区,包括untracked的文件...

分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120-程序员宅基地

文章浏览阅读202次。分享119个ASP.NET源码总有一个是你想要的_千博二手车源码v2023 build 1120

【C++缺省函数】 空类默认产生的6个类成员函数_空类默认产生哪些类成员函数-程序员宅基地

文章浏览阅读1.8k次。版权声明:转载请注明出处 http://blog.csdn.net/irean_lau。目录(?)[+]1、缺省构造函数。2、缺省拷贝构造函数。3、 缺省析构函数。4、缺省赋值运算符。5、缺省取址运算符。6、 缺省取址运算符 const。[cpp] view plain copy_空类默认产生哪些类成员函数

推荐文章

热门文章

相关标签