欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python人脸识别表情检测器(3): 特征值提取

程序员文章站 2024-03-09 13:36:05
...

全民制作人大家好,我是练习时长两年半的程序爱好者,,喜欢吃,喝,拉,撒。music~

原理介绍

表情检测器,看的是什么,不就是脸上数值的一些变化吗?比如说,我一看你,嘴巴咧开,在大喊着什么,我就知道你要说奥力给!了。 呵呵。开个玩笑,不过大致就是这个意思。总之,原理就是记下关于脸上器官的数据。接下来就是实际演示了啊~

实践方法

还记得我们上一篇文章有一个语句就是介个????

shape=self.predictor(im_rd,d)

这个就是记录下来68点的坐标值,嘿!有一个值把这些记录下来,不就好多了吗?诶呀,那我们就做一个简单的程序吧。一直我们有一个程序是这个亚子的

import cv2
import dlib
import numpy
from sklearn import svm

class Face_Learn():
    def __init__(self):
        self.detector=dlib.get_frontal_face_detector()#加载dlib检测器
        self.predictor=dlib.shape_predictor("lian xi shi chang liang nian ban")#自己加载地址
        self.cap=cv2.VideoCapture(0)#连接摄像头
        self.cap.set(10,0)

    def test(self):
        while(self.cap.isOpened):
            flag, im_rd = self.cap.read()#获取图像
            k = cv2.waitKey(1)#一毫秒的延迟
            img_gray = cv2.cvtColor(im_rd, cv2.COLOR_RGB2GRAY)#取图像灰度
            dets=self.detector(img_gray,0)#检测是否有脸
            font = cv2.FONT_HERSHEY_SIMPLEX#加载显示要用的字体
            if (len(dets))!=0:#如果有脸
                for i in range(len(dets)):#对每一个脸挨个的处理
                    for k, d in enumerate(dets):#获取脸的特征值
                        cv2.rectangle(im_rd, (d.left(), d.top()), (d.right(), d.bottom()), (0, 0, 255))#框出人脸
                        shape = self.predictor(im_rd, d)#获取脸68点的坐标值
                        for i in range(68):
                            cv2.circle(im_rd, (shape.part(i).x, shape.part(i).y), 2, (0, 255, 0), -1, 8)#用圆圈分布在68点上
                            cv2.putText(im_rd, str(i), (shape.part(i).x, shape.part(i).y), cv2.FONT_HERSHEY_SIMPLEX, 0.5,
                                       (255, 255, 255))#将数字分布在68点
                cv2.imshow("camera",im_rd)#显示出图像   
if __name__ == "__main__":
    face=Face_Learn()
    face.test()

那我们就需要加一些东西了,首先要了解的东西是人脸的68点
python人脸识别表情检测器(3): 特征值提取
图片来源:https://cloud.tencent.com/developer/news/261403
如果我们想知道嘴巴的宽度,需要加一些什么呢?首先我们知道要获取横向的,所以肯定是什么x, 这里就要交大家一个函数,那就是shape.part(), 可以直接获取各个点的
坐标值。那么看好了,骚操作又来辣!

mouth_width=shape.part(54).x-shape.part(48).x

这个就是求出横向的数值。那一张图像理解就是
python人脸识别表情检测器(3): 特征值提取
这个就是图片形式的,想必以及比较清楚了。那么基础的东西就已经讲完了,接下来的话,就是通过提取眉毛,嘴巴宽度,嘴巴高度,眉毛之间的距离来判断表情。把这个程序放进我们的总程序就变成了

import cv2
import dlib
import numpy
from sklearn import svm

class Face_Learn():
    def __init__(self):
        self.detector=dlib.get_frontal_face_detector()#加载dlib检测器
        self.predictor=dlib.shape_predictor("f:\\shape_predictor_68_face_landmarks.dat")#自己加载地址
        self.cap=cv2.VideoCapture(0)#连接摄像头
        self.cap.set(10,0)

    def test(self):
        while(self.cap.isOpened):
            flag, im_rd = self.cap.read()#获取图像
            k = cv2.waitKey(1)#一毫秒的延迟
            img_gray = cv2.cvtColor(im_rd, cv2.COLOR_RGB2GRAY)#取图像灰度
            dets=self.detector(img_gray,0)#检测是否有脸
            font = cv2.FONT_HERSHEY_SIMPLEX#加载显示要用的字体
            if (len(dets))!=0:#如果有脸
                for i in range(len(dets)):#对每一个脸挨个的处理
                    for k, d in enumerate(dets):#获取脸的特征值
                        cv2.rectangle(im_rd, (d.left(), d.top()), (d.right(), d.bottom()), (0, 0, 255))#框出人脸
                        shape = self.predictor(im_rd, d)#获取脸68点的坐标值
                        for i in range(68):
                            cv2.circle(im_rd, (shape.part(i).x, shape.part(i).y), 2, (0, 255, 0), -1, 8)#用圆圈分布在68点上
                            cv2.putText(im_rd, str(i), (shape.part(i).x, shape.part(i).y), cv2.FONT_HERSHEY_SIMPLEX, 0.5,
                                       (255, 255, 255))#将数字分布在68点
                        mouth_width=shape.part(54).x-shape.part(48).x
                cv2.imshow("camera",im_rd)#显示出图像   
if __name__ == "__main__":
    face=Face_Learn()
    face.test()

那么,在循环的时候就会不断地计算嘴巴的宽度。那么也连带着计算所有其他的特征值。写完之后整个代码后长这样。

import cv2
import dlib
import numpy
from sklearn import svm

class Face_Learn():
    def __init__(self):
        self.detector=dlib.get_frontal_face_detector()#加载dlib检测器
        self.predictor=dlib.shape_predictor("f:\\shape_predictor_68_face_landmarks.dat")#自己加载地址
        self.cap=cv2.VideoCapture(0)#连接摄像头
        self.cap.set(10,0)

    def test(self):
        while(self.cap.isOpened):
            flag, im_rd = self.cap.read()#获取图像
            k = cv2.waitKey(1)#一毫秒的延迟
            img_gray = cv2.cvtColor(im_rd, cv2.COLOR_RGB2GRAY)#取图像灰度
            dets=self.detector(img_gray,0)#检测是否有脸
            font = cv2.FONT_HERSHEY_SIMPLEX#加载显示要用的字体
            if (len(dets))!=0:#如果有脸
                for i in range(len(dets)):#对每一个脸挨个的处理
                    for k, d in enumerate(dets):#获取脸的特征值
                        cv2.rectangle(im_rd, (d.left(), d.top()), (d.right(), d.bottom()), (0, 0, 255))#框出人脸
                        shape = self.predictor(im_rd, d)#获取脸68点的坐标值
                        for i in range(68):
                            cv2.circle(im_rd, (shape.part(i).x, shape.part(i).y), 2, (0, 255, 0), -1, 8)#用圆圈分布在68点上
                            cv2.putText(im_rd, str(i), (shape.part(i).x, shape.part(i).y), cv2.FONT_HERSHEY_SIMPLEX, 0.5,
                                       (255, 255, 255))#将数字分布在68点
                        mouth_width=shape.part(54).x-shape.part(48).x
                        mouth_height=shape.part(57).y-shape.part(51).y
                        brow_dis=shape.part(22).x-shape.part(21).x
                cv2.imshow("camera",im_rd)#显示出图像   
if __name__ == "__main__":
    face=Face_Learn()
    face.test()

整个这些东西都是提取特征值,在介绍玩算法后,即将介绍更多的特征值,目前这些只是一部分比较标志性的特征值。
好了,特征值提取部分就到这里了。下一期就是介绍算法了,拜拜
ヾ(•ω•`)o