用HTML5实现人脸识别

程序员文章站 2022-04-14 10:28:34

注：今天html5小组沙龙《论道html5》分享时有朋友问到一个问题，getusermedia是否会支持人脸识别，我当时的答案是这应该是应用来实现的功能，而不是规范要完成的...

注：今天html5小组沙龙《论道html5》分享时有朋友问到一个问题，getusermedia是否会支持人脸识别，我当时的答案是这应该是应用来实现的功能，而不是规范要完成的工作。而我之前在网上看到过一篇关于getusermedia和人脸识别的相关文章，觉得很有趣，正好趁这个机会分享给大家。

译自：http://www.raymondcamden.com/index.cfm/2012/4/6/face-detection-with-getusermedia

“现代web”不断发展出不少有趣的api，但你并不会在大多数项目中使用到所有的内容。例如我一直特别关注canvas特性。它对游戏和绘图意义重大 - 但是仅此而已。它并不是一个不好的特性，我只是不会经常用到它。每当看到一些开发中酷炫的新功能，我的大脑里都会思考它们可以产生哪些实际用途。显然对你有价值的内容可能对我来说并不一定，但搞清楚我如何实际使用一个功能是我学习它的一部分。

其中的一个特性是getusermedia（ w3c规范 ）。它是一个javascript api，可以让你访问（需要权限）用户的网络摄像头和麦克风。目前opera和chrome（我相信现在的版本18可以支持，但是你可能需要使用canary。你还需要启用它。这儿有一个。）一旦你启用了getusermedia，它使用起来相当简单。这里有一个快速的访问请求：

//a video tag
var video = document.getelementbyid('monitor');

//request it
navigator.webkitgetusermedia('video', gotstream, nostream);

function gotstream(stream) {

    video.src = webkiturl.createobjecturl(stream);
    video.onerror = function () {
        stream.stop();
        streamerror();
    };
}

function nostream() {
    document.getelementbyid('errormessage').textcontent = 'no camera available.';
}

function streamerror() {
    document.getelementbyid('errormessage').textcontent = 'camera error.';
}
        getusermedia的第一个参数是类型。根据规范，这应该是一个对象，你可以启用音频、视频，或两者兼而有之，像这样：{audio:true, video:true}。然而在我的测试中，传递一个字符串“video”也可以正常工作。你将看到的演示基于另一个演示，所以代码来自于一个较早的chrome下的版本。第二个和第三个参数是操作成功和失败的回调函数。

你可以看到操作成功的事件处理函数将视频流分配给html5 video标签。最酷的是，一旦运行起来，你就可以使用canvas api来拍照。对于这个演示，可以看看greg miernicki的demo：
用HTML5实现人脸识别

http://miernicki.com/cam.html

如果这个demo无法工作，可以按照下面的说明来开启getusermedia支持后再次进行尝试。（虽然我打算分享一些屏幕截图，所以如果你只是想继续，那也没关系。）

基于greg的demo，我突然想到可以用网络摄像头的照片做一些很酷的东西。我记得face.com有一个非常酷的api来解析脸部的图片。（我11月曾经在博客里写了一个coldfusion的例子。）然后我在想，是否我们能把greg的demo与face.com的api结合起来做一些基本面部识别的demo。

这有这几个重大问题。第一 - face.com有一个很好的rest api，我们将如何从javascript应用程序里面来调用它？其次 - face.com需要你可以上传图片，或给它一个网址。我知道可以把一个canvas图片发送给服务器，并通过我的后台上传到face.com，但有没有办法绕过服务器来把图片发送给这个api？

第一个实际上并不是问题。face.com实现了cors（跨域资源共享）。cors基本上可以让服务器暴露给其它域上文件的ajax调用。这是一个伟大的功能，我希望更多的服务能够使用它。

更复杂的问题则是如何把画布上的数据发送到face.com（宇捷注：还可以参考我的这篇文章《如何使用html5实现拍照上传应用》）。我如何模拟文件上传？这里有另一个很酷的新技巧 - formdata。coldfusion的研究员sagar ganatra关于这个话题有一篇很棒的博客。下面展示了我如何使用它：

我创建了一个新的formdata对象，然后简单地设置了自己所需的值。你可以看到我为发起的api请求添加了几个参数，但关键在于文件名和文件对象本身。

接下来你可以看到简单的jquery ajax调用。face.com有多种选择，但我基本只要求它返回预测年龄、性别、情绪，是否面带微笑以及戴着眼镜。就是这些。我得到了一个很棒的json包，并且对它进行了格式化。

现在显然api并不完美。我获得了使用api一些不同程度的结果。有时相当准确，有时相反。但是总体来说，这相当酷。这里有一些实际测试的图片，看起来有点“可怕”。

识别结果：neutral（无表情）

用HTML5实现人脸识别

识别结果：happy（开心）

用HTML5实现人脸识别

识别结果：surprised（惊讶）

用HTML5实现人脸识别

识别结果：surprised（惊讶）

用HTML5实现人脸识别

识别结果：sad（悲伤）

好了，准备自己亲自来试试？只需点击下面的演示按钮。如果需要源代码，可以直接在页面上查看！这是100％的纯客户端代码。

如果想从另外一方面了解getusermedia，可以看看这些例子：

感谢getusermedia（html5doctor的这篇文章不错，可以了解到getusermedia的前世今生，以及和html media capture api的区别。）
在chrome上测试webrtc
html5新特性：webrtc和设备访问
用html5捕获音频和视频

摘自：http://blog.csdn.net/hfahe/article/details/7485452

上一篇： JS中的BOM操作解析

下一篇： Docker到底影响了什么？

用HTML5实现人脸识别

python实现人脸识别代码

python+opencv实现的简单人脸识别代码示例

如何通过python实现人脸识别验证

Python opencv实现人眼/人脸识别以及实时打码处理

人脸检测识别opencv+python实现（Haar分类器）

OPENCV+JAVA实现人脸识别

python3+dlib实现人脸识别和情绪分析

用HTML5实现鼠标滚轮事件放大缩小图片的功能

Html5调用手机摄像头并实现人脸识别的实现

微信小程序实现人脸识别登陆的示例代码