10th Apr 2008

人脸识别入门

自然造物的神奇和人脸识别(图缘可以轻松识别这张“人脸”)

人脸检测和人脸识别

人脸检测就是在照片里面把人脸找到,人脸识别就是要判断找到的人脸是谁的脸。从技术角度来说,人脸识别的难度要大的多,还是实验室里面一个没有很好解决的问题,更不要说拿出来识别海量的真实数据了。

标准照和生活照

实验室里面做研究用的是标准照,也就是所谓的“身份证”照,标准姿态,标准表情,标准光照下的正面大头照。即便是这样苛刻的条件,在人脸数超过了几千到几万的数量级以后,识别的准确度也会严重下降。而图缘面对的是海量的生活照,任意姿态,任意表情,任意光照,任意清晰度的各种各样来源的照片,这使得我们面临着一个几乎无法完成的任务。

人脸检测

在照片里面把人脸找到相对简单一些,其具体作用原理有点像老式电视机里面的电子枪,一行一行地扫过屏幕。因为人脸都长的差不多(猪八戒,牛魔王等非主流帅哥除外),人脸检测就是拿一个人脸的模子一行一行的扫过照片,看哪个区域匹配上了就认为那里是一张人脸。这个模子的大小有个范围,显然下限越小,扫描的时间越长。旋转的人脸和侧脸也是可以发现的,但是效率较差,如果对性能要求比较高的话,有时候会略去不算。

人脸识别

人脸识别分两步,第一步是人脸库的建立,第二步是新的人脸和库里的人脸比对。比如说一个办公楼的门禁系统,第一步是把这个楼里面所有上班的人的人脸输入到系统里面去,然后每个人早上来上班的时候,摄像头拍到他的人脸和系统里这些比对一下,系统来判断是不是这个库里面的人。

所以要想体验图缘的人脸识别功能,先要帮助我们把你和你亲友的人脸加入到我们的“人脸库”里面。

人脸识别的难点

随着人脸库里面人数的增多,一个人的不同照片上人脸之间的差异很可能大于不同人的人脸之间的差异,这个原因使得人脸识别变得异常困难。实验室里面限制条件(标准表情,正面照,等等)就是要减少这种差异,而图缘面对的是生活照,完全没有这些条件。也正是因为这个原因,在人数达到一定数目之后,判断是不是同一个人变得很容易出错,因为这张要分辨的人脸和另一个人的差别可能已经比他和他自己的差别还要小了。

那图缘是怎么做到的呢?

答案是,我们已经首次在世界上实现了一个真正的图灵机!

我当然是在开玩笑,图灵和图缘其实并没有什么血缘关系。图缘的人脸识别系统是我们团队长期艰苦努力搞出来的一个精妙的玩意。它当然没有神奇到可以从上百万的人群里面把你认出来,但它很好的实现了在一个相对小的范围内的人脸识别。它是智能的,个性化的,分布式的,并可以无限扩展的人脸识别系统。

未来要做的事

在人脸识别领域可以做的事情太多太多,我们实现的应该还远远不到十分之一。我们未来要做的事情就是努力提高识别的准确度,努力简化用户的操作,并努力提供一个可以给你带来丰富体验的照片共享社区。

哦,你问我做好了这些之后?那我们就要开始研究物体的识别,这样机器就可以识别鲜花,大海,跑车,美食… … 我们就可以真正实现机器视觉,电脑就可以“看到”它周围的世界,并进而可以实现更复杂的任务,开始步入人工智能时代!

呵呵呵,我退休后就去写一本科幻小说。

2 Responses to “人脸识别入门”

  1. 图缘博客 » Blog Archive » 图缘人脸识别演示 Says:

    […] 人脸识别入门 […]

  2. Joe Says:

    马上试试,感觉悬呼的。

    ———————————
    To Know/To Live
    http://www.liveinsuzhou.com

Leave a Reply