新浪科技

漫画与面孔识别

南方都市报

关注

漫画家给本文作者本·奥斯汀分别绘制了肖像漫画。在这些漫画中,奥斯汀的不同面部特征被夸张放大。

  漫画家给本文作者本·奥斯汀分别绘制了肖像漫画。在这些漫画中,奥斯汀的不同面部特征被夸张放大。

  漫画家给本文作者本·奥斯汀分别绘制了肖像漫画。在这些漫画中,奥斯汀的不同面部特征被夸张放大。

  漫画家给本文作者本·奥斯汀分别绘制了肖像漫画。在这些漫画中,奥斯汀的不同面部特征被夸张放大。

麻省理工学院视觉研究实验室主任帕万·辛纳认为漫画是建造更好的电脑识别系统的关键。今年,辛纳的实验室将启动赫尔希菲尔德计划,分析由几十名艺术家创作的数百幅肖像漫画,从而找到那些对于面孔识别最为重要的面部比例。这张图表显示了部分关键的面孔识别参数,比如两个瞳孔之间的距离;下嘴唇到下巴之间的距离;额头的面积等等。

面孔识别是人类最擅长的技能之一。但是要如何让电脑也获得同样的能力?答案也许可以从漫画中获得。漫画的特点是放大人物的某些显著特征,但有种说法,好的漫画甚至比照片更像本人。因为它抓住了大脑捕捉的关键面部特征。那么有哪些特征是识别面孔的关键呢?科学家试图通过漫画找到答案。

我们的大脑是灵敏到令人惊奇的机器,而识别面孔可能是它最擅长的。在出生几小时后,新生儿的眼睛就被类似面孔的图形所吸引。成年人的大脑只需100毫秒就能判断它看到的是一张面孔,只需要1秒多一点的时间就能识别两张光照条件、角度完全不同的面部照片。神经学家认为在人脑中有一个特别的区域———颞叶梭状回———专门用于面孔识别。

或许,最能说明我们出色的面孔识别能力的当属漫画,哪怕是在几秒钟内勾勒出线条简单人物漫画,也能轻易被我们的大脑识别。人们说,好的漫画比照片更像本人。虽然听上去不可思议,但这一点确实得到研究的证实。在视觉科学领域甚至有一个形容这一现象的专业名词———漫画效应。

人的面孔大同小异:嘴巴上一个鼻子,再上面是两个眼睛,人与人之间的面部特征差别通常只有几毫米。因此,我们的大脑重点寻找的是显著特征,也就是和我们头脑中的理想面孔(我们所见过的所有面孔的平均值)差异最大的地方。换句话说,为了击败视觉专家所谓的雷同问题,我们强调最重要的特征,忽略次要特征。我们对面孔的认知专注于朝天鼻、凹陷的眼睛或是肉乎乎的脸颊,在头脑中将它们夸大。为了识别并记住别人,我们把他们的面孔变成了漫画。

面孔识别科学原本只是人工智能领域一个停滞不前的课题,十年前突然成了事关国家安全的大事。9·11主谋穆罕默德·阿塔经过波特兰机场时被监控录像拍下的模糊画面让美国公众震怒,深受刺激的政客们纷纷拨款资助自动面孔识别系统的研究。人们都以为,几年之内,当所有监控摄像头都配备面孔识别软件后,人群中的每张面孔都会无比突出,它们将像独一无二的指纹一样立刻和嫌疑犯数据库进行对比。

现在,10年过去了,面孔识别系统的表现依然不尽如人意。确实,在数码照片库中,在Facebook上,同一人的照片可以被自动打上标签,准确度还比较令人满意。事实上,最近美国国家标准和技术研究所对面孔识别软件进行了一次测试,其中最好的软件能够比人类更精确地识别面孔,但前提是在受控制的环境下———被拍摄的人必须直视高清晰照相机镜头,不能笑,也不能带有其他任何表情。但是,在现实生活中,电脑需要识别的是视频中的面孔:距离不同,照明昏暗,表情多变,视角各不相同。人眼可以轻易地调整适应这些条件,但对于电脑依然是大难题。

依照目前的技术,在机场拥挤的人群中找到未来的穆罕默德·阿塔并不比10年前容易。2007年,德国联邦警察局对识别软件的测试发现,10张面孔中有8张无法被电脑识别。今年2月,在英国曼彻斯特机场,一对夫妇偶然交换了护照,结果依然顺利通过了电子门,说明对比真人面孔和护照照片的自动系统根本没有发挥作用。

所有这一切引出了一个有趣的问题。或许,要确保机场、国家重要地标的安全,我们需要更多地认识漫画?毕竟,计算机缺少的正是漫画大师的技巧———迅速抓住一张面孔最突出的特征。仅仅有更先进的照相机,速度更快的电脑还不够。要从人群中找到恐怖分子,我们的机器人或许还需要去艺术学院进修。

早在19世纪,执法者就知道夸张的肖像画可以帮助抓坏蛋。1876年,纽约大贪污犯威廉·特维特在西班牙被捕,帮助将其捉拿归案的并非警方素描而是刊登在《哈珀斯》周刊上的一张由托马斯·纳斯特创作的特维特的漫画。今天,虽然多数警察部门使用自动素描软件,绘制出的通常是一张平淡的平均化面孔,要根据它找到嫌犯非常困难。美国司法机构最常使用的素描软件为Identi-K it。就连Identi-K it公司的总裁保罗·怀特也承认,他们的产品的主要功能在于排除大部分非嫌疑犯。“有一半人看到电脑合成的嫌疑犯图像会说它看上去像罗德尼·达戈菲尔德(美国喜剧演员),另一半人说它像前总统比尔·克林顿。但它并不是毫无用处,至少它不像杰克·尼科尔森(美国演员)。”

如果有机会参加国际漫画家协会(ISC A)的年度大会,你会发现漫画家们描绘自己的技能时还算谦虚。比如史蒂芬·西尔弗20年前在海洋世界给人画肖像漫画,现在为电视动画设计角色。他说,“如果今天警察用漫画抓坏蛋,人们反应肯定是‘这是什么,是开玩笑吗?’但是,警察能够抓住坏蛋。如果用我画的漫画,那么只能说那个嫌犯很倒霉。”

最近一次ISC A年会在拉斯维加斯举行,有来自13个国家的188名艺术家参加。西尔弗就是其中之一。在聚会期间,艺术家们两两配对,互相画漫画。在5天的时间里,他们不断地变化搭档,每个人的面孔以各种你能想象到的角度被绘成漫画。最后的作品公开展出,由与会者投票选出优胜者。第一名将获得金鼻子奖。2000年,这一殊荣被西尔弗获得。这和他的出色技能分不开。扫描整个房间形形色色的脸孔,他能一眼就抓住每张面孔的突出特征。

“我不在乎眼睛周围有多少条皱纹,”他说,“这类特征对我毫无用处。我们识别面孔是通过基本形状。”他瞄上了大厅另一头的一个红发女人。“注意到了吗,她的肉都长在脸周围?五官被挤到了中间。”然后,他的目光又注意到一名正在画画的非裔女子。西尔弗指出,她的头很小,但是从她的下嘴唇到脖子的线条却非常突出。

这种抓住第一眼突出印象的能力正是电脑所欠缺的。“漫画家们最神奇的地方在于,他们能够迅速发现某人最突出的地方,”马萨诸塞州大学电脑视觉实验室的埃里克·勒尔德-米勒说,“我们仍然不知道要如何让计算机也办到这一点。很多人在勤奋地编写软件,试图找到一个人区别于他人的两三种特征组合。”

在英国中央兰开夏大学,心理学高级讲师查理·弗劳德曾利用漫画的面孔识别诀窍创造更好的嫌犯素描软件。他的系统叫做EvoFIT,能够生成一系列的动画肖像,每一张肖像都比前一张的特征更夸张。弗劳德的研究发现,我们每个人都以漫画的方式存储图形记忆,只是每个人夸张的程度不一样。EvoFIT绘制出不同夸张程度的肖像,不同的观众可以从中找到自己觉得识别度最高的。在测试中,弗劳德的技巧将面孔识别率从3%提高到了30%接近40%。

要让电脑取得类似的结果,科学家需要更完美地套用漫画家的天才。听一些漫画家讲述他们的神秘技能养成过程,你会认为这几乎是不可能的任务。2008年的金鼻子奖得主贾森·希勒回忆起,他从中学就开始刻意训练自己的大脑,直到获得“第二视觉”。“还记得吗,在影片《黑客帝国》的末尾,当基努·李维斯扮演的尼奥看到四周都有代码不断落下,他突然意识到,他就是the O ne?”希勒说,“就是这样的感觉。”另一位来自芝加哥的漫画高手罗杰·赫塔多也经历了类似的转变。“突然之间,所有人都变成了漫画,”他说,“这种视觉甚至无法屏蔽掉,你开始对人脸的所有小细节极其敏感,别人甚至根本不会注意的细节,”他补充说,“这让约会变得非常困难。”

但是,当你和这些艺术家谈论他们的创作过程时,你意识到心理学家早已琢磨出了基本原理。2005年的金鼻子奖获得者科特·琼斯在教导年轻艺术家时,给出的诀窍和视觉科学家完全一样。他告诉学生,想象一张普通面孔,然后注意描绘对象和这张面孔之间的差异:“这张普通面孔是所有面孔的参照。”

同样地,正如视觉科学家所预言的,要给对称的面孔———那些更接近我们心目中的普通模板的面孔———画漫画尤其困难。参加ISCA大会的漫画家提到给凯蒂·佩里(美国女歌手)和布拉德·皮特(美国演员)画漫画的艰难。大会的特邀发言人动画大师比尔·普林普顿则告诉我,演员迈克尔·凯恩也很让漫画大师们头痛。这也是为什么,面孔最不对称的人在ISCA大会结束时是被描绘得最多的人,大厅里张贴着有关他的33张漫画。来自蒙特利尔的三维动画设计师克里姆·耶尔迪兹就是一个广受欢迎的原型。他不仅有一个大鼻子,一名漫画家告诉我耶尔迪兹有一张“大鼻子+浓眉毛+眼镜+马尾头+疯狂络腮胡”的面孔。本身就是漫画家的耶尔迪兹明白自己面孔的吸引力。“我的特征都长到了外面,”他说,“这很酷。我喜欢。”

“很多人认为漫画就是抓住某人最丑的特征,竭尽所能地夸张,”西尔弗说,“这是不对的。漫画的真谛在于发现真相,推向极致。”

在ISCA大会上,那些能够赋予面孔以生命的艺术家们的背景各不相同,是一群千奇百怪,极具个性的人物。安吉·乔丹在军队服役时,有人让她“给上尉画一幅画,但要画得有趣一点”,那就是她的漫画生涯的开始。在大会期间,罗杰·赫塔多还抽空为一家比萨饼店画宣传画。还有一群来东京某所漫画学校的艺术家们似乎时刻都在画画。还有一位自称Toram aru的日本漫画家把自己打扮成了一只老虎,穿了一身毛茸茸的虎皮外套,包括虎头帽和虎脚形状的靴子。

有一群来自圣迭戈游乐园的漫画家自称“兽头”。从风格上说,这些来自游乐园的艺术家可能是最大胆的。兽头成员之一布莱恩·奥克斯在游乐园工作前在一家墨西哥餐厅工作。在他的漫画中,Toram aru趴在H elloK itty的背上,正在干坏事,他的虎掌拍在K itty的屁股上,无生气的老虎帽子和下面大汗淋漓的面孔形成鲜明对比。

一天下午,艺术家们聚集在酒店舞厅,举行“看谁画得像”比赛。每个人有5分钟的时间参照一幅肖像照片创作漫画。在开始前,比赛规则让大家纠结了一阵。一名第一次参加大会的新手问,“是不是看谁画得最接近真实照片。”大会主席罗杰·鲍尔立刻纠正说,“这是漫画家之间的比赛,你认为呢?”

第一张照片是一名咧着嘴大笑的年轻女子,她头上还戴着一顶小小王冠。比赛开始。在漫画家们画板上,她的头变成了钻石形状,眼睛笑成了一条缝,面颊鼓起,两排整齐的牙齿占据了至少1/3的画纸。鲍尔在上面大叫,“不要作弊。不要偷看。”一名参赛者在面孔周围画了一圈星星。布莱恩·奥克斯的漫画中,这名女子的头很小,却有一对巨大的胸脯。来自罗马尼亚的漫画家丹尼尔·阿尔马里很快就吸引力一群围观者。首先他的画是明显的冠军争夺者。其次,他的绘画方式也很夸张:他举起画纸,似乎在对着阳光仔细研究作品,一会眯起眼睛,一会抬起一条眉毛,一会把眉毛皱成倒U形。阿尔马里曾这样评论自己的艺术:“我的作品带有丰富表情,”这似乎既是对他的画也是对他的创作方式的描述。

第二张照片是酒店大厨,最棒的作品全部抓住了他的狭长形方脸,五官似乎都集中于面部下方。人们再次被阿尔马里和他的作品所吸引。他画的大厨表情生动,似乎在洋洋自得地傻笑,脸颊的曲线夸张得恰到好处。果然,阿尔马里最终获得“看谁画得像”大赛的冠军。

从这些根据相同照片绘制的不同漫画中,我还看到了视觉科学家所谓的“其他种族效应”。一直以来,人们总认为其他种族的人长得都差不多。理论认为,我们根据周围看到的和自己相似的人形成我们心目中的平均面孔。由于其他种族的人可能和我们差异巨大———而且有差别的地方似乎都差不多,因此根据头脑中的平均面孔,我们往往忽略那些识别“其他种族”的重要性信息。在几幅粗糙的大厨漫画中,这位非裔男子被画成了厚嘴唇,宽鼻子,完全不像本人。

屏幕上显示的最后一张照片是一名包着头巾的老年白人妇女。罗伯特·鲍尔宣布,这是他的母亲,过去几个月一直在接受放射治疗;他打算将漫画作为圣诞节礼物送给她。后来,当所有漫画被放在地板上等待评判时,鲍尔走到一张画旁边,宣称这张画堪称惟妙惟肖:“看到它似乎看到了我母亲本人。”鲍尔有一家漫画家中介公司。他说,要画得和本人神似,关键在于抓住五官之间的关系。“这是人类大脑识别面孔的方式:当五官之间的比例正确时,面孔很容易识别。”

在他讲话时,我注意到地上的两张鲍尔假装忽视的漫画。它们的创作者是圣迭戈的“兽头”团体成员。一张把他的母亲画成了近似蜥蜴的外星人,一对纤细的罗圈腿,裙子的皱褶中长出一个成年人的脑袋,几乎和我身旁40岁的男子一模一样:后退的发际线、精心修剪的山羊胡、一个土豆式的鼻子。另一张画上只有一块破土而出的墓碑。“关键在于比例。”鲍尔还在旁边强调。

你是否听说有一个视觉科学家只用漫画家做实验对象?麻省理工学院视觉研究实验室主任帕万·辛纳是全美最前卫的电脑视觉研究者之一,他深知幽默、古怪、夸张是漫画的本质。他自己偶尔也为学校刊物创作漫画。但辛纳也认为,这些简单的、夸张的画作能够被客观地系统地研究,并帮助揭示人类和机器视觉的秘密。今年,他的实验室准备用计算机分析几十位漫画家创作的几百幅漫画,希望从中找到漫画家们的直觉知识———对于面孔识别,什么特征是最重要的,什么不重要。他将这个工作命名为赫尔希菲尔德计划,得名于著名的《纽约时报》漫画家阿尔·赫尔希菲尔德。

简单地说,赫尔希菲尔德计划逆向分析漫画家的创作过程。通过分析漫画,辛纳希望找到那些反复出现的夸张部分。他认为,最终将得到20多种对于面部识别最为重要的面部特征,以及它们各自的重要程度。辛纳说,“这将是揭开面孔密码的配方。”在初步实验中,实验室已经分离出一些重要元素———比如,鼻子根部与嘴巴的距离和前额高度之比。辛纳决定将它们命名为赫尔希菲尔德特征。

在任意一张面孔上,和标准面孔相比,20种赫尔希菲尔德特征中有4个的值偏大。在另一张面孔上,可能是另外几个特征大于平均值。但是无论在哪种情况下,关键都在于抓住夸大的部分。今天的现实是,自动面孔识别系统必须将目标面孔和视频中几百万张不停在运动的面孔进行比较。但是,迄今为止,面对种种目不暇接的变数,软件不知道到底该比较什么。通过赫尔希菲尔德特征,辛纳希望计算机能关注那些对于面孔识别最为重要的特征,排除其他干扰因素。

在漫画家大会闭幕几周后,我带着一些在拉斯维加斯拍摄的视频去麻省理工学院拜访辛纳和他的几名学生。他们对于速度比赛尤其感兴趣。这比“看谁画得像”比赛更激烈、更紧张。规则是看谁能在5分钟的时间内画出最多张可以识别出描绘对象的漫画。选手们像蜂鸟一样忙碌,很快,地板上就堆满了完成的素描。打扮成老虎的Toram aru是最先进入最后一轮的前8名选手。比赛进行到3分钟时,他扬起头,发出了一声虎啸。2008年的速度比赛冠军史蒂夫·多利斯大腹便便,穿着一件幼稚的忍者神龟图案T恤,紧张得加快了呼吸频率。一名叫比吉·霍恩的选手为了加快速度,总是采用相同的画画步骤:反时针方向画一条线代表脸的一侧,然后依次画眼睛、鼻子、嘴巴,有时,某个面部器官夸张到占据了其他器官的位置。最终的获胜者叫尤尼·胡,她在5分钟内完成了21张可以识别的漫画,平均每张用时14秒,堪称肖像漫画界的飞人。

辛纳最关心的是当从漫画中可以辨别出本人的那个时刻,当寥寥几笔勾勒让一张面孔跃然纸上的时刻。这一刻发生得太快,我们不得不再次用慢速观看视频。一名选手在一个棱角尖锐的下巴上画了一张大笑的嘴巴,与本人的相似之处立刻明显起来。另一位选手画了个平头,然后从左眼角旁画下一条L形的鼻子,立刻,画像就有了本人的影子。还有一位选手仅仅画了一条下颌线,上嘴唇和一只无精打采的眼睛———画中人是谁已经无需说明。看着这些简单数笔勾勒而成的面孔,辛纳突然有了一个点子:为什么不对ISCA大会创作的作品进行分析。

他的学生建议说,更好的办法也许是研究这些漫画家的大脑。在脑电图的帮助下,他们可以知道,一幅漫画需要哪些特征才能激活N 170———一种当人们看到一张面孔后产生的关键神经反应。通过功能核磁共振成像,可以观察当漫画家在区分熟悉和不熟悉的面孔时,大脑中是否出现不寻常的神经活动。

博士后尤里·奥斯特洛夫斯基提到最近的一项研究显示,一些具有“超级面孔识别能力”的人,他们脑部负责面孔识别的区域比普通人要大。“很可能,漫画家的这个区域也比较大,”他说,“我们可以研究看看,辛纳。我们只需要在下次大会时把我们的脑部扫描仪带去。”

编译:宇

加载中...