微信
微信扫一扫添加客服
QQ
{{item.nick_name}}
电话
{{item.nick_name}}
{{item.phone}}
返回顶部
客户服务 行业新闻 微软宣布放弃情绪识别技术,AI终究还是读不懂人心
微软宣布放弃情绪识别技术,AI终究还是读不懂人心
发表于2022-06-27 22:01:34

此前在2020年末,一则“戴头盔看房”的视频曾在网络中流传开来,但其中的主人公并非是在搞行为艺术,而是因为彼时售楼处大规模使用人脸识别系统,来区分出消费者是自然到访、还是经过了中介。自此开始,人脸识别技术的滥用不仅让大众抵触,也引发了监管层的警惕,更是直接导致了Meta方面在去年11月下线面部识别系统。
而在日前,又有一家科技巨头对于人工智能技术采集用户生物信息作出了让步。

微软方面在近日宣布,将停止销售基于人脸图像猜测用户情绪的技术,并将不再提供不受限制访问的人脸识别技术,以及限制其他面部识别程序的使用,以确保这些技术符合自己的人工智能道德准则。微软Azure的AI部门首席部门产品经理Sarah Bird在博客文章中表示,“这些努力引发了有关隐私的重要问题,对‘情绪’的定义缺乏共识,以及无法跨越使用案例、地区和人口统计学概括面部表情和情绪状态之间的联系。”
据悉,微软的AI情绪识别技术可以推断出受测者的情绪状态、性别、年龄、情绪,以及其他个人属性,也就是说其甚至已经实现了“察言观色”。事实上,根据英国《卫报》在2019年的相关报道显示,让AI来解读人类情绪已经成为一个规模达到200亿美元的产业,用AI分析消费者的情绪以及预测消费者的行为,或是用AI分析患者的心理健康等应用场景,都已经在逐步落地。

然而为什么如此有前景的技术,微软方面会主动选择放弃呢?这其实是因为在AI情绪识别的实践过程中,无论是从技术角度、还是伦理角度,都存在着不可忽视的缺陷,以至于暂时将其搁置是当下最好的解决方案。
事实上,AI能够“察言观色”,是以计算机视觉和面部表情识别(FER)为基础的。其中,计算机视觉技术能够让机器精确识别人类的面部信息,这也是实现人脸识别的技术基础;而面部表情识别,则是用来分析和解释机器所读取面部表情中蕴含的情绪。作为机器人的AI在觉醒、并产生“灵魂”前,程序依然是经过人类设计的,这就导致AI情绪识别的理论基础其实与人类“读空气”的理论基础一样,是融合了计算机科学与心理学的产物。

那么AI是如何读懂人类的情绪,并做到知人知面又知心呢?相信许多朋友都听过“微表情”这个名词,而其在互联网中则被描述为了一项能够让你“读心”的技术,尽管这显然是很夸张的说法,但其实并非没有科学依据。
据悉,心理学家Paul Ekman早在1976年就基于解剖学,建立了面部表情编码系统(FACS)。该系统按照人的面部肌肉,将人脸划分为大约46个既相互独立、又相互联系的运动单元(AU),并分析了这些运动单元的运动特征以及其所控制的主要区域,与之相关的表情。
例如人在生气时通常会皱眉、眼睑紧张、鼻孔张大,在害怕的时候会出现瞳孔变大、眉毛抬起、嘴巴大开。同时,Paul Ekman等心理学家以及达尔文认为,人类存在6种与生俱来的基本情绪系统,即恐惧、悲伤、愤怒、愉悦、惊讶和厌恶,更复杂的情绪则是这些基本情绪的衍生。而情绪识别技术则是以各种情绪对应的表情与面部肌肉动作为素材,通过标注对于表情对应的情绪标签来对机器进行训练和学习。

简而言之,通过计算机视觉技术,AI能够识别出人类面部肌肉的动作,再基于面部表情编码系统和基本情绪模型,来告诉AI这张图片上反应的是什么样的情绪,久而久之在海量数据的“灌溉”下,AI就能知道人类做出这个表情对应的是什么情绪。虽然看起来这套理论是自洽的,但如果基本情绪系统理论本身存在问题呢?
其实,基本情绪系统的跨文化一致性一直是学界争论的焦点,这种忽略了背景、文化和社会因素的情绪理论,也一直都有反对的声音。美国心理科学协会曾委托五位情感科学不同理论阵营的科学家,进行了数据收集与科学证明,以论证表情与情绪之间的关系。最终论文呈现出的结果,是情绪的表达方式多种多样,很难从一组简单的面部运动中可靠地推断出一个人的感受,也就是表情与情绪之间并没有可靠的科学依据,证明两者直接关联。

参与这一项目的美国东北大学心理学教授Lisa Feldman Barrett就表示,“他们(巨头)能检测到一张愤怒的脸,但这与察觉到愤怒的情绪是两码事”。事实上,基本情绪系统理论之所以被人工智能领域接纳,是因为它正好契合了机器学习的能力范围,六种固定不变情绪的框架下,大规模利用生成对抗网络(GAN)来进行无监督学习的AI情绪识别技术,当然就会迅速“成熟”。
如果仅仅是技术不成熟就罢了,在当下大众对于个人隐私重视程度不断加深,AI情绪识别这种不仅仅存在技术问题,而且与个人隐私关联紧密的技术,更是挑动了许多人的神经。毕竟大家如今对于面部识别就已经很警惕了,情绪这种更私人化的东西自然是更加不希望被科技巨头随意评判。所以在针对科技巨头的反垄断浪潮中,微软方面自然不想、也不愿意与大众对着干。

在机器学习大规模普及前,传统的算法技术局限于人类对于自身的表达,需要设计者明确计算机在给定条件下的给定动作,而现在的算法则突破了人类表达的局限性。这固然带来了效率上的飞跃,但算法虽然是模仿人的思维方式,却无法模仿人的伦理自主性,在算法实现的过程中排除了人类对于伦理逻辑与价值理性的追求。
所以这也是为什么越来越多人对于科技的观感开始趋于负面,并认为科技正在逐渐走向“邪恶”的原因了。