人脸识别碰壁,百度如何“破圈”?

1347次阅读  |  发布于5年以前

训练结果因人而异,也有博主表示,训练数百次也没能让自己的“傻儿子”认识戴口罩的自己。

那么,当人脸识别不再能识别到你的脸,它还会认识你吗?

复工后,人脸识别碰壁了

近年来,随着人脸识别技术成熟度不断提高,相关产品在国内诸如酒店登记、车站人群筛查、公司考勤等场景应用已经十分广泛。以公司考勤为例,据2018年相关产业调研数据显示,人脸识别考勤机出货量已突破百万。

然而,在2020年,一场疫情让国民纷纷戴上了口罩。口罩成为国民“刚需”后,开始频频脱销,而年后复工的你发现,你家公司门口那台你原以为很高科技的人脸识别考勤机已经完全不认识戴着口罩的你。

事实上,佩戴口罩属于大面积遮挡问题,在人脸识别领域是一个公认的难题,难点主要有三个:

人脸识别技术之所有在国内普及速度如此之快,是因为其后有大批互联网公司在推动。BAT在此之前其实都有相关专利在手,疫情期间,也可见腾讯优图推出的“口罩佩戴识别专用AI”、商汤科技公布的“读取眼部、嘴部和鼻部周围240个面部特征点的人脸识别算法”,以及百度视觉团队推出的“戴口罩人脸识别算法”。

当人脸识别,识别的不再是人脸……

1月21日,从北京回到广州的钟南山参加了当地首场新冠肺炎疫情新闻发布会,会上钟南山表示,新冠肺炎已经出现人传人。

也是在这一天,百度视觉团队开始研发“戴口罩人脸识别算法”。

基于这一发现,通过采用基于空间位置的注意力机制特征学习方法,充分获取戴口罩人脸的身份信息。

基于空间位置的注意力机制特征学习

传统直接在人脸上叠加口罩图片的方法,由于人脸姿态变化和不同场景采集图像的分布差异等问题,无法真实模拟实际场景中的戴口罩人脸图片,实验结果表明效果提升非常有限。因此,百度视觉团队采用了基于人脸关键点的三维图像融合技术,不仅解决了人脸姿态变化带来的口罩形变和遮挡问题,同时生成的照片更加自然、真实,最终,通过收集市面上各种颜色、大小和样式的口罩图片,与之前积累的未佩戴口罩人脸图片进行融合,快速合成了各种场景、海量真实的戴口罩训练照片。

合成口罩图片

例如检测算法采用了百度最新的PyramidBox-lite检测算法,并加入超过10万张口罩人脸数据训练,在准确率不变的情况下,召回率提升了30%;口罩分类算法基于人脸关键点网络抽取具有丰富面部语义信息的人脸特征表示,并基于该特征进行口罩遮挡判断,通过PaddleSlim进行模型压缩,模型大小压缩超过3倍。

显然,“戴口罩人脸识别算法”识别的已经不再是人脸,而是“身份信息”相对更为集中的、没有被遮挡的眼部,这样势必会降低人脸识别算法的准确率,为了保证“戴口罩人脸识别算法”的准确率,算法团队也需要花大功夫进一步优化算法。

2月21日,百度视觉团队完成“戴口罩人脸识别算法”的研发和优化,该算法随后也被应用到了百度园区中。

人脸识别碰壁,百度如何“破圈”?

同样被应用到百度自家园区的还有其针对多人、戴口罩、远距离的人脸检测近日推出的“企业AI入场解决方案”。

人脸识别碰壁,百度如何“破圈”?

百度视觉技术,会是别人家的孩子吗

计算机视觉作为当下拥有高商用价值的人工智能技术之一,除被互联网巨头厂商紧盯外,也可见众多AI独角兽企业的步步紧逼。

目前来看,衡量计算机视觉能力强弱可以参照两方面实力,一方面是技术研发能力,另一方是技术商业化能力。

技术研发能力上,百度早在2016年对外开放了其深度学习平台飞桨(PaddlePaddle),在IDC 2019年发布的《深度学习框架和平台市场份额》分析报告中,飞桨平台在国内市场排名第三,与谷歌、Facebook一起坐拥近80%的国内市场份额。

百度在计算机视觉方面的技术能力及相关产品皆基于这一平台打造,在此次“戴口罩人脸识别算法”研发过程中,使用基于百度飞桨(PaddlePaddle)的大规模分类库PLSC,实现了快速对数百万ID的训练数据进行训练;采用飞桨模型压缩库PaddleSlim进行模型搜索与压缩,产出了高性能的人脸识别模型;使用飞桨PaddleLite,实现了云端和移动端的快速部署。并且在2月13日,百度在业内首个宣布开源基于飞桨的口罩人脸检测及分类模型, 该模型可以有效检测密集人流区域中的所有人脸,并判断其是否佩戴口罩,目前已通过飞桨 PaddleHub 对外开源。

此外,计算机视觉顶级学术会议CVPR 2020在近日公布了收录的论文,录取率创下新低,相比去年下降3%,仅有22%,但百度仍有22篇论文入选,其中针对人脸识别和检测被收录的论文提出了在线高质量锚点挖掘策略HAMBox、从单幅图像预测高精度可操控人脸三维模型、大尺度高精度人脸三维模型数据库FaceScape、基于神经网络架构搜索同时搜索适合人脸检测的特征提取器和特征金字塔的BFBox等模型和方法。

技术商业化能力上,此次百度研发的“戴口罩人脸识别算法”也已经与科升智能、十牛信息、华捷电子、智体科技联合在诸如城中村出租屋门禁改造、智慧校园、公共交通人脸识别、出租车驾驶行为分析等应用场景中。此外,在线下门店无感刷脸购物、智慧社区刷脸门禁、企业员工刷脸考勤等应用场景,也已有超过100家开始使用。

由此可见,百度视觉技术及其研发团队,俨然成了别人家的孩子,也正是这些别人家的孩子正在助推计算机视觉在各产业领域持续商业化。

“靠脸吃饭”的时代终将到来

2020年,人脸识别技术已经嵌入到生活中各个方面,解锁手机时需要刷脸、在线支付时需要刷脸、上班打卡时需要刷脸、乘机过安检时需要刷脸;人脸识别技术也在各方面悄悄影响着这个社会,抓捕嫌犯时会用到人脸识别技术筛选罪犯、酒店入住时需用人脸识别技术验证身份。

虽然当下的用户的交互习惯仍停留在按键、触屏、语音交互方式上,“解锁”习惯仍停留在密码、指纹等识别方式上,但是由于人脸识别的便利度和安全性,未来终将会是一个“靠脸吃饭”的时代。

在这之前,如何将视觉算法的复杂环境适应能力、成熟度、安全性做到极致,仍要靠各家的研发团队以及开源力量的长期打磨。

推荐文章

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8