视觉识别 让生活更加智慧
近日,智能化垃圾分类箱亮相重庆。
不久前,北京市通州区的王先生换了一把嵌入了人脸识别模块的智能门锁,解决了他长久以来的烦恼:“父母记性不好,好几次出门都忘带钥匙,被锁在门外。现在一刷脸,门就能开了。”
除了识人,视觉识别技术还能识车、识别商品。作为人工智能的一大重要应用领域,未来,随着视觉识别精度的提高和应用环境的逐渐完善,它还将给人们带来更加智慧安全的体验。
识人:静态识别比较成熟,动态识别有待完善
人脸识别是视觉识别相对成熟的应用场景,其基本原理是,通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸部的五官位置、脸型和角度等信息进行计算分析,进而和自身数据库里的范本比对,从而判断出用户的身份。
人脸能替代身份证、账号密码等认证信息,源于它作为生物识别特征具有高度的唯一性。以乘车安检为例,通过精准的人脸识别技术,让乘客面部数据与后台数据进行比对,快速完成1对1的静态认证,从而实现安全便捷、智能高效的通行。金融验证、办公考勤、交通出行等领域,应用的正是人脸识别这一特性。
除身份信息认证外,人脸识别还可用于对特定人群的监测,实现1对N的动态比对:从海量的人像数据库中,找到与寻找对象符合的人脸数据图像,并进行匹配。借助智能摄像头捕获或扫描人脸信息,人们可以在茫茫人海中找到失散的亲人,公安人员可以在人流中锁定、追捕犯罪分子。
此外,通过对场景内所有人进行面部识别并与人像数据库匹配,还可以实现M对N的比对。
腾讯优图实验室研究员王川南说,人脸识别技术发展至今,在可控的环境下,1对1的静态识别已经比较成熟,动态识别相对来说难度大一些。“比如,人脸识别的精准度受到光照、表情姿态和图像质量等因素的影响。此外,目前多数的人脸识别算法主要针对正面或接近正面的人脸图像,当发生俯仰、侧面等情况,识别精度将打折扣。同时,由于采集设备不同,获取的人脸图像质量也不一样,怎么有效识别分辨率低、质量差的人脸图像,是业界需要解决的难题。”
识车:感知能力快速提升,自动驾驶需多技术推进
移动互联网的兴起,让停车场智能化成为可能。作为汽车的重要身份特征,通过摄像头,识别车牌并上传到终端,不仅能够让车主不停车通过收费闸道,还能精准获知停车位数量和地理分布等信息,帮助人们提前规划停车安排。
不久前,北京大学信息科学技术学院的研究团队研发出一种不用扫描车牌号就能识别车辆的新技术。该技术基于对车辆外观特征的记录和分析,如轮廓线条、碰撞损伤或漆面刮痕等,再由此搜索出机动车的型号和注册信息。
识别车牌只是视觉识别技术在车上应用的一小部分。业界更为看重同时也更为困难的是,通过与人工智能、通信、自动化等技术深度融合,让汽车能看清周边环境,进而实现自动驾驶。
不过,自动驾驶涉及的技术非常广,涵盖软硬件等多方面,任何一个环节欠缺都跑不起来。中科院自动化研究所研究员王飞跃说,近年来,汽车的感知能力快速提升,但遇到雨、雾等恶劣天气时,它就无法工作,目前仍没有理想的解决办法。此外,自动驾驶是遵守规则的“好学生”,现实中的路况通常瞬息万变,机器难以对一些突发情况做出合理的决策。
专家表示,未来通信技术会让信息传输更快、更稳定,车与路、车与人以及交通基础设施之间有望实现互联互通。
识商品:想象空间很大,落地应用是难点
人工智能技术还能自动识别物品。比如,一些内置智能摄像头的冰箱,可以自动识别各类蔬菜、水果、饮料等物体,提示保鲜时间,监控储存数量等。再比如,无人超市和无人货架有望实现零售的无人化,革新商品流通和销售的模式。
商品识别前景看上去很美好,但落地颇为困难。海深科技创始人戴剑彬介绍,跟人脸识别相比,商品识别种类繁多、变化快。由于不同商品的外形差异很大,部分柔性商品又具有变形的特点,识别难度很大。“线下商品视觉识别的想象空间很大,前提是能识别足够多商品,而在当前的技术条件下,还基本做不到。相比之下,智能货柜等相对封闭,且商品数量有限的场景,可能更适合这项技术的落地。”
展望未来,他表示,随着5G商用的逐渐铺开,未来智能货柜可以将更多的算力放到云端,让终端在轻量化的同时还能执行更复杂的任务,从而降低动态识别货柜的成本。同时,随着视觉识别算法的更高效和更精准,无人零售有望普及。
应对安全风险,加强基础算法和理论研究
安全专家指出,人们在享受智能识别的便利的同时,也应防范潜在的信息泄露风险和侵犯个人隐私。
“由于人脸识别具有高度的直接识别性和唯一性,相比其他信息,这种技术对个人而言,安全隐患更高。”中国互联网协会研究中心秘书长吴沈括说。
专家们指出,随着个人“露脸”的环境和应用场景增加,信息泄露的风险也将随之上升。今年9月,北京青年报一则报道就显示,在某网络商城中,有商家公开兜售“人脸数据”,数量约17万条。在商家发布的商品信息中可以看到,这些“人脸数据”涵盖2000人的肖像,每个人约有50到100张照片。
为此专家建议,慎重上传平台和授权使用,对于一些非必要的重要场景,不建议用户开通人脸识别功能。此外,管理部门应加大数据保护力度,加大对违法收集、使用用户个人信息企业的惩戒力度。人脸信息收集主体也要加强自律,遵守行业准则。
除了防范风险、保护个人隐私,专家们提出,还应提升视觉识别的效率和准确性。地平线创始人兼首席执行官余凯说,数据、算法和算力是驱动人工智能发展的三大要素,而芯片是其底层核心支撑。在万物互联的背景下,未来将出现海量的智能终端设备,更离不开功耗低、图像处理能力强等的智能芯片。
受访专家普遍认为,虽然我国在视觉识别的商业探索上走在世界前列,但基础算法和理论研究仍是短板。他们建议,在加速推动商业应用的同时,还需在基础算法研究、基础学科建设和人才培养上加大力度。(记者 喻思南)