视觉AI为传统产业装上“智慧之眼”
12月22日,素有“逃犯克星”称号的张学友在江门市举办演唱会,不出意外,又有一名在逃人员在演唱会上落网。据不完全统计,今年在张学友演唱会被抓捕的在逃人员约25名,其他犯罪嫌疑人约68名。
这背后,是基于深度学习的人脸识别算法“立功”。人工智能(AI)不仅可以识人,还可以识物。在深圳码隆科技展厅的无人售货机,消费者扫码打开柜门、取出商品、关上柜门,系统自动结算。相比传统的自动售货机,不再需要把商品“规规矩矩”摆列,消费者也不用隔着玻璃点击购买。
在计算机视觉领域,先后涌现出云从、商汤、旷视、依图、云天励飞等人工智能创业公司,它们从人脸图像识别起步,进而在新零售、工业、芯片、智能终端等领域走出各自差异化道路,打开了广阔的应用空间和发展前景。
抢占摄像头入口城市大脑装上“智慧之眼”
在深圳,超过2万民警使用的警务云终端上,一款叫做云天“深目”的动态人像App,经过一定的权限管理系统,民警们可以对犯罪嫌疑人在2秒内,检索他从深圳的机场到地铁,到南山、福田、罗湖、龙岗跨区域的活动轨迹,落地他的身份、查询他的前科。
这套系统在深圳上线后,就协助公安破获了经侦、技侦、网警、打拐、缉私等等各类案件突破1万多件,协助找到了上百名走失的儿童和老人。
对很多人来说,安防监控并不陌生,但传统的安防监控虽然实现了记录功能,但不能准确识别视频中的人、物和场景,民警往往需要花费大量的时间精力从海量的视频监控中获取到需要的信息。
云天励飞依托“云+端”人像智能解决方案,前端实现人脸检测跟踪、抓拍采集,后端引擎通过深度学习实现人像结构化特征值提取,结合人像识别应用平台实现动态、开放、多场景下的人像精准识别和布控。“以前20个民警看一个星期的视频,现在只需要几秒钟就可以完成。”云天励飞战略规划总监张旭媚说。
而在张学友今年以来的演唱会中,就有广州云从科技、云眼大视界等AI公司“立功”的身影。各大AI公司都在抢占安防市场,而摄像头正成为智慧城市的“入口”。张旭媚说,传统摄像头的安装都希望架得高、辐射面积大,但现在更清晰的人脸采集摄像头架设更低,在实际应用中,各家的算法不同,对摄像头的调试、架设的角度、高度标准以及售后服务等都不一样,一旦抢先布局了摄像头,就有一定的排他性,未来短期内不太可能再重新架设一套摄像系统。
尽管人脸识别站上了产业风口,但对实战要求却很高。记者了解到,在深圳举行的高交会上,安检门同时采用了2套系统,分别负责一个入口,结果其中一个系统崩溃了,因为实验室拍照的样本非常清晰,但实际中经常要侧脸抓拍等方式,这和以前训练的方式不一样,时间一长系统承受不住了。
从“刷脸”跨向“识人”AI与用户互动还能帮助决策
人脸识别系统不仅可以“刷脸”,还在朝着“认识人”迈进。2018年10月底,云从科技宣布,在语音识别技术上取得重大突破,他们融合图像识别与语音识别的优势,推出全新Pyramidal-FSMN语音识别模型。
在技术研究的“最后一公里”,每0.1个百分点的进步都异常艰难。全新Pyramidal-FSMN语音识别模型在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,准确率提升到97.03%,将Librispeech的错词率降低至2.97%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原先纪录。
让外界有些不解的是,以人脸识别闻名的云从科技,怎么就切入到了语音市场。事实上,语音识别技术同样是智能感知中一个重要的部分,通过语音识别,机器可以像人类一样听懂说话,进而能够理解、思考与反馈。
“云从的技术围绕人为主要方向,不仅仅是认识你的脸,还要认识你这个人;不仅在人脸识别上更快,而且能看出你的神态、步态、衣着。”云从科技高级副总裁伍楚芸在接受南方日报记者专访时说,如果单纯在人脸识别上竞争,虽然一开始差距挺大,但最后只是99.8%和98.9%准确率的差异,这点差异在大部分应用场景上可以忽略,而云从要做的是从感知、认知到决策的闭环,云从进军语音识别,从而更好地进行人机交互,“除了我认识你,还要与你语音互动,能听懂你的意思,甚至还能帮助到你”。
如今,用户的需求也不仅仅局限于“美颜”,对人识别的要求还发展到了美体。商汤科技应用创新AI技术,将AR识别和绘制能力从“脸部”延伸至“全身”,在原创的SenseAR增强现实感绘制平台上,推出了全新功能模块——SenseAR美体塑形,不仅可以针对头、肩、腰、臀、腿等部位及身高比例进行调整,还可以轻松实现一键式全身美体塑形。
从“识人”向“识物”迈进开拓一个智能识别的新兴市场
在码隆科技的展示区里有一个显示屏,当用户路过摄像头前屏幕上就会出现此人所穿衣服的种类、颜色和风格;而在无人售货机的改造上,一个简易货柜架上一个普通摄像头,1分钟就可把普通货柜改造成智能货柜,而成本仅为此前货柜的一半。
“识物”正在成为AI公司新蓝海。今年12月,联发科在深圳发布了主打AI性能的新一代Helio P90系统单芯片,在这款被称之为“全球首款AI识物芯片”的背后,站着一众人工智能视觉公司,包括商汤科技、旷视、码隆科技等。
码隆科技嵌入Helio P90芯片的物体识别技术已经集成了针对服饰的识别,可以准确识别衣物的类别、款式、风格、元素等特征,将有力地支持Helio P90从本地端更好地服务于智能手机厂商以及视频和图像等应用领域。“从数量来说,包括商品在内的物品,要远比人脸更多,想象空间也更大。”码隆科技运营副总裁刘念说。
商汤科技联合创始人、副总裁杨帆也告诉南方日报记者,计算机视觉产业可以从图片和视频中提取的要素通常有人脸、人体、衣物、步态、车辆等,未来,图片和视频将成为最重要的信息载体,因为其涵盖的有效信息量最多,而通过对这些信息的分析,也将诞生新兴的科技巨头公司。
与传统行业结合找差异化拓宽自身边界
云从、商汤、依图、旷视在计算机视觉行业,AI公司风起云涌、攻城略地,在走过了最初安防领域的应用后,各大AI公司也在不断拓宽自身的边界。
在行业纵深方面,如在银行业,云从科技已成为人脸识别应用的第一大供应商,未来还将逐步深入到更多业务领域,包括银行智慧网点的转型、银行风控的管理提升等,以人脸识别业务为切入点,利用人工智能技术帮助银行业务的全面优化升级。
而在最近的高交会上,云天励飞携成功流片的AI芯片亮相,计划在明年正式商用。未来,云天励飞还将探索芯片商业模式的创新,力推“芯片+服务”的新模式,打造芯片共享平台。
在横向拓展方面,AI公司纷纷布局智慧零售、智慧社区、智慧教育等,由于落点不同,相互间避开了同质化竞争,如在零售领域,相比擅长做硬件的友商,云从比较着重做零售大脑,软件或平台相关等;云天励飞将线下信息结构化,消费者在商店买了哪些东西,其兴趣点在哪儿,以前只能通过互联网建模的商业模式,现在在线下也能做;今年5月,商汤还联手华东师大,推出第一本人工智能教材,入局智慧教育。
“AI一定要与行业结合才是有生命力的。”刘念说,传统行业与AI结合,需要数据确定模型,但在服装等行业连基本的数据都没有,也没有IT架构,“比如客户和我们洽谈的时候非常兴奋,对AI的需要很强烈,但一谈到落地就遇到很多问题,纯视觉的方案根本解决不了,这都需要AI公司帮助企业将数据整理出来”。
杨帆则表示,新事物层出不穷,行业风口不断变迁,但回归到事情本质其实是很简单的,整个信息产业依然是非常关键的五个关键环节,分别是对采集、传输、存储、分析计算和反馈的利用、整合和技术的进步。AI公司虽然一开始比拼的是信息采集环节,在采集环节实现了高度自动化后,比拼的是对信息的分析和反馈,才能建立起一个完整的闭环,“摄像头是非常重要的采集环节,也有一些AI能力建立在摄像头上,但最重要的还是在后端,分析环节将创造巨大价值。”
来源:南方日报
热门文章
推荐内容
- CVIC SE Enters the Jamaican Expressway Market with the Strat
- Huawei and Haier Sign the Strategic Cooperation Agreement
- Sunyard and Chouzhou Commercial Bank Develop the Internet Fi
- To Build the Cloud Ecology, Taiji and Huawei Sign a Strategi
- 東軟グループが出資して自動車技術会社を設立
- 上半期中国企業のサービスアウトソーシング、契約ベース金額4.9%
- 中国工業と情報化部運行監測協調局、上半期ソフトウェア経済運行
- 中創軟件、「一帯一路」戦略に沿ってジャマイカの高