微软 AI,让沟通没有障碍
在 2018 微软人工智能大会的讲台上,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士迎来了一位来宾——来自南京工业大学的硕士研究生宋昊旻。
1993 年出生的宋昊旻,在一岁时由于医生用药不慎造成神经性听力损失,被诊断为终生听力严重损伤。昊旻在妈妈的支持下,经过不懈的艰苦练习学会了发声。他不但和同龄人一起学习生活,还考上了南京工业大学的本科和硕士研究生。今天,昊旻已经可以像常人一样发出声音,但受限于听力损失,他的语音、语调会显得有些吃力和不自然。
在微软人工智能大会上,昊旻与沈向洋进行了现场对话。基于Microsoft Translator打造的微软语音服务,专门针对昊旻的声音特点定制了语音识别模型,能够以极高的准确度将他的语音实时转换成文字,还能同步翻译成英语或其它语言,从而真正实现了无障碍沟通。
这项用来帮助听力受损人群无障碍沟通的技术源于微软与美国罗彻斯特理工学院的一项合作。罗彻斯特理工学院在培养失聪学生方面久负盛名,在该校的总共1.9万名学生中,8.8%的学生都是聋人或者听觉障碍者。利用微软的人工智能技术和认知服务中的Microsoft Translator服务,科研人员开发出了可定制的自动语音识别解决方案,让学生能够更加从容自如地与世界交流。
今天,日新月异的技术创新正在潜移默化间改变着每个人生活、学习、工作的方式。微软相信,如果能够充分调动技术进步的全部潜力,那么我们一定可以解决更多困扰人类社会的重大问题。正是出于这样的考虑,微软在2017年7月宣布投资200万美元开启“人工智能地球计划(AI for Earth)”,旨在以人工智能寻找能够用以应对和解决大气、水资源、农业和生物多样等全球性问题的技术方案。同年12月,微软宣布对大规模扩大这一计划,将在未来五年内投资5000万美元,鼓励人们推广人工智能来更高地管理和改善地球的自然系统。
在刚刚结束的Build 2018微软全球开发者大会上,微软进一步公布了“人工智能无障碍计划(AI for Accessibility)”,将在未来五年的时间内,投入 2500 万美元,予力全球开发者充分利用微软提供的人工智能技术和平台施展才华、发挥创意,为世界各地超过 10 亿残障人士,打造一个便利、平等、没有障碍的世界。
时至今日,人工智能今天所取得的进展,已经有能力为残障人士的生活带来翻天覆地的改变。计算机在看、听、说、推理等方面的能力、效率和准确度持续提升,而微软则将这些成果打包成解决方案,推出了实时语音到文本转换、计算机视觉识别、文本预测输入等功能和服务。利用这些触手可及的技术,人们可以为视觉、听觉、感知、学习、行动能力有所不便的人群或者是心理疾病患者,打造出人工智能应用和产品,帮助他们无障碍地面对工作、生活和与人沟通。
事实上,在过去几年的Build大会上,微软一直在不遗余力地展示以人工智能技术予力残障人士的无限可能。在Build2016大会上,由微软盲人工程师Saqib Shaikh开发的Seeing Al人工智能辅助视觉方案首次亮相。这套由可穿戴眼镜、智能App组成的系统,能基于微软智能云上的视觉识别和自然语言处理技术,识别出摄像头拍摄到的场景,听懂佩戴者的语音命令,然后以语音的方式,向视觉障碍的使用者描绘出眼前的场景,例如 “一个穿红衣服的女孩正在踢球” 。现在,微软中国的合作伙伴嘉讯广源已经开发出了中文版的人工智能辅助视觉系统。
在2017年的Build大会上,微软研究员张海燕为帕金森病患者Emma Lawton设计的一款特殊的手表再次引起了人们的广泛关注。这款 Emma 手表能够跟踪和探测帕金森病患者手部不受控制的震颤,以手表的震动去纠正和抵消手部震颤,从而让患者像正常人一样控制手部动作写字画画。通过在传感器、移动应用、云计算的基础上进一步加入人工智能、机器学习及帕金森症状量化模型,研究小组还在持续研究针对帕金森致病成因的更多可行的治疗手段。
根据世界卫生组织披露的数字,目前全球每十个残障人士中,只有一人能得到辅助技术和产品的帮助。微软相信,基于人工智能的无障碍解决方案,可以为更多的人带来更广泛的帮助。
微软“人工智能无障碍计划”的目标,就是通过予力全球各地的开发者,尽可能地放大人工智能的影响力。这项计划在实施过程中将分为三种途径:首先,微软会为开发者、院校、非营利组织、发明者提供技术方面的种子资金支持,帮助他们以人工智能为突破点,创造出能帮助残障人士更好地工作、生活和与人沟通的解决方案;其次,微软对具有潜力的项目给予更大的技术投入,并让微软的人工智能专家参与其中,帮助其成果实现规模化发展;第三,微软还可以将人工智能与开放设计融入现有的平台和产品,与合作伙伴一起将人工智能创新打造为平台级服务,从而为更多人提供服务,让无障碍的福利实现最大化。
在中国,广州华途信息携手微软共同研发出了首个城市级的视障人士公交自助出行服务系统“听听巴士”。视障人士只需在手机上打开“听听巴士”应用,手机就会自动提示到达站台的名称和公交线路,在车辆进站时手机会精确提醒用户,所选车辆会以个性化语音播报自己的线路名,用户乘车时手机也会播报途径站点并在到站前提醒用户。华途信息与微软合作,利用微软智能云Azure的物联网服务与云平台为“听听巴士”提供可后端支持:一方面依靠Azure IoT中心整合与管理公共交通资源,打造出人、车、路相互感知、相互协同的公交导盲系统;同时还依靠Azure云平台轻松连接百万级物联网终端的优势,实现了城市级别的快速部署。
自2006年起,微软与助盲公益机构红丹丹展开合作,在2014年由微软与合作伙伴七厘米科技在Azure智能云上打造了云端的“心目图书馆”,让盲人朋友可以通过移动设备随时随地收听和下载有声读物。在2018微软人工智能大会上,微软和红丹丹宣布进一步加深合作,微软小冰为红丹丹提供 “小冰姐姐讲故事”有声儿童读物全集。这是中国最大的公版儿童有声读物合集,几乎涵盖了市面上所有公版优质儿童故事。其上千小时的有声读物囊括童话故事、科普百科、名人轶事等多个类别,其中包括伊索寓言、格林童话等经典著作。红丹丹服务的学龄前儿童和104所盲校的学生都可以通过心目图书馆收听这些故事。
人工智能已经开始造福地球和人类。微软由衷期待有更多的人利用微软的人工智能技术和平台,开发出更加多样化的人工智能应用,助力这个世界上的每一个人成就不凡。