18 项核心技术亮相微软中国人工智能大会
2018微软人工智能大会(AI Innovate)在北京召开,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士宣布,微软将充分发挥其在人工智能领域的全部优势技术和资源,与中国产、学、研各界展开全方位合作,为科研教育打造一流平台、为企业创新开发先进方案、为全民AI提供免费培训;与此同时,微软将认知服务扩展到智能边缘,推出 ONNX 项目及 ML.NET 开源跨平台人工智能开发框架,并为微软小冰赋予更多创意功能,以18项创新技术、工具、服务,全力助推中国开发者,把握数字化转型机遇。
微软宣布,为响应国务院及教育部有关促进人工智能发展的相关规划,微软亚洲研究院将联手北京大学、中国科学技术大学、西安交通大学、浙江大学共同发起共建“新一代人工智能开放科研教育平台”。这一开放开源的创新平台,将聚焦于中国人工智能领域的科研、教学和生态建设,为促进科研成果迸发、高端人才培养、共享生态建立奠定坚实基础。微软推出“3个100”计划,将筛选Azure机器学习、Visual Studio Tools for AI等100项微软人工智能服务与开发工具,携手来自100家具有影响力的企业的开发者和数据科学家,共同创造出100个针对关键行业的人工智能解决方案和落地场景。在这个计划中,微软将持续不断地提供产品与技术支持,和这些有影响力的公司以及他们的开发者和数据科学家开展形式不同的架构研讨和极客编程,包括开放黑客松、行业黑客松,以及定制黑客松,并利用全球及全国生态资源对接核心人工智能合作伙伴,以制造业、零售业、金融服务业为主要切入点,结合客户实际应用特点,从生产、制造、售卖、体验、营销、售后、服务、反馈等全阶段全过程落地实际应用场景,助力企业数字化转型。为了推动全民 AI,让每个人都有机会学习人工智能,微软推出在线人工智能学院(https://school.azure.cn/),目标是一年内培养出10万余名人工智能人才,将免费提供包括AI基础、核心技术和高阶应用在内的总共250课时的12门人工智能学分课程,覆盖 10项应用技能。完成课程学习的用户,还可申请微软专业学位课程(MPP,Microsoft Professional Program)作为职业技能认证。
微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士表示:“云计算与人工智能正在给整个世界带来巨大改变,微软希望我们领先业界的云计算和人工智能服务与工具能够予力全球每一人、每一组织,成就不凡。中国是全球最具创新活力的市场,中国开发者是微软生态系统中关键的组成部分。今天,微软在中国拥有40多万开发者,其中超过10万人在使用微软人工智能进行开发。通过与中国产、学、研各界的全面合作,并为中国开发者提供最新的人工智能平台、服务和开发工具,我们希望能助力释放中国智慧,发现中国机遇。”
Azure:人工智能的最佳云平台
微软智能云Azure现已覆盖全球50多个区域,并且获得了不同地区的超过70项安全合规认证,远高于其它任何公有云服务,是“世界的计算机”。Azure汇聚了微软在人工智能领域的全部投入与技术积累,是开发、部署、运行人工智能的最佳云平台,同时也是将智能云与智能边缘融会贯通的关键环节。
2020年,全球智能边缘设备的总数将超过200亿台,它们无需一直连接到云端,就能看会想、能听会讲。为了帮助开发者进军智能边缘计算,微软推出了Azure IoT Edge物联网服务,它能够在Linux 和 Windows上运行,并且是开源 的,能够允许开发者进行扩展、添加功能,并部署到任何环境中。Azure上的认知服务也可以扩展到Azure IoT Edge,目前微软已经推出了定制视觉服务,可以让无人机或其它工业装备无需连接到云,就能做出快速的响应和处理。这是首个支持在边缘环境中部署的 Azure 认知服务。未来几个月,还会有更多服务陆续登陆Azure IoT Edge物联网服务。全球最大的无人机制造商大疆创新(DJI)正在与微软合作,利用Azure IoT Edge和微软人工智能服务开发适用于农业、建筑行业、公共安全及更多应用场景的解决方案。
为了给边缘设备提供更加周全的安全保护,微软发布了Azure Sphere预览,这是第一个能够为联网微控制器(MCU)提供工业级安全保障的完整平台级解决方案。Azure Sphere方案将提供经过特殊设计的安全芯片、安全操作系统和能够守护每台设备的云端安全。目前每年全球有90亿片微控制器被安装到从家用电器到工厂设备的各种机器中,但只有1%具有联网功能,Azure Sphere无疑将开启潜力巨大的市场机遇。
Azure + AI,打造为每个人服务的人工智能
微软希望通过领先业界的云计算和人工智能服务,普及人工智能全民化,让每个开发者都有机会打造属于自己的人工智能应用。在两年前的Build 2016微软全球开发者大会上,微软首次公布了运行于Azure的认知服务,以API的形式为开发者提供触手可及的人工智能。微软在全球推出了覆盖语音、视觉、语言、机器翻译等功能的24项服务,目前已经有超过100万开发者使用认知服务。借助微软认知服务中的微软翻译引擎,小米生态链企业香蕉出行推出了魔芋AI翻译机,能够提供覆盖全球170多个国家和地区的14种语言的实时语音翻译。
全球最大的电信运营商中国移动正在与微软展开合作,将全球排名第一的语音技术应用于全球最大的语音及数据运营环境,实现技术创新到产业应用的落地实践。与中国移动的合作,也证明微软不仅拥有服务全球的人工智能,和最高识别率、准确率、容错率的语音技术,并且已经为服务各行各业的汉语市场做好了完善的工程与商业准备。除了语音识别,中国移动还将在机器翻译等技术上与微软展开更深入的合作,共同打磨产品适配与应用场景。
Azure Batch AI服务是微软智能云上的一项托管服务,允许数据科学家和人工智能开发者以非常简单的方式利用包括GPU在内的Azure云计算资源对人工智能模型进行训练。数据科学家只需明确任务需求,设定输入、存储、输出等设置,其它所有与基础设施管理、规模缩放、批量工作任务相关的繁杂的后台工作都能由Azure Batch AI自动完成。中国三大电商品牌之一的唯品会,正在积极构建布局全球市场。微软合作伙伴才云科技利用 Azure Batch AI 服务为唯品会开发了容器化的人工智能解决方案,将其海外业务团队的效率提升了85%,对100万张图片进行分析标签化处理的时间缩短到之前的1%,只需要5分钟,算法模型在深度学习训练上所用的时间也从 2 个月缩短到了1周,让 AI 系统迭代的速度获得了极大的提升。
对话式人工智能开启更广阔前景
对话式人工智能正在成为新一代智能应用的核心。现代开发者必须懂得如何打造一个对话机器人,以及如何部署和运行它,因为这是来自客户的呼声——企业迫切需要能够针对销售咨询、人力资源、招聘、客户支持和服务等不同应用场景进行定制、优化和训练的智能业务机器人。
Azure Bot Services对话机器人服务让开发者和企业能够轻松开发出自己的对话机器人,发布两年来已经有30万开发者采用该服务开发。对话机器人服务能够根据业务需求进行定制,还支持发布到微软小娜(Cortana)上,并能利用简单易用的开发工具为小娜赋予更多业务技能。微软已经与亚马逊合作,将微软小娜结合到Alexa智能音箱中,让用户通过Alexa调用小娜及其背后的人工智能服务。
微软小冰是面向情商(EQ)维度发展的人工智能系统,已在五个国家落地。5月21日,微软宣布一项人工智能内容创造的全新技能,为每个孩子定制专属于他们的有声童话故事,将于“六一”儿童节正式上线。家长可以设置童话故事的主人公和故事倾向,如更偏教育意义等,然后安排微软小冰完成创作。微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐,在短短20秒内即可完成一集约10分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准。该项服务完全免费,微软会持续向订阅家庭每天推送最新作品,让每个家庭的孩子都可以拥有一位专属于自己的故事主播。
目前,微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等。在有声读物领域,微软已拥有接近4万集有声童话内容。这些有声读物全部由人工智能技术生成,在与人类主播质量相当的前提下,数量足以陪伴一个孩子从2岁到9岁的全部时光6个月来,这些有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。
此外,微软还将向合作伙伴和开发者开放“全双工语音技术(Full Duplex)”,将“人机交互”进化为能像人类一样自然的“人机交流”,开发者可以使用这项技术打造自己的对话应用。2018年四月,微软正式在美国和中国同步宣布了Full Duplex感官,并已完成产品化落地。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流。小米生态链企业亿联客开发的Yeelight 语音助手是全球首个搭载全双工语音交互感官的智能设备,其硬件产品已开始进入千家万户。
开源框架让更多开发者驾驭机器学习
今天人工智能的发展处于一个百家争鸣的发展阶段,开源框架内的人工智能技术发展得尤其活跃。而不断敞开胸怀拥抱开源的微软,也与时俱进地推出了开放人工智能平台(Open AI)战略及开发工具,积极参与和推动技术的创新与快速发展。
在支持诸如TensorFlow、CNTK等业界主流的深度学习平台的同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。目前,已经有15家公司支持ONNX,并且还有更多公司正在加入进来。现在已经有PyTorch等六种顶级框架支持ONNX,其它框架则可以通过转换器获得支持。
在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。这一框架最初由微软研究院开发,并且在Windows、Bing、Azure等微软产品上都得到了成功的应用。通过将这一技术框架开源,微软希望能够为每一位开发者赋予驾驭机器学习的能力。
微软Project Brainwave能利用Azure上最先进的FPGA基础架构完成实时的人工智能处理。用户只需通过实时的单一批数据,就能得到以往需要多得多的批数据处理才能得到的性能,真正实现人工智能的实时计算。而且,FPGA运算不仅仅只在云端提供——通过合作伙伴,也可以通过Azure Stack混合云在本地提供FPGA。如此强大的实时计算能力不仅存在于云端,同时也适用于边缘计算,这将让更多创新成为可能。
微软研究院,开启人工智能的未来
今天,人工智能已经在潜移默化间给人们生活、工作的方式带来巨大的改变,那么未来的人工智能技术将如何发展?将近20年前,微软在北京成立了微软亚洲研究院,与微软研究院遍布全球各地的科研实验室一起,以全球最顶尖的智慧解决计算机科学中最具挑战性的难题,并为未来5到10年的发展开启更多可能。
作为美国以外规模最大、功能最全的研究机构,微软亚洲研究院在计算机视觉、自然语言理解等方面取得了举世瞩目的突破,甚至已经接近或者达到了人类的水平:在计算机视觉方面,2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%,胜过人类;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。
微软亚洲研究院开发的OCR (Optical Character Recognition光学字符识别)技术,将为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。目前手写识别OCR引擎V3.0版本的精度达到了70.5%,已经部署于微软认知服务,可供开发者用于自己开发的智能应用。
人工智能为人们打造更美好的未来
沈向洋博士在即将出版的新书《未来计算》中强调:人工智能的发展让我们有机会,以前所未有的方式塑造我们的未来,我们必须以负责任的态度,确保打造一个所有人都能参与和分享的美好未来,让人工智能为全人类造福。
在2018微软人工智能大会的现场,沈向洋博士迎来了一位特别来宾——来自南京工业大学的硕士研究生宋昊旻。宋昊旻在一岁时失去了听力,被诊断为终生听力严重损伤。昊旻在妈妈的支持下,经过不懈的艰苦练习学会了发声。他不但和同龄人一起学习生活,还考上了南京工业大学的本科和硕士研究生。在会议现场,昊旻在微软语音服务的帮助下,与沈向洋进行了对话。针对昊旻的声音特点定制的语音识别模型能够以极高的准确度将他努力发出的语音转换成文字,还能同步翻译成英语或其它语种,真正实现无障碍沟通。
2014年,微软便与合作伙伴七厘米科技一起,在 Azure 智能云上为助盲公益机构红丹丹打造了云端的“心目图书馆”,让盲人朋友可以通过移动设备随时随地收听和下载有声读物。在这项合作的基础上,微软小冰为红丹丹提供中国最大的公版儿童有声读物全集“小冰姐姐讲故事”,囊括上千小时的童话故事、科普百科、名人轶事等有声读物。红丹丹服务的104所盲校的学生和少年儿童都可以通过心目图书馆找到这些内容。
人工智能的时代已经到来,而中国正是引导人工智能创新和发现人工智能机遇的绝佳市场。微软正不遗余力地投入全球领先的技术和资源,全面助推中国人工智能生态系统的建设和成长,予力中国开发者把握机遇,创造未来。