27年前,微软研究院创立之时,最初的三大研究组全部围绕人工智能展开——自然语言、语音和计算机视觉。如今,在2018微软人工智能大会(AI Innovate)的会场,微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士宣布,微软将充分发挥其在人工智能领域的全部优势技术和资源,与中国产、学、研各界展开全方位合作。这次大会基本曝光了微软在人工智能领域的多年研究成果,这些成果对企业和个人开发者而言意味着什么?微软对人工智能的未来想说些什么呢?
Azure:人工智能最佳云平台
微软智能云Azure已覆盖全球50多个区域,并获得了不同地区超过70项安全合规认证,远高于其它任何公有云服务,微软将其称为“世界的计算机”。Azure是开发、部署、运行人工智能的最佳云平台,同时也是将智能云与智能边缘融会贯通的关键环节。
▲沈向洋博士,微软全球执行副总裁,微软人工智能及微软研究事业部负责人
2020年,全球智能边缘设备的总数超过200亿台,它们无需一直连接到云端,就能看会想、能听会讲。为了帮助智能边缘计算领域的开发者,微软推出Azure IoT Edge物联网服务,它能够在Linux和Windows上运行,并且是开源的,允许开发者扩展、添加功能并部署到任何环境。Azure 上的认知服务也可扩展到Azure IoT Edge,目前微软已推出定制视觉服务,可让无人机或其它工业装备无需连接到云,就能快速做出响应和处理。这是首个支持在边缘环境中部署的Azure认知服务。
为了给边缘设备提供更加周全的安全保护,微软发布了Azure Sphere预览,这是第一个能够为联网微控制器(MCU)提供工业级安全保障的完整平台级解决方案。Azure Sphere方案将提供经过特殊设计的安全芯片、安全操作系统以守护每台设备的云端安全。目前每年全球有90亿片微控制器被安装到从家用电器到工厂设备的各种机器中,但只有1%具有联网功能,Azure Sphere无疑将开启潜力巨大的市场机遇。
Azure + AI,打造为每个人服务的人工智能
在两年前的Build 2016微软全球开发者大会上,微软首次公布了运行于Azure的认知服务,以API形式为开发者提供触手可及的人工智能。微软在全球推出了覆盖语音、视觉、语言、机器翻译等功能的24项服务。借助微软认知服务中的微软翻译引擎,小米生态链企业香蕉出行推出魔芋AI翻译机,能够提供覆盖全球170多个国家和地区的14种语言的实时语音翻译。
全球最大的电信运营商中国移动正在与微软展开合作,将微软语音技术应用于中国移动的语音及数据运营环境,实现技术创新到产业应用的落地实践。除了语音识别,中国移动还将在机器翻译等技术上与微软展开深入合作,共同打磨产品适配与应用场景。
Azure Batch AI服务是微软智能云上的一项托管服务,允许数据科学家和人工智能开发者以简单的方式利用包括GPU在内的Azure云计算资源对人工智能模型进行训练。数据科学家只需明确任务需求,设定输入、存储、输出等设置,其它所有与基础设施管理、规模缩放、批量工作任务相关的繁杂的后台工作都能由Azure Batch AI自动完成。微软合作伙伴才云科技利用Azure Batch AI服务为唯品会开发了容器化的人工智能解决方案,将其海外业务团队的效率提升85%,对100万张图片进行分析标签化处理时间缩短到之前的1%,只需要5分钟,算法模型在深度学习训练上所用的时间也从2个月缩短到1周,让AI系统的迭代速度获得了极大提升。
对话式人工智能前景
Azure Bot Services对话机器人服务让开发者和企业能够轻松开发自己的对话机器人,发布两年已有30万开发者采用该服务。对话机器人服务能够根据业务需求进行定制,还支持发布到微软小娜(Cortana),并能利用简单易用的开发工具为小娜赋予更多业务技能。
微软小冰是面向情商(EQ)维度发展的人工智能系统,已在五个国家落地。微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐,20秒内即可完成一集约10分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准。值得注意的是,该项服务完全免费。
此外,微软还将向合作伙伴和开发者开放“全双工语音技术(Full Duplex)”,开发者可以使用这项技术打造自己的对话应用。
开源框架让更多开发者开启机器学习
越来越开放的微软推出了开放人工智能平台(Open AI)战略及开发工具,在支持诸如TensorFlow、CNTK等业界主流的深度学习平台的同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。
在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中——开发者完全无需具备开发和调试机器学习模型的经验。
微软Project Brainwave能利用Azure上最先进的FPGA基础架构完成实时人工智能处理。用户只需通过实时的单一批数据,就能得到以往多得多的批数据处理才能得到的性能,真正实现人工智能实时计算。而且,FPGA运算不仅只在云端提供——通过合作伙伴,也可以通过Azure Stack混合云在本地提供FPGA。这种实时计算能力不仅存在于云端,同时也适用于边缘计算,这将让更多创新成为可能。
微软亚洲研究院走过的这些年
微软亚洲研究院在计算机视觉、自然语言理解等方面取得了不少突破:在计算机视觉方面,2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%,胜过人类;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平;2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。
微软亚洲研究院开发的OCR (Optical Character Recognition光学字符识别)技术,将为各种人工智能应用增加图形文字识别功能,目前支持从Office到Skype、Bing、HoloLens的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。目前手写识别OCR引擎V3.0版本的精度达到了70.5%,已经部署于微软认知服务,可供开发者用于自己开发的智能应用。
人工智能的未来,微软如何定义?
主会场的高潮迭起大抵是由于一个个重磅消息的发布,如今,微软在中国已拥有40多万开发者,其中超过10万人在使用微软人工智能进行开发,这对于微软而言还只是开始,微软亚洲研究院现场宣布将联手北京大学、中国科学技术大学、西安交通大学、浙江大学共同发起共建“新一代人工智能开放科研教育平台”;微软推出“3个100”计划,将筛选Azure机器学习、Visual Studio Tools for AI等100项微软人工智能服务与开发工具,携手来自100家具有影响力的企业的开发者和数据科学家,共同创造出100个针对关键行业的人工智能解决方案和落地场景;微软推出在线人工智能学院(https://school.azure.cn/),目标是一年培养出10 万余名人工智能人才,免费提供包括AI基础、核心技术和高阶应用在内的总共250课时的12门人工智能学分课程,覆盖10项应用技能。完成课程学习的用户,还可申请微软专业学位课程(MPP,Microsoft Professional Program)作为职业技能认证。
人工智能的时代已经到来,而中国正是人工智能创新和发现机遇的绝佳市场。微软正不遗余力地投入技术和资源推进中国人工智能生态系统的建设和成长,沈向洋博士在即将出版的新书《未来计算》中强调:人工智能的发展让我们有机会,以前所未有的方式塑造我们的未来,我们必须以负责任的态度,确保打造一个所有人都能参与和分享的美好未来,让人工智能为全人类造福。