当智能手机、平板电脑、智能手表、智能电视以及更多日常物品接入互联网,2017年最革命性的变化可能发生在人与物品的交互方式上。在科大讯飞高级副总裁杜兰看来,2017年的生活是“说到做到”,只要你愿意开口说话,就能通过语音让生活更悠闲自在且高效。
杜兰解释,“万物互联”作为IT产业第六次浪潮是大家所共同期待的,未来越来越多的设备将没有屏幕,如智能眼镜、手环,同时这些设备不一定需要像手机那样靠近人,它们可以离人很远,到那时,语音会成为最方便的选择之一,“比如打开我眼前五米之内的设备,如果不走过去,手没法触碰,再比如我们在开车情况下不方便用手操控,高精准识别的语音系统会是更好的选择”。她相信,未来3到5年之内,以语音为主、键盘触摸为辅的人机交互时代即将到来;5到10年内,人工智能将像水和电一样进入每一个行业,深刻改变世界。
2016年11月,美国研究机构BI Intelligence发布的《2016年全球物联网发展研究报告》被国内众多媒体关注并援引。这份报告对2016年全球物联网发展做了深入分析,并表示随着上网人数越来越多、硬件价格越来越便宜,物联网时代真的来了,一直不温不火的智能家居市场可能也会有新的突破,因为之前不能爆发的很大原因是智能家居的硬件设备太贵或介入设备的技术不成熟。报告预测,2020年全球将有340亿台设备接入互联网,平均每个人有4个硬件设备。
而从2017年开始,你很可能已经能通过语音交互进入到万物互联的智能生活。杜兰描绘了使用语音实现各种人机交互的典型一天:
“早上,你睁开惺忪的眼,来到客厅,对着智能电视说一句‘好想回看昨晚的《新闻联播》’,电视机便开始按照你的心意进行播放。
“随后,你一边看电视一边唤醒语音操控智能应用‘灵犀’,通过它把家里的空气净化器、空调、加湿器等电器调整到最舒适健康的状态。接着,你用这个语音系统为家人预订了去新疆旅游的机票。
“当天上午,你工作的主要内容是开会洽谈,会议厅内聚集了来自韩国、日本和美国等国家的合作伙伴,‘讯飞听见’实时将多国语言转化成文字并翻译在大屏幕上,来自各国的参会者不用翻译就能当场看懂彼此的话并进行沟通。
“下班后,你开着汽车,开口问车上的‘飞鱼助理’怎么去最近的某银行营业大厅,它通过后台快速搜索,推荐给你最佳答案并自动规划好前往路线。
“到达银行后,你与大厅内的‘晓曼机器人’沟通,它除了协助你完成简单的取款行为,还会根据你的需求为你找到适合的理财方式。
“回到家,你送给家人出行礼物‘晓译翻译机’,它跟录音笔差不多大,非常小巧便携,能进行多种语言即时互译,其中包括汉语与维语即时语音互译,带着它不怕旅行时与当地人语言不通。”
这些画面听上去有些科幻,但这些产品确实已经诞生或正进行完善,并将在2017年陆续投放市场,渗入普通消费者的日常生活。2016年年底,科大讯飞在主题为“人工智能+ 共创新世界”的2016年度发布会上,发布了多款新产品及其人工智能技术在车载、教育、家居、机器人等领域的应用,其中就包括万物互联输入法、讯飞听见、晓译翻译机、飞鱼助理、晓曼机器人、讯飞快听、配音阁等。
显然,语音正在成为人机交互最主要的一个方式。这也是“互联网女皇”玛丽·米克尔的观点。2016年6月2日凌晨,玛丽·米克尔发布2016年互联网趋势报告,她在报告里首次用近四分之一的篇幅论述语音识别交互带来的改变,将语音功能赞誉为“人机交互的新范式”,称语音功能解放了双手和眼睛,扩展了永远在线的概念,只需要一个声音的交流,就可以迅速高效完成一些操作,传统的键盘、手写板或现在流行的视频都不可能如此充满想象空间和便利。
考虑到技术与市场的双重优势,中国人的语音交互消费很有可能在2017年正式开始进入快速发展与成熟期。首先,智能语音交互应用并不是才出现的新东西,早在2014年亚马逊就推出智能音箱Echo,2015年科大讯飞也和京东合作推出了叮咚音箱,并在2016年6月联合了滴滴等服务商推出了叮咚的开放平台,让用户可以通过叮咚音箱实现语音叫车服务。2016年美国国家人工智能研究和发展策略规划提出,中国在很多领域的技术水准都占据着绝对优势的领先地位。
西部证券投资顾问马征分析,语音交互技术的发展最早是建立在英文平台基础上的,美国市场的语音互动已经从简单互动深入到更高级的网络指令应用。相比之下,中国的普通消费者大多是近年才从苹果的Siri开始接触这一块,而中文版Siri明显功能弱化了很多,根本满足不了市场需求。与此同时,一直以来,相对复杂的中文也需要一个更简单高效的输入方式进入互联网。
2016年10月18日,锤子手机T3发布会,罗永浩挽起袖子连说带演,一个人站在演讲台中央忙活了好几个小时介绍新锤子,不过从事后效果来看,看过发布会的观众与媒体更好奇的是手机中的一款语音应用,即讯飞输入法,而非手机本身。发布会上,罗永浩对着手机随意讲话,话音一落,相应的文字就连断句带标点,准确无误地出现在屏幕上。从语音交互的应用来看,被罗永浩用来展示的仅仅是语音交互中的输入基础,即用语音转文字,但由此引发的周边反应可以看出市场对相关应用的期待——锤子发布会之后,讯飞股票大涨。
从锤子发布会意外走红的“讯飞”并不是突然杀出的黑马。杜兰介绍,科大讯飞自1999年成立以来就致力于以语音和语言为入口的智能语音和人工智能领域的研究,在人工智能技术领域有着17年的技术积累。
杜兰预测,当人工智能在未来5到10年普及,甚至在2045年前改变世界时,中国非常有可能在全世界占据主导地位。其中,语音将成为最有前景的人机交互入口。目前,科大讯飞已启动以语音和语言为入口的认知革命,正牵头进行国家科技部863重大专项——“类人答题机器人”,目标是让这台机器人在2020年考上“一本”大学,进而成为全球第一个中文认知智能计算引擎。当然,在具备语音语言认知的答题机器人考上大学之前,用语音、语言作为接口的各种人工智能正从技术领域进入市场领域,成为人与世界互动的新方式。
评论
下载新周刊APP参与讨论