×

登录 是一种态度

logo
手机
访问
公众
账号
󰀳 返回
顶部

教智能音箱学一门新语言,为什么这么难?

核心提示:听起来似乎很不可思议。智能音箱能够控制智能家居、回答问题、安排行程,却无法理解一门被普遍使用的语言?然而这的确是事实。其背后的原因之一在于,语言远比文字要复杂多变。另外一个原因,则是智能音箱厂商们出于商业考虑的优先排序。

在全球范围内,智能音箱正在成为越来越多消费者家中的新宠。得益于以小米小爱音箱与阿里的天猫精灵为首的众多国内智能音箱生产商,幸运的中国用户们不仅赶上了这一波潮流,还不用面对国外许多科技爱好者们面对的窘境——许多非英语区的用户还在苦苦等待智能音箱能够听懂他们的语言。

听起来似乎很不可思议。智能音箱能够控制智能家居、回答问题、安排行程,却无法理解一门被普遍使用的语言?然而这的确是事实。

上个星期,Google Home 发布了西班牙语的语言包。单就发布新的语言包可能听起来没什么,但在此之前,Google Home 花了将近两年才让 Home 学会西班牙语,至于市场份额占据最大的 Amazon Echo,则至今也未能学会西语,目前它仅仅掌握三门语言:英语、德语与日语。

教智能音箱学一门常用语言,为什么需要这么长的时间?

其背后的原因之一在于,语言远比文字要复杂多变。

居住在不同地区的人口也许使用着同样的书面文字,但口音上却天差地别。对于发音特点更加鲜明、使用人数也更少的方言,绝大多数厂商则表示暂时无能为力。因此,对于所有智能音箱厂商而言,培养机器的语义理解能力都是巨大的挑战。

厂商需要在用户的使用过程中沉淀大量语音数据,排出优先级让音箱学习,进而慢慢理解以前听不懂的句子。相比之下,直接输入的文字很容易就能被机器转化为有意义的信息。正是因为如此,文字翻译软件处理起小众的苏格兰高地语也能得心应手,而Google Home用了将近两年才学会被广泛使用的西班牙语。

火狐的开放商 Mozilla 的机器学习部门负责人 Kelly Davis 认为,即使听懂了句子中的每一个单词,也不意味着机器理解了这门语言。与亲密朋友或与泛泛之交打招呼的用词有什么区别?某个笑话在某门语言内是否无伤大雅?要让智能音箱学习一门语言,还需要教它深入地理解语言背后的文化意涵。

另外一个原因,则是智能音箱厂商们出于商业考虑的优先排序。

厂商们优先开发使用人数多、消费能力强的地区的语言包,抢占更有利润可挖的市场,这不难理解。但这样的选择,也意味着失去众多以这些不被重视的语言为第一语言的潜在用户。

仍然以西语为例。

根据维基百科的数据,截至 2017 年,全球将西语作为母语的人口达到 4.77 亿人,全球有 23 个国家和地区将西语作为官方语言。在美国,西语是第二广泛使用的语言,将其作为家庭主要语言的人口达到3550 万。

由于西班牙及拉美地区足球水平的强势,西语是全世界球迷中最普及的语言之一。仅仅在美国国内,就有超过 20 个西语的体育频道或体育网站。然而在 Home 支持西语之前,智能音箱们无法理解用西语提问的哪怕是最简单的足球问题,也无法与网络上丰富的西语体育资源对接。

为了收回这些前期战略性放弃的失地,厂商们正在发力迎头赶上。

Google 计划在今年内让 Google Home 支持超过30种语言。Amazon 则在 Amazon Echo 中加入了Cleo 功能,鼓励用户向语音助手 Alexa 传授更多语言。

加入更多语言包的意义并不止步于赚取利润。Davis 表示,有很大一部分小众语言使用者来自于欠发达地区,他们受教育水平不高,也许甚至不会读写。之前的那些电子产品以文字为基础,且操作较为复杂,使得这一部分人群很难享受到科技发展的便利。以语言为交互方式且易于上手的智能音箱,也许能够真正走进并改变他们的生活。

总而言之,智能音箱目前还算不上是个语言通,但它能够听懂更多语言的未来,还是值得我们期待一下。

0