中文版Cortana小娜研发背后的故事
以微软在人工智能、语音语义领域的长期研究,它理应比苹果、Google 更早推出个人智能语音助手,不过微软对应的产品 Cortana 直到今年 4 月份才发布,不得不说来得有些晚。好在它的中文版可一点都不晚,在发布不久后,随着 Windows Phone 8.1 更新的发布,Cortana 正式入华,并拥有了中文名小娜。
看过我们之前的报道会知道,Cortana 更像是苹果 Siri 和 Google Now 的合集,不仅提供知识问答,语音操控应用,还能结合个人数据进行智能化的提醒,更特别之处在于,工程师在设计时还赋予它性格,当你和它聊天时会觉得,它更像是一个人。
而小娜则在性格塑造方面有过之而无不及,它的研发由微软亚洲互联网工程院完成,依托于必应搜索的大数据,在此基础上进行大量的调研和测试,最终 形成了小娜的性格。不为人知的是,小冰也是微软亚洲互联网工程院的成果,这里诞生了两个有趣的“人物”,小冰代表泼辣,小娜代表成熟、知性。
为了了解小娜研发背后的故事,爱范儿采访到了他们的资深产品总监、小娜研发负责人闫勃,听他讲述小娜诞生的故事。
中国市场仅次于美国
Cortana 的研发历时近 2 年,从第一个 Milestone 版本之后,中文版就开始启动,总共历时一年多。美国是先发市场,中国和英国成为第二、第三个市场。
“当初确定比较重要的三个市场时,第二个市场毫无争议就是中国。”闫勃说道。这一战略定位看似平常,但却凸显着微软与其他公司全球战略的不同。 因为对比苹果、Google 或者 IBM 这些跨国公司,没有哪家把中国列入前三的。Google 几乎没有中国市场,苹果只是近两年才将中国列入第一梯队,但重要性还不及欧洲、日本市场。
这种转变是十分迅速的,因为就在几年前,Windows Phone 入华还是标准的跨国企业节奏,并没有今天的速度。闫勃认为,这源于他们对中国手机市场的观察,这个市场不仅容量巨大,而且用户手机更换异常频繁,对于变革 接受度很高,追时髦的愿望很强烈,很多时候,中国市场反而有不少创新输出到美国。
这个道理可以推理出为什么小冰会横空出世,它正是微软亚洲互联网工程院创新的成果。根据内部人士讲述,微软亚洲互联网工程院几乎已经成为微软在中国的“自贸区”,可以大胆的在产品上进行尝试,并将成果输出到其他国家。
Cortana 美国送给中国团队的礼物,上面有 Joe Belfiore 的签名
小娜的组成
小娜比 Siri、Google Now 更加的复杂,功能更多,目前微软投入的直接参与人员达到 60 多人,间接参与人员超过百人。闫勃介绍,小娜主要由四部分组成:
- 和设备的智能交互:即基于手机设备进行一些操作,包括打电话、发短信、设置提醒、闹钟等。
- 智能问答:包括结构性知识,以及内容的搜索。
- 主动的智能推送:小娜会在合适的时间、地点推送合适的内容,用户可添加兴趣爱好,对这些内容进行追踪,包括追剧、锁定明星动态。还可追踪火车票、飞机票的延误、动向等等。这是小娜的独特之处,前提是你开放个人数据,完全信任它,后面会越用越顺。
- 小娜的性格:它会模拟人类多样化、情景化的回答,比如偶尔清清嗓子、咳嗽一下,语言表达更像真人。
小娜的核心包括两部分,一部分是大数据的应用,这源于必应作为技术支持,包括必应追星等产品,一部分是个人数据,后者是个性化的内容。
小娜,娜娜,娜姐?
对于小娜的性格,闫勃是这样介绍的:
“小娜首先是一个人,她类似的年龄层就是 20 出头的女孩子,她跟小冰的区别在于,小冰是个小女孩,喜欢玩闹,特别淘气,有时候出言不逊,语不惊人死不休。小娜更是一个成熟的女性,她可能更知性、更体 贴,说话也更温柔,但是她也有自己的小个性,总体而言她就是给你提供各方面的帮助,所以她是一个成熟女人的形象。”
有趣的是,在微软内部,他们将小冰、小娜的性格具体映衬到个人,根据闫勃的讲述,这两位虚拟人物被他们比喻为天龙八部中的阿朱、阿紫。
和 Cortana 的命名一样,小娜也是几个备胎中选出来的名字。他们当时做了大量的内部调查,觉得直译名字“科塔娜”虽然听起来是个洋名,但是很像汽车名字,于是做了几个内部选项,主要是围绕“娜”字来展开,分别是小娜、娜娜、娜姐。
依照性格对比发现,娜娜显得有的过于丰满,小娜相对中性,而娜姐听起来岁数太大,最后选择了小娜。
在声音上,他们也参照了这个标准,请了不少录音人,最后内部投票选择最合适的声音。另外,他们还为小娜精心设计了面团的 LOGO。
小冰,小娜会有结合
性格只是小冰、小娜外在表现最大的不同,实际上技术来自一家,都是基于必应的搜索结果。而鉴于小冰在中国引起的轰动,闫勃团队正在设计将小冰与小娜进行结合,这在技术上不难,目前他们正在进行内部调试。
最后,所表现出来的形式类似于可以在小娜中随时唤出小冰,在让它完成个人助理任务时,还能陪你闲聊,一个是助手,一个是伴侣。此外,小娜还会朝更加个性化的方向发展,包括定制自己喜欢的声音,比如男声,他们内部甚至还讨论过是否出一个男性化的“小兵”。
对于语音助手未来的演变,闫勃认为用户还需要有一段适应期,它不仅需要用户多一些耐心,降低预期值,还需要过渡一段与虚拟人物谈话的诡异历程,直到它变成一件很自然的事。而语音并不会代替掉鼠标、触摸屏和手势,这些交互技术各有所长,未来会互相结合使用。
作为移动设备上的语音助手,小娜很快也会走向 Windows、Xbox 设备上,在微软全平台上得到应用,与之对应的是,苹果也传出正在研发 Mac 版 Siri 的消息,随着大数据、云计算技术的发展,类似小娜、Siri 这种语音助手未来将会无处不在。