揭秘非死book语音识别项目 蕴含无限可能和机遇
jopen 6年前
<p style="text-align:center"><img alt="揭秘非死book语音识别项目 蕴含无限可能和机遇" src="https://simg.open-open.com/show/42c4aee0a189d65e0f94174f4287e4d8.jpg" /></p> <p>8 月 23 日消息,据外媒报道,非死book 加入语音计算革命大潮的速度有点儿慢。它还没有自己的语音助手,智能音箱仍在开发中,Instagram 等诸多应用程序也没有完全集成音频通信功能。但从 非死book 代码中发现的线索以及新的专利申请来看,这一状况将发生很大变化。</p> <p>开发语音功能可以让人们在家里或在旅途中使用 非死book 的方式更多。据报道,非死book 即将推出的 Portal 智能音箱是专为方便与远方家人视频聊天而设计的,这些家人包括使用智能手机不便的老人和孩子。改进后的转录和语音-文本-语音功能可以让 Messenger 用户通过输入媒介连接起来,并让他们始终保持在聊天应用上,而不是返回到 SMS。</p> <p>但如果 非死book 不尽快行动起来,它的语音项目可能会被竞争对手的喧嚣淹没。所有主要的移动硬件和操作系统制造商现在都有自己的语音助手,如苹果的 Siri、亚马逊的 Alexa、谷歌的 Assistant 以及三星 Bixby,他们都在自家智能音箱上集成了语音助手。</p> <p style="text-align:center"><img alt="揭秘非死book语音识别项目 蕴含无限可能和机遇" src="https://simg.open-open.com/show/1789f533b25a53d30f56974aadcd0b74.jpg" /></p> <p>2018 年第二季度,全球智能音箱出货数据</p> <p>市场研究机构 Canalys 估计,在 2018 年第二季度,Google Home 的出货量为 540 万部,亚马逊 Echo 的出货量为 410 万部。而 Strategy Analytics 的数据显示,苹果 HomePod 起步缓慢,所占市场份额不到6%,依然落后于阿里巴巴的智能音箱。鉴于 非死book 在隐私问题上的糟糕记录,可能导致潜在客户转投竞争对手。</p> <p>考虑到 非死book 在语音计算革命中已经落后,它需要强大的工具来解决真正的问题。下面我们来看看 非死book 在语音领域取得的最新发展,以及它过去的实验如何为下一次飞跃奠定了基础。</p> <p><strong>Aloha</strong></p> <p>非死book 正在开发自己的语音识别功能,名为 Aloha,它适用于 非死book 和 Messenger 应用,同时也适用于外部硬件,比如其正在开发的视频聊天智能音箱。独立应用程序研究员 Jane Manchun Wong 挖掘出来的 非死book 和 Messenger Android 应用代码,首次展示了 Aloha 用户界面的原型。</p> <p>它的标签为“Aloha 语音测试”(Aloha Voice Testing),当用户在消息线程中说话时,一个水平的蓝色条会展开并收缩,以在识别和转录文本的同时显示语音的音量。这段代码描述了该功能可与外部 Wi-Fi 或蓝牙设备连接。这款软件有可能同时在 非死book 的硬件和软件上运行,类似于 Google Assistant,它可以在手机和 Google Home 智能音箱上运行。</p> <p>非死book 拒绝对这段视频发表评论,但其发言人表示:“我们始终在测试些新东西,今天没有什么要分享的,但我的团队几周后会联系 AR/VR 网站发布有关硬件方面的新闻。”目前还不清楚“硬件新闻”是否会集中在语音和 Aloha 或 Portal 上,或者仅仅是与 非死book 9 月 25 日举行的 Oculus Connect 5 发布会有关。</p> <p>知情人士此前曾表示,多年前,非死book 有意开发自己的语音识别软件,专门用于准确记录朋友之间的交谈方式。与我们正式称呼像亚马逊 Alexa 或 Google Home 这样的电脑化助手相比,非死book 的语音模式通常更随意、口语化、快速且充满俚语。</p> <p>Jane Manchun Wong 还在 非死book 的代码中发现了 Aloha 的 logo,该代码以火山图像为特色。现在可以确认,有人曾在 非死book 员工的手机上看到过有类似 logo 的 非死book Aloha Setup 聊天机器人。</p> <p>如果 非死book 能够解决这个问题,它可以在 Messenger 和网站的其他地方提供自己的转录功能,这样用户就可以跨媒介进行交流。它可能会让你在忙得不可开交或看不清屏幕时,向朋友口授评论或信息。然后,收件人可以阅读文本,而不必去听语音信息。该功能还可以用于为 非死book 应用程序的语音导航提供动力,从而更好地支持免提功能。</p> <p><strong>音箱与摄像头专利</strong></p> <p>2017 年 8 月份有报道称,非死book 的视频聊天智能音箱最初代号是 Aloha,后来更名为 Portal。这款售价 499 美元的亚马逊 Echo Show 竞争对手最初定于今年 5 月份在 非死book 开发者大会 F8 上推出。但彭博社报道称,由于担心此举会加剧剑桥分析公司(Cambridge Analytica)引发的隐私丑闻,该产品被推迟上市。</p> <p style="text-align:center"><img alt="揭秘非死book语音识别项目 蕴含无限可能和机遇" src="https://simg.open-open.com/show/1f9f3ee52262cf47e80205145a7d53b0.jpg" /></p> <p>非死book 获得的智能音箱专利</p> <p>一项新的专利申请显示,非死book 早在 2016 年 12 月 26 日为一种立方体形状的设备申请专利时,就在考虑打造智能音箱。专利描述了由巴贝克·埃尔米赫(Baback Elmieh)、亚历山大·贾斯(Alexandre Jais)以及约翰·普罗科什-韦利(John Proksch-Whaley)发明的“音箱装置”。同年 9 月,非死book 收购了埃尔米赫的初创公司 Nascent Objects,他现在是 非死book 秘密建筑硬件实验室的技术项目负责人。</p> <p>这家初创公司始终在打造模块化硬件,今年早些时候,埃尔米赫在 非死book 的几个模块化摄像头项目获得了专利。非死book 一直在开发的音箱和摄像头技术可能会演变成视频聊天音箱。事实上,非死book 已经探索智能音箱技术很长时间了,而且这些专利的发明者仍在硬件实验室研究秘密项目,这强化了 非死book 在语音领域有宏伟计划的观点。</p> <p style="text-align:center"><img alt="揭秘非死book语音识别项目 蕴含无限可能和机遇" src="https://simg.open-open.com/show/18410986fa4c43914dec0e8467163b39.jpg" /></p> <p>非死book 获得的专利显示相机(左)和视频摄像头设计</p> <p><strong>Instagram 语音信息</strong></p> <p>最后,Instagram 也在向语音领域进军。Jane Manchun Wong 从 Instagram 的 Android 应用程序代码中生成的截图显示,非死book 显然在开发语音短信功能 Instagram Direct。这将允许你在 Instagram 上发声,并发送类似于步话机的音频片段,或早在 2013 年添加的 非死book Messenger 语音信息功能。</p> <p>你可以在屏幕底部的信息编排器中看到语音按钮,代码解释说“语音信息,按下并保持记录”。这款原型机是在 Instagram Direct 最近推出视频聊天功能后亮相的,也是通过 Jane Manchun Wong 的研究发现的另一个功能。Instagram 发言人拒绝置评,因为尚未公开测试的新功能在代码中被发现,他们就没什么可分享的了。</p> <p><strong>漫长的探索之路</strong></p> <p>长期以来,非死book 始终在语音领域徘徊。2015 年,非死book 收购了自然语言处理初创企业 Wit.ai。这家公司运行着开发者平台,用于构建语音接口。不过后来,非死book 将 Wit.ai 并入到 Messenger 平台团队中,专注于开发聊天机器人。</p> <p>非死book 还在 2015 年开始测试自动将 Messenger 语音片段转录为文本的功能,这可能是上述 Aloha 功能的基础。该公司还透露,其个人助理M可以为用户完成任务,但它只是在非常有限的用户基础上推出,后来被关闭。</p> <p>2016 年,非死book 的 Messenger 主管大卫·马库斯(David Marcus)声称,语音”并不是我们现在积极开发的工作”。但他补充道:“在某种程度上,随着我们在 Messenger 中开发越来越多的功能和交互,我们将开始研发语音交流和接口。”然而,消息人士透露,非死book 的秘密预言技术团队已经在探索语音机会。非死book 还开始为那些只想播放声音而不是视频的用户测试其实时音频功能。</p> <p style="text-align:center"><img alt="揭秘非死book语音识别项目 蕴含无限可能和机遇" src="https://simg.open-open.com/show/b39b06f5bc03913180fbb000287f8087.jpg" /></p> <p>非死book 从未放弃过语音识别努力</p> <p>到 2017 年,非死book 为网页视频提供了自动字幕,并开发了语音搜索功能。今年,非死book 开始尝试将语音片段作为状态更新和 Stories,供世界各地可能无法用母语打字的用户使用。但高管们并没有过多谈及语音计划。</p> <p>非死book 设计总监卢克·伍兹(Luke Woods)曾在 2017 年表示:“语音搜索非常有前途,有很多令人兴奋的事情发生。我喜欢能和汽车对话,让它导航到特定的地方。这是许多潜在用例之一。这也是声音转录可以提供帮助的领域之一。”</p> <p>目前还不清楚 非死book 的 Aloha 到底会变成什么样子。它可能是 非死book 智能音箱和应用的实际操作系统或语音界面及转录功能,也可能会成为像M那样功能更完备的语音助手,但也支持音频。或者,它可能成为 非死book 通往其他语音生态系统的桥梁,充当 非死book 的 Alexa Skill 或 Google Assistant Action。</p> <p>来自: <a href="/misc/goto?guid=4959013880815670771" id="link_source2">腾讯科技</a></p>