iOS10 SiriKit QQ适配详解
SusNagel
8年前
<h2><strong>1. 概述</strong></h2> <p>苹果在 iOS10 开放了 SiriKit 接口给第三方应用。目前,QQ已经率先适配了 Siri 的发消息和打电话功能。这意味着在 iOS10 中你可以直接告诉 Siri 让它帮你发QQ消息和打QQ电话了,听起来是不是很酷炫?</p> <p>那么第三方应用使用 Siri 的体验究竟如何?哪些应用可以接入SiriKit?接入 SiriKit 又需要做哪些工作呢?这篇文章会为你一一解答这些疑惑。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/e23add9123bc9dbd7cfaf8b4ec781cc5.jpg"></p> <p style="text-align: center;">图1 用Siri发QQ消息效果展示</p> <h2><strong>2. SiriKit 简介</strong></h2> <p>我们都知道 Siri 是 iphone 手机中的智能语音助手,那么什么是 SiriKit 呢?SiriKit 是苹果为第三方应用支持 Siri 提供的开发框架。在官方文档中,SiriKit 将对不同场景的语音支持划分为不同的 domain,目前,SiriKit 支持的 domain 包括:VoIP 电话、发消息、转账、图片搜索、网约车订车、CarPlay 和餐厅预定,也就是说如果你的应用中包含有这些功能之一,就可以考虑将这些功能接入到 SiriKit 中啦。</p> <p>实现 SiriKit 相关功能时,我们并不需要真正对语音进行识别,语音的识别工作会由 Siri 完成。Siri 识别完语音后,会将语音要完成的功能抽象成 Intent 对象传递给我们,而我们的接入工作主要是与这些 Intent 对象打交道,并不会涉及到自然语言处理(NLP)的技术。</p> <p>关于 SiriKit 的开发网上已有一些文章,也可参考苹果的官方文档 SiriKit Programming Guide,本文着重介绍QQ的适配经验。</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/53dc1f6fbf0ffdc48ea5c0c64db4ab90.jpg"> 图2 SiriKit原理</p> <h2><strong>3. SiriKit 接入</strong></h2> <p>要实现 SiriKit 的功能需要在 Xcode 工程中添加 Intents Extension 的 target,和其他 extension一样, Intents Extension 是一个独立于 Containing App 进程运行的插件,主要用于处理和确认来自 Siri 的 intent 请求。如果想让 Siri 在处理 App 相关 intent 时提供一些自定义的界面,那么你就需要再添加 Intents UI Extension 的 target,Intents UI Extension 也是一个独立运行的插件(所以要完整的支持 SiriKit 其实是需要添加两个 target,有点蛋疼)。关于 App Extension 的开发可以参考苹果的 App Extension Programming Guide。</p> <p>我们以QQ中的发消息功能为例说明一下SiriKit的接入方法:</p> <p>首先,我们需要在 Intents Extentsion 的 info.plist 文件中配置我们需要支持的 siri Intents,在 IntentsSupported 中加入 INSendMessageIntent,如果需要在锁屏时禁用某个功能,则再在 IntentsRestrictedWhileLocked 中加入相应项的 Intent,如图3所示。</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/844491abbf2dcac8ff5c047417fe4e52.jpg"></p> <p style="text-align:center">图3 Intent Extentsion info.plist配置</p> <p>SiriKit 的接入主要分为 Intents Extension 和 Intents UI Extension 两部分,下面分别进行介绍。</p> <h3><strong>Intents Extension</strong></h3> <p>当我们对 Siri 说“用QQ发消息给王一然说你好”时,语音的识别将会由 Siri 自动完成,Siri 会将识别好的内容展示在 Siri 的界面。如图4所示,我们可以看到一个完整的发消息语句主要由四部分组成:</p> <p>应用名:告诉 Siri 要使用哪个 App,Siri 会根据 app 的 bundle displayname 自动识别 app 的名称,无需额外注册。</p> <p>发消息Intent:告诉 Siri 要使用发消息的功能,我们实测发现说发信息也是能识别,具体还有哪些词汇会识别为发消息的 intent 苹果没有在文档中说明。</p> <p>消息接收者:告诉 Siri 消息的接收者是谁,“王一然”是我QQ好友的昵称。</p> <p>消息内容:告诉 Siri 你要发的消息内容是什么,这里的消息内容为“我很生气”。</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/3555b07dc9c3efe27371cbcd570fe5ca.jpg"></p> <p style="text-align:center">图4 确认发送消息界面</p> <p>其中应用名和 Intent 是必须的,不然 Siri 无法抽象出你的“Intent”。后两项如果缺省的话,我们可以在实现中要求用户进一步提供数据或者忽略。在识别完成后 Siri 会将消息内容和接收者抽象成一个 INSendMessageIntent 传递给 QQ的 Intent Extension。</p> <p>我们从图4还可以看到 Siri 准确从我的语音中识别出我QQ好友中昵称为“王一然”的好友,然而“王一然”并不是一个通用的短语,那么这是怎么做到的呢?奥秘就在于在QQ运行时我们把所有QQ好友的昵称同步到了 Siri 云端,这样 Siri 就可以识别出特定用户要使用的特定短语,详细同步方法可参考 INVocabulary 的 setVocabularyStrings:ofType: 方法。</p> <p>每个 domain 的功能在 Siri 中都有对应的 Intents,而每个 intents 都对应一个特定的 handler 协议。对于发消息来讲,对应的 Intent 和 handler 协议分别为 INSendMessageIntent 和 INSendMessageIntentHandling。只要实现 INSendMessageIntentHandling 协议中的相关方法,并在 Siri 解析出 INSendMessageIntent 请求时用我们的 INSendMessageIntentHandling 对象去处理相关的发消息请求。具体的流程如图5:</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/5bfd197a82af20d302875218d3d6fa16.jpg"></p> <p style="text-align:center">图5 Siri发QQ消息流程</p> <p>1)ResolveRecipientsForSendMessage</p> <p>对 Siri 从 Intent 中传递过来的接收者名称进行处理和确认,比如可以确认该名称当前是否在QQ好友列表中,并将 resolution result 反馈给 Siri。Resolution result 代表了应用对 intent 处理后的结果,对于发消息来说,表1列举了几种可能的 resolution results。</p> <p>表1 send resolution result</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/6c2296e2612636f04b9f28d8eb1629c2.png"></p> <p>2)ResolveContent</p> <p>与接收者的处理类似,在这个方法中可以对 Siri 识别出的消息内容进行“修饰”,并且将 resolution result 反馈给 Siri,比如QQ对一些消息里面的特殊词汇如“生气”做了 emoji 适配。</p> <p>3)ConfirmSendMessage</p> <p>这个方法的作用是确认是否要发送该消息,可以在这一步进行一些鉴权工作,鉴权通过后再确认发送,否则取消。确认可以发送后会调起确认发送界面,如图4所示。如果需要从 Containing App 共享数据,具体的实现方案参考 App Group 的 Shared Container。</p> <p>4)HandleSendMessage</p> <p>如图4,当用户点击了“发送”按钮或者用语音给出了发送指令时会最终进入到这个方法,在这个方法里我们需要实现发消息的逻辑,发送成功后可以调起消息发送成功的界面,如图6。</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/ee903a3ab25fb0e35ff8c51f518b6536.jpg"></p> <p style="text-align:center">图6 消息发送成功界面</p> <h3><strong>Intents UI Extension</strong></h3> <p>对于支持自定义界面的 Intent 类型,可以在 Intents UI Extension 中提供更美观的自定义界面。 Custom UI 的实现相对较简单,和 iOS app 的开发一样,都是通过 UIViewController 的子类实现。我们需要在 Intents UI Extension 的 info.plist 文件中设置 initial viewcontroller 或者设置 main storyboard,对于不同类型的 Intent 的界面展示通过 Child Viewcontrollers 的方式实现差异化界面展示。</p> <p>如图7所示,当接收到来自 Intents Extension 的 response 时,系统会唤起 Intents UI Extension 并加载 initial viewcontroller,通过 INUIHostedViewSiriProviding 协议的 configureWithInteraction:context:completion: 方法可以获取 intent,比如在发消息功能中,在消息确认发送和发送成功后都会回调一次这个方法。根据 Intent 对象的类型和状态,在收到相关 Intent 的回调时 present 对应的 Child Viewcontroller 即可实现定制化的界面展示。</p> <p>这里需要注意的是,Intents UI Extension 的进程并不会在界面销毁后就退出,很可能只是在后台处于休眠状态,下次 response 到来时再被唤醒。</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/04074205cb7c6b59aeac44d4e0bd0129.jpg"> 图7 Life cycle of an Intents UI extension</p> <h2><strong>4. 总结</strong></h2> <p>总的来说虽然苹果这一次对 SiriKit 开放的场景有限,但是从我们的适配经历来看苹果对 Siri 还是非常重视的。另外,这是 SiriKit 首次对第三方应用开放接口,所以不可避免存在一些问题。我们在开发过程中也确实遇到了一些 SiriKit 本身的 Bug,大部分 bug 在向苹果反馈后都得到了解决,但是在语言识别方面 Siri 依然存在一些缺陷,比如对中英文混合的场景识别依旧不太好。期待以后 Siri 对中文的支持越来越好,也希望 Siri 能够开放更多的场景给第三方应用适配。</p> <p> </p> <p> </p> <p style="text-align:center"> </p> <p> </p> <p>来自:http://mp.weixin.qq.com/s?__biz=MzA3NTYzODYzMg==&mid=2653577878&idx=1&sn=dff3b3204e2cd8a5869f7a681e0be8d7&chksm=84b3b091b3c43987ed0590a576099aa3184563be2102358b70b5fb0592bd67ff2c3af30bd046&scene=4#wechat_redirect</p> <p> </p>