微软牛津计划:拥抱机器学习,再次升级
微软牛津计划主页:https://cn.projectoxford.ai/
今年上半年,微软发布了牛津计划——一个由 API、SDK 和服务构成的套件,可以帮助开发人员开发出更智能,交互更多样的应用。牛津计划是在微软一系列机器学习 API 组合的基础上扩展而来,藉由牛津计划,开发人员能够在他们的应用中轻松添加智能功能——例如视觉、语音、面部识别和语言理解等。牛津计划中的的人脸识别、语音识别和计算机视觉的一系列 API 已经被应用在微软小娜分析套件里。
如今,牛津计划中的语言理解智能服务(LUIS)的覆盖面进一步扩大,包括测试版的推出、支持中文和提供更多的预设模型。此外,牛津计划面部识别、可视化工具和语音识别 SDK 的测试版现在也可以通过 GitHub 获取。
支持中文!LUIS 的更多新功能
LUIS 允许开发人员构建模型用于自己的应用中,从而理解针对该应用的指令和自然语言。
范例:LUIS 对“move my meeting called budget review to be at 2 pm tomorrow”这句话的分析。LUIS 同时确定了语句内(改变_日程_条目)的意图以及时间、日期和事件标题等实体对象。
先前,LUIS 项目仅限受邀人员使用,而今 LUIS 测试版正式面向所有开发者公开。最新功能也同步上线,包括:
支持中文:提供中文支持是大家呼声最高的功能之一。现在,你可以随心所欲创建英文或中文 LUIS 应用了!此外,LUIS 还能够正确处理夹杂英文片段的中文句子。
应用的导入和导出:现在,你向 LUIS 输入的所有应用数据都可以下载到 JSON object 中,并且能通过导入该 JSON object 来创建一个全新的应用。这样,开发人员就能够轻松复制应用、与他人共享应用以及对自己的应用进行代码管理——例如,让使用了 LUIS 的应用程序保持版本和代码的统一。
扩充预设模型:LUIS 向公众开放的许多模型也在微软的产品中使用,目前可获取的模型数量从想法到实体已经不止扩大了三倍——从原来的 56 个到现在多达 196 个。
自推出以来,我们一直通过
LUIS 的标记界面可以很容易地对英语或中文语句贴标签,并迅速构建定制模型。
开发人员已经开发了许多非常神奇的 LUIS 应用!例如,Meekan 公 司为多个平台(Slack、HipChat 等)开发的文本机器人可以帮助忙碌的人进行更充分的日程安排。这种机器人的独特之处在于它能够识别复杂的时间跨度和行动(例如“把会议安排在周三中午前 后”,或“把明天的会议延后到周五下午”)。Meekan 在所有意向和标签识别功能中使用了 LUIS,以帮助区分公司的文本机器人可以或不可以帮助执行的行动,同时从用户的表述中发现重要的实体对象。
“从原型到生产准备的过程中,LUIS 为我们节省了大量时间,”Meekan.com 的联合创始人兼首席技术官 Eyal Yavor 说:“我们专注于用户交互,而 LUIS 则在后台工作,帮助我们了解用户的使用情况。刚开始我们仅用少量样本语句,LUIS 的反馈回路就能帮助我们迅速改善机器人。”
微软 GigJam 项目还利用 LUIS 进行语言理解。目前尚处于预览阶段的 GigJam 提供了前所未有的新途径,打破设备、应用和人与人之间的隔阂,帮助团队完成任务,并转变业务流程。GigJam 的用户只需要说“显示我的邮件”“把这些邮件排序”或(在屏幕上圈定了一张发票后)“和约翰 AA”,这些五花八门、脱口而出的表达都将由 LUIS 来处理。
开发人员也曾告诉我们,他们使用 LUIS 构建了用于订购比萨饼、控制家里的设备、预约出租车和播放音乐的对话系统。通过将 LUIS 与其他牛津计划服务配对使用,开发人员还创造出了一些非常令人惊喜的东西,共有超过 4000 种模型,并且这个数字仍在不断增长。例如,开发人员借助牛津计划的语音 API,设计了一个为人们说绕口令的技能打分的系统。通过与牛津计划中针对光学字符识别的视觉 API 配对使用,LUIS 甚至可以识别 meme 图中的文字。
牛津计划SDK 现已登陆 GitHub
自从牛津计划推出以来,微软开发人员使用 API 创建了 How-Old.net 和 TwinsOrNot.net(微软我们)等众多受欢迎的网站。今天,我们将牛津计划中的脸部识别、计算机视觉和语音识别 SDK 加入 GitHub,力图帮助开发人员更容易地创建属于自己的应用。
通过专门用于客户端 SDK 的牛津计划软件库,开发人员能够查看源代码、访问历史记录、提交问题甚至为代码编写做出贡献。
由此,我们得以更好地与开发者群体携手,打造一个更具包容性、更强大的平台。目前软件库提供对 Windows 和 Android 两大平台在面部识别、计算机视觉和语音识别支持,我们正在努力增加其他的软件包,并增加呼声很高的、在 iOS 和 Node.js 两个领域的 SDK 支持。请访问 https://github.com/Microsoft/ProjectOxford-ClientSDK,关注微软牛津计划,并进行分享和创造,同时也欢迎大家的意见、问题和引入请求。GitHub 也不是唯一能找到牛津计划的地方——如需改善工作流程,您还可以分别通过 NuGet 和 Maven 获取我们的 Windows 和 Android 软件包。