Google 的 AI 原则公布一年了,Jeff Dean 汇报了成果
一家技术公司如何将公司使命、技术价值观,和技术先进性合而为一?
紧跟着 5 月份谷歌开发者大会(Google I/O)上 Jeff Dean「To Be Helpful」的主题分享,这位 Google AI 的总负责人,又在 7 月份来到东京,面对整个亚太的确的媒体与开发者,以「Solve with AI」为主题进行了一次「成果汇报」。
Jeff Dean 与 Google AI 团队部分成员 Google
两次分享中间隔的 6 月,恰好距 Google 公布自己的「人工智能原则」(AI at Google: our principles)一年。在 2018 年的初夏,Google 发布了这一系列原则,其中的条目直指近年来人们对于人工智能技术应用伦理的担忧,其中包括了:
一年之后,那些集中体现了上述原则的典型应用案例被 Google 归纳在了名为 AI for Social Good 的项目之下,其背后的逻辑是一家技术公司如何将公司使命、技术价值观,和技术先进性合而为一。
学习模式
很早公布过的联盟学习 (Federated Learning) 模式,在这次的分享中被 Jeff Dean 再次强调。其讲述重点也从效率倾斜到了数据安全性。
这种区别于传统数据集中学习模式的新方法,由 Google 在 2016 年提出,并与今年开源了 TensorFlow Federated,优势在于多终端和计算节点互通下的高效学习效率,以及庞大数据传输中的终端数据安全保障。在联盟学习模式下,不需要从设备上收集原始数据,用户可以通过手机终端下载现成的模型,在本地完成训练,迭代完毕后加密上传更新,然后不断循环,最大限度地兼顾了效率与安全。
医疗与健康
糖尿病成为一个全球性的健康重症 Google
在医疗健康领域,Google AI 典型的应用案例代表,包括了肺癌筛查、乳腺癌检测,以及糖尿病检测。
肺癌在所有癌症中的致死率一直高居榜首,全球范围内甚至可达到 3%。相比传统医疗手段中 80% 的肺癌病例未能在在早期被检测到,最迫切的需求集中在早起筛查领域。目前,人工智能解决方案的临床应用,将初期检测到的病例增加了 5%,而假阳性误诊病例却降低了 11%。
乳腺癌的传统筛查方法是在一张 10 亿像素的幻灯片中,大海捞针似的寻找癌细胞在淋巴组织中的扩散痕迹。人工智能模型在这一领域的应用,可以达到 22% 的检测发现率,但是同肺癌筛查状况不同,这其中也增加了假阳性的误诊比例。因此目前被鼓励的方向,是人工智能同医生人工检测的相互结合与互助互证。
目前,全球超过 4.15 亿的糖尿病病例几乎都伴随着视网膜病变,并可能直接导致失明,医疗水平欠发达地区甚至缺乏人力进行初期检测。Google 通过与外部公司的合作建立了针对糖尿病视网膜病变的视觉识别系统,并且已经在今年达到了同眼科专家相持平的检测水平。在印度和态度,这套系统已经进入临床试用阶段。
环境保护
座头鲸叫声与船舶噪音的分辨 Google
通过声音识别和视觉识别,Google AI 已经在海洋濒危物种保护、雨林非法砍伐监控,以及垃圾回收识别和农业害虫鉴别方面进入了实际应用阶段。
美国国家海洋和大气管理局 (NOAA) 通过水下音频收集,已经积累了 19 年的庞大数据库。通过与 Google 的合作,NOAA 已经可以在繁杂多变的水下声音世界中,识别出濒危物种座头鲸的叫声,并通过自动识别鲸鱼叫声的神经网络绘制成了座头鲸海洋活动轨迹的动态地图,使得对于特定海洋物种的追踪和定向保护成为可能。
在陆地上,Rainforest Connection 公司在南美和东南亚的雨林利用安卓系统手机在树木顶端搭建起雨林声音采集和监控系统,并基由 TensorFlow 实现了对于电锯声和伐木工程车轰鸣声的实时识别,目前藉由这个方案得到保护的雨林面积已经超过了 2000 平方公里。
类似于中国上海北京等城市最新出现的垃圾分类和回收难题,印尼作为世界上第二大塑料垃圾污染国,已经开始使用一种基于 Google AI 所实现的手机拍照识别塑料垃圾种类的应用,照片经过识别后,除了种类,还能显示出不同塑料垃圾品类的回收和再利用价值。
利用旧安卓手机制作的雨林声音采集装置 Google
对残障群体的帮助
听力或语言障碍,占据了目前全球残障人士总数的相当比例。在针对听障人士的人工智能应用中,语音识别技术目前不但可以将人际对话转录为视觉文字实时呈现,是的听障人士可以参与日常交流,还可以将生活中的声音,比如体育比赛中的欢呼、公路上汽车的鸣笛、焰火腾空后的爆破等,一并实时转录为文字,以尽可能的为这一残障群体提供无差别的现实世界感知和交互。目前 Google AI 在这一应用上可支持的语言已经超过 70 种。
而反向的,对于因中风、渐冻症,或帕金森等神经系统疾病造成的语言障碍人群,Google AI 建立起了能够识别他们模糊发音,以及手势,甚至眨眼等方式声音和视觉模型,帮助他们实现实时文字转录,甚至语言发声。这是一种比当年史蒂芬 · 霍金博士使用的交互系统更加高效和便捷的解决方案,最终能够实现每一位语言障碍人员的轻松使用。
从上述已经进入实用阶段的 AI 应用案例之中凝练抽离出来的,是对于目前全球科技商业领域对于技术先进性摇摆迷惑的最佳解答:真正的技术先进性,终究只能通过技术价值观作为表达,那些技术路径和商业化之中的困顿,大多来自于将两者的剥离甚至对立。
就像 Jeff Dean 说到的:在这个时代,机器已经能够做到看、听、说和理解。然而如何看?听什么?为谁说?理解谁?才是需要不断回答的终极问题。