一篇文章看懂谷歌的人工智能帝国,为什么这里一切都是 AI ?

jopen 9年前

一篇文章看懂谷歌的人工智能帝国,为什么这里一切都是 AI ?

2015年11月9日,谷歌宣布开源机器学习平台TensorFlow,让每个人都可以利用计算机和网络去使用这个强大的机器学习平台。谷歌旗下 的50多个产品都运用了TensorFlow深度学习系统(机器学习的深度神经网络),它已变为一家机器学习公司,其产品不断地给世界创造价值。

TensorFlow:人工智能领域的安卓系统

TensorFlow是一个数据库,研究人员和计算机科学家可以利用它来构建数据分析系统,让计算机利用数据进行决策。

机器学习的核心是让机器读懂数据并基于数据做出决策。当数据规模庞大而又非常复杂时,机器学习可以让机器变得更聪明。TensorFlow在数据输入和输出方面都有惊人的精度和速度,它被确切地定义为人工智能工具。

以下是关于TensorFlow的一些细节。TensorFlow系统使用图表数据流,在这个系统里,多个维度的数据在不同的数学计算体系中流 转。这些复杂的数据被称为“张量”(tensor),数学体系中流转着 “节点”(node)。数据在不同的节点之间流转,就能告诉系统不同数据之间的关系。张量在节点中流转,也就是TensorFlow名称的来由。

谷歌开源TensorFlow,这意味着无论是研究人员还是大学生都可以使用这一专业软件。但更深层的是对机器学习公司研究的影响。无论是创业公 司还是行业巨头,都可以根据自身需要使用TensorFlow,即使是用其来开发与之竞争的产品。而谷歌可以借此在人工智能界树立权威。

斯坦福大学计算机科学的Christopher Manning教授在三个月前被授权提前试用TensorFlow来给学生授课,仅仅几周后,Manning教授就决定要在他的课程上长期使用它。

Manning教授表示,有人认为TensorFlow像安卓,但它也有点像Gmail——Gmail比众多竞品都简洁高效。“并不是说之前没有这样的深度学习资料库,但那些产品就像是几名学者和大学生一起打造的。”

在TensorFlow的竞品中,比较有名的是Torch和Theano,这两个数据库都由小型团队不断更新升级,但谷歌在机器学习方面的投入可 不止如此。Manning教授指出,TensorFlow开源对机器学习社区是一份大礼,神经网络的运行速度提高了100倍,这也让谷歌受益匪浅。

“已经有部分公司雇佣了大量优秀人才来开发人工智能,尤其是深度学习。谷歌不是慈善机构,他们在推出TensorFlow之前肯定就预想到,将有很多博士生受益于这个深度学习系统。”Manning教授说道。

研究员汤姆·迪里希说,即使谷歌员工们可以看到你的照片,他们也不会将其用于公司研究。

Jeff Dean是谷歌的高级工程师,他和Rajat Monga可称作是TensorFlow的缔造者。Dean认为,很难估测机器学习社区对TensorFlow的使用率有多高。虽然谷歌认为它用处很大, 但关键在于机器学习社区是否也这样认为。当初设计这样的一个工具就是为了更快地把机器学习的理论变为现实。

“不错,我们希望加速机器学习的研究和发展。机器学习社区一直不断涌现惊人的理论,这是好事,但却没有惊人的成果。”Dean说道,TensorFlow是谷歌给机器学习社区的一份大礼,最理想的情况是,机器学习社区可以饮水思源,分享他们的研究成果。

Dean表示,TensorFlow还可以让谷歌的实习生实现云办公,利用课余时间在学校完成工作。

对于研究人员来说,TensorFlow系统是一个完整的工具包,集成了相关工具和Apache2.0协议,在商业中使用也十分方便。TensorFlow可以在电脑中编译,也可以在移动设备上操作,目前安卓操作系统已经开放,iOS还需稍等时日。

TensorFlow系统还配备了详尽的使用教程,帮助用户更快上手。

Manning教授认为,TensorFlow可以在移动设备上操作的特性将是它和其他开源系统区别开来的关键。

对于现在就想尝尝鲜的开发者,谷歌提供了一个TensorFlow的开发者版本。它内置大量API接口,软件开发者可以轻易操控他们的TensorFlow模块。目前,TensorFlow已被应用到谷歌的50多个APP中了。

探访谷歌人工智能实验室

TensorFlow平台的开放,让我们有机会窥探谷歌的机器学习系统。

实际上,谷歌为了推出这个庞大的人工智能平台,已经默默付出了三年的努力。谷歌更希望人们称它“机器智能”。他们认为“人工智能”这个词包含太多言外之意,他们想打造的是可以应用于机器的智能。

在公司内部,TensorFlow已被使用多年。如果工程师对人工神经网络感兴趣,他们可以自由地修改系统。这样开放的结构让公司内部的100多个团队对这一强大的机器学习技术做出了贡献。

“机器学习是我们重新定义行为的核心变革方式。我们希望在自身所有的产品中使用机器学习,包括搜索、广告、油Tube和Play商店。虽然机 器学习还处于早期阶段,但我们将逐渐把它系统性地运用到这些产品中。”谷歌首席执行官Sundar Pichai在今年10月的季度报告会上表示。

欢迎来到谷歌,这里一切都是AI,AI就是一切

很难列出一个谷歌机器学习的研究体系,因为它一直在变化,并且和公司里的每一支团队都脱离不了干系。

John Giannandrea是谷歌的工程副总裁,他提出了“嵌入型”的概念。2015年秋天,Popular Science的记者在加州山景城的谷歌总部采访了他。

当时,记者走进谷歌大楼内部,发现谷歌研究室被严实地保护着,什么都看不到。当他准备离开时,一个工程师注意到他没有佩戴员工徽章,过去向他询问。记者说,他是一个作家,谷歌自称其研究对公众开放,但谷歌研究室却安保严密。

谷歌总部面积约3.3万平方米,员工骑着自行车穿梭在一栋栋建筑间,每栋办公楼都被公园似的绿地包围着。午休时间,员工们打开手提电脑坐在草坪上,不知道是在应付科学难题还是玩游戏。不同团队在不同办公楼里工作,研究人员要随着团队的更换而随时更换办公室。

在办公楼内部,一切看起来都很平常。办公室有隔间、数不清的电脑显示器、压低声音讨论工作的员工,还有员工们为了小憩而准备的抱枕和睡袋。

谷歌山景城总部,研究人员正在解决机器智能的问题,一起看起来和一般办公室没有什么区别。

谷歌机器智能被不断优化升级,这项技术关系到谷歌的核心产品,包括相片应用、语音搜索和搜索引擎。

此外,Giannandrea还特别提出了手写产品。

“谷歌想了解人们写字的秘密,尽管我们现在还没有相关产品,但不排除这将成为我们的投资方向。”

谷歌的产品体系是如此庞大,某些工具在不同的产品中往往是通用的。

一般来说,谷歌的研究人员都是根据兴趣分组的。一个团队专注于图像识别,一个团队专注于语言理解,还有一个团队专注于语音识别等等。

“如果世界没有谷歌,就别想有更好的语音识别、语言理解和翻译技术了,这些前沿技术一直都是谷歌的重点投资对象。”Giannandrea说道。

目前,超过1000名员工致力于研究谷歌机器智能,在理论和实践中不断进行修正和优化。

谷歌发言人Jason Freidenfelds表示,谷歌的母公司Alphabet从来没有干涉谷歌的机器智能研究,未来也将如此。谷歌研究团队与Google X实验室和Life Sciences公司的合作将持续进行。

来自未来的声音

谷歌的语音搜索正成为一颗冉冉升起的新星。即使不清楚它到底是什么,但你可能已经在不经意间使用过:谷歌的搜索栏下面有个小麦克风图标,当你点击 的时候,就可以用语音而不是文字来进行搜索。这个功能同样也适用于iPhone和安卓版的谷歌搜索应用。许多安卓智能手机的自带搜索栏也有这个功能。

表面上看来,谷歌语音搜索已经成为了仅次于Siri的第二大网关知识库。

虽然谷歌没有公布语音搜索和文字搜索的使用比例,但却公布了另一个数据:谷歌移动端搜索比谷歌电脑搜索的使用率更高,移动语音搜索的使用率在去年翻了一番。超过50%的美国人知道谷歌语音搜索,其中三分之一的人使用过这项功能。

每一年,算法都会迭代几百次,搜索功能也不相上下。要让人们自如地和机器说话并非易事。

高级研究员Françoise Beaufays致力于开发语音搜索背后的语音识别引擎,他表示,随着谷歌语音搜索不断优化,使用的人数会越来越多。

“我们刚开始做语音识别时,用户并不是很感冒我们的产品,因为当时的语音输入有滞后性。但现在,语音输入大大提速,办公室里的人们已经可以自如地运用语音做任何事情了。”Beaufays说道。

Beaufays说话快的时候带有点法国口音,但一般情况下神经网络架构还是可以理解她的语音。她带领她的团队为搜索引擎更换了新的语音识别系统,这个新系统利用的是递归神经网络,更加高级。

机器若要理解语言,首先要知道单词和短语听起来是怎么样的,这意味着它要消化带有不同口音的大量音频文本。算法对这些文本进行处理,把它们加工成相应的关联图,再让机器消化。让计算机剪辑一个音频,它会通过算法生成波形图并进行分析,然后选择最佳的方式进行剪辑处理。

Beaufays解释道,这相当于把声音拆分成一个个单词来理解和处理。

这一切都依赖于原始的音频文本,也叫做训练数据。它是由数百万谷歌搜索用户提供的真实声音。每当你用谷歌进行语音搜索时,语音音频都会上传到谷歌服务器,如果你授权谷歌使用,那么该音频就会被集成到剪辑库,用以训练机器。

但数据在使用之前,要经过几个步骤的处理。首先,擦洗掉音频中所有的用户信息,包括时间、位置、用户配置信息等。然后,人工对该音频进行处理,因为算法需要可靠的文本进行分析。有时候研究人员会在音频中添加噪音,以让机器可以理解一个单词在不同环境下的含义。

Beaufays强调,用户对这些信息是有知情权和选择权的。谷歌收集世界各地人们生活中的信息,这涉及隐私,只在用户许可的情况下谷歌才会进行语音采集。如果你不希望谷歌使用你的声音,就不要勾选许可选项,谷歌会在搜索完成后会删除你的语音数据。

这样的训练让语音搜索更加高效。谷歌公布的数据显示,两年前语音搜索的错误率是25%,现在下降到了8%。

但也有人担心,如果有一天,用户不再授权给谷歌信息使用权,他们要怎样训练机器呢?

聪明的Inbox邮箱

2015年11月初,谷歌宣布将机器学习运用到电子邮件当中,涉及到的是独立于Gmail存在的Inbox邮箱应用。Gmail的产品经理Alex Gawley表示,这是TensorFlow的功劳。

“我们的团队的神经网络研究在不断加强,这项研究很可能帮助机器理解和组织语言,可以帮助人们写邮件。”Gawley说道。

新增的功能称为“智能应答”,在递归神经网络读取了用户的邮件后,会生成三个备选的回复,用户选择一个之后它就会自动发送。

谷歌并不会读取用户的邮件,但是它会根据用户的回复习惯来进行学习。由此,机器可以回答特定问题,但需要神经网络进行修正。

我们通过“智能应答”可以一瞥谷歌的机器学习产品。Inbox团队正在内部测试这一功能,并进行修正和优化。

整个Inbox团队都参与了内部测试,并且给出了越来越多的信息。当这个应用在各种环境中都可以运作无误时就会与公众见面。

内部测试让研究人员发现了很多Bug。例如,机器会自动生成一句“我爱你”作为回复,因为“我爱你”在私人邮件中十分常见,因此机器就把它划为重点句子。

这些研究都是为了让人们可以更轻松地工作,这是谷歌许多产品的一致目标,特别是个人助理Google Now。它的团队口号是“在正确的时间做正确的事情”。Google Now的负责人Aparna Chennapragada表示,机器智能需要深度训练后才可以内置到平台中。

“发现问题对于人类来说很难,但是对于机器却很容易,而且机器还比人类完成得更出色。”Chennapragada说道。

目前,谷歌的产品在探索让人类生活变得更轻松的途径。Chennapragada把Google Now和5年前出现的语音识别相比,产品虽好但还不完美。

目前谷歌正在探索如何利用三种不同数据为用户提供信息,他们认为手机是一个“部分注意力集中装置”,理想的服务不应该超出用户所能承载的信息量。

机器智能和智能手机的终极目标是:智能手机化身真正的个人数字助理,具备超越人类大脑的知识和预测能力。为了做到这一点,你的手机需要获取大量信息:你的日程表,你的喜好,你去的地方。这些信息唾手可得,因为手机可以记录这一切。

谷歌知识图谱把一切个人信息收入囊中,意味着你的世界全被浓缩到指尖的设备中,到了那时,也许连怎么去机场都要完全依赖手机了。

谷歌使用大数据的另一个例子是道路交通情况检测。通过大量匿名用户手机提供的数据,谷歌可以知道哪些道路交通拥堵,哪些道路顺畅。同样的方法也可以检测出哪些咖啡店或餐馆门庭若市,哪些门可罗雀,从而省去排队的麻烦。

Google Now是谷歌运用机器智能的绝佳例子,它可以读懂图片在不同时代的含义,并且用幽默的口吻表达出来。

组织全世界的信息

上文提到了Google Now利用知识图谱工作,知识图谱究竟是什么东西?

John Giannandrea于2010年进入谷歌,是谷歌的早期研究主管。他曾经创办了Metaweb公司,研究对象是互联网上的相关文本和对象。

Giannandrea很早就发现搜寻信息和类似的信息片段是平行进行的。

2012年,知识图谱发布,它囊括了强大的功能,可以自动弹出搜索内容的相关信息。比如当你搜索“Popular Science是什么时候成立的?”,谷歌会自动弹出答案:1872。

谷歌不仅改变了互联网,也为用户提供了更加便捷有效的途径。这是谷歌第一次把人工智能运用到其主打产品中。从那时起,谷歌把这个为其增加了15%日均搜索量的人工智能模型称为RankBrain。这样的功能是传统算法无法实现的。

Geoff Hinton是顶尖的人工智能理论家,他和许多牛人齐名,包括非死book的Yann LeCun,谷歌的Yoshua Bengio和百度的吴恩达。

和Hinton说话就像是在和未来5年的人说话似的。他表示,将矢量的文本转化为向量,这样机器就可以理解并记住冗长的信息。

当今的计算机程序通过查找词库中定义的单词来分析文本,但最佳的方法是像人类一样消化理解文本。

“谷歌希望机器可以提取文本,进行推理分析,理解文本的含义。如果我们做到了这一点,那么我们的产品可以为人们提供更好的解决方案。”Hinton说道。

那为什么还做不到呢?

Hinton表示,理解人类大脑并使机器与之相匹配是一个大规模的工程,当前的限制是人工神经网络的研究人员还没有完全参透复杂的大脑。目前我们有数以百万计的因素可以操作,但是大脑中的信息是这个数字的10万-100万亿倍。

虽然现实并不乐观,但Hinton仍持积极态度,他认为人工智能的研究并没有到达冬天。其中一个重要原因是人工智能得到不断推广,过去五年来的进步更是让人欣喜,特别是在图像和语言识别方面。这些问题在过去看起来很复杂,但随着时间的推移,测试错误率不断降低。

“机器的性能越来越接近人类,虽然不是在所有方面,但在识别等方面确实得到了极大提升。几年前,计算机视觉专家会告诉你‘不,在几年内我们是达不到这个水平的。’但是我们现在做到了。这就是我一直保持乐观的原因。”Hinton说。

即使一个机器可以高度模仿人脑,但如果普通人不会使用它,那也是白搭。因此,谷歌想让人工智能简单化。尽管背后的技术充满了复杂和不稳定因素,最终的结果也是多种因素作用的产物,但时间会让技术不断升级。

Google Now负责人Chennapragada说:“谷歌正处在魔法和神秘的中线,我们选择神秘。”( 本文首发钛媒体

【本文由钛媒体作者黑匣编译自popsci.com,原作者D ave Gershgorn】