制造幻景:谷歌图像识别神经网络让人大跌眼镜

pw8c 9年前

制造幻景:谷歌图像识别神经网络让人大跌眼镜

6 月 21 日,谷歌的图像识别神经网络不但可以识别图像,而且可以制造出人意料的奇幻景象。

机器有什么梦想?谷歌新发布的一些机器识别图像为我们给出了一个可能的答案:将不同的景物合成一种奇幻风景。

这些照片是由谷歌的图像识别神经网络产生的,该网络已被“教育”,以识别建筑物、动物和物体等图像。

研究人员将图片输入图像识别神经网络,并让它识别该图片中的一个特征,并修改图片以强调这项特征。修改后的图象然后被反馈到神经网络,并让神经网络再次识别其他特征并强调它们。最终,这幅图片被修改得面目全非。

在一个低水平上,这种神经网络可以被用来检测图像的边界。在这种情况下,这些图像就像绘画作品,使用过 Photoshop 滤镜的人应该对此感到不陌生:

制造幻景:谷歌图像识别神经网络让人大跌眼镜

但是,如果神经网络被要求识别更复杂的图像,——例如识别一头动物,它会产生令人不安的奇幻图景:

制造幻景:谷歌图像识别神经网络让人大跌眼镜

最终,这个软件可以对随机噪声进行识别,但生成的结果完全属于自身的想象:

制造幻景:谷歌图像识别神经网络让人大跌眼镜

如果你让一个用来识别建筑物的神经网络去识别一幅毫无特征的图像,它将产生这样的结果:

制造幻景:谷歌图像识别神经网络让人大跌眼镜

这些照片是惊人的,但他们不仅仅是用来展示的。神经网络具有机器学习的一个共同特征:它不是向计算机输入程序以让它能够识别特定的图像,而是向它输入许多图像,并让它自己整合这些图像的关键特征。

但是,这可能会导致软件更加出人意料。我们很难知道软件正在审查哪些特征,以及它忽略了哪些特征。例如,研究人员要求神经网络在一幅随机噪声图像中识别哑铃,发现它认为哑铃一定是有手臂握住的:

制造幻景:谷歌图像识别神经网络让人大跌眼镜

解决方案可能是向它输入更多放在地上的哑铃图像,直到它明白手臂并非哑铃的内在组成部分。

“神经网络面临的一个挑战是逐层识别。例如,第一层可以识别边缘或拐角。中间层识别基本特征,以寻求整体的形状或部件,例如门或叶子的形状。最 后几层将这些组合成一个完整的图像,在识别非常复杂的事情时,——如整个建筑物或树木,这些神经元很活跃。”谷歌的工程师解释说。

图像识别软件已经成为消费产品,如谷歌新的照片服务 Google Photos。Google Photos 可以根据文本搜索图像:例如,你输入“狗”,它将提供谷歌找到的所有包含狗的照片(偶尔也会出现其他四足哺乳动物的照片)。

所以,未来机器人的梦想将不仅仅是制造电子绵羊,它们的梦想是制造出更加令人吃惊的梦幻奇景。

来自: 腾讯科技