非死book的深度学习系统可造出以假乱真的图像

cen 10年前

原文 http://www.pintu360.com/article/55861f54ea7a08856e215dde.html

在Google、微软、百度等巨头的推动下，人工智能技术的发展突飞猛进。能识别图像已经不算什么本领了，现在Faebook的AI技术已经几乎可以以假乱真，令受试者在40%的时间把计算机生成的图样当作是真的照片。

这项成果是由非死book人工智能实验室的三位研究人员Soumith Chintala、Arthur Szlam、Rob Fergus与纽约大学库朗计算机科学研究所的Emily Denton联合完成的，论文题目叫做《用对抗网络拉普拉斯金字塔的深度生成式图像模型（Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks）》，非死book已经把论文提交到即将在蒙特利尔举行的神经信息处理系统大会（NIPS，AI业界最著名的会议之一）上供讨论。不仅如此，非死book还打算稍后（可能下周末）将工作的代码开源出来供大家参考。

简单来说，非死book的AI技术可以自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本令观看者信以为真。非死book这项研究成果的特别之处是，其AI采用的是无监督学习。以往包括Faebook在内的大公司和初创企业采用的普遍都是监督式学习，即需要利用大量带标签的数据去训练人工神经网络，后者才能逐渐学会识别东西。比方说，给它看1000张猫的图片，看多了之后AI才会逐步对猫建立模型并识别新的图像。

非死book的深度学习系统可造出以假乱真的图像

Google的人工神经网络可以根据原图生成带魔幻色彩的图像，但非死book的Rob Fergus认为，自家生成以假乱真图像取得的技术进展更高。

而无监督学习中样本数据是不包含标签的。这更接近于人学习认东西的方式。比方说，看过1、2部手机之后，我们很快就能认出第3部。在实现上，非死book采用了两套受训神经网络，一套是产生式的，赋予其随机向量后就能生成图像；而另一套则用来确定图像是否看起来是真的。目前这套系统能生成64x64像素的图像。

由于不需要对训练数据打上标签，这项技术无疑可以帮助非死book更好地进行图像、视频、语音的识别工作，自然语言处理技术也可以相应提高。Google前两天也公布了自己的一项 AI成果，利用人工神经网络生成迷幻图像。尽管看起来很酷，但非死book的研究科学家Rob Fergus认为，与非死book可生成以假乱真图像相比，自家的技术显然更难，取得的学术进展更多。当然，64x64的分辨率尚不具备使用价值，非死book的下一步计划是逐步提高生成图像的分辨率，届时，虚拟与现实的界限将进一步模糊，人类距离AI的圣杯越来越近了。

本文参考了多个信息来源： venturebeat.com 、 arxiv.org 、 googleresearch.blogspot.com

非死book的深度学习系统可造出以假乱真的图像

相关资讯