非死book的深度学习系统可造出以假乱真的图像
在Google、微软、百度等巨头的推动下,人工智能技术的发展突飞猛进。能识别图像已经不算什么本领了,现在Faebook的AI技术已经几乎可以以假乱真,令受试者在40%的时间把计算机生成的图样当作是真的照片。
这项成果是由非死book人工智能实验室的三位研究人员Soumith Chintala、Arthur Szlam、Rob Fergus与纽约大学库朗计算机科学研究所的Emily Denton联合完成的, 论文 题目叫做《用对抗网络拉普拉斯金字塔的深度生成式图像模型(Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks)》,非死book已经把论文提交到即将在蒙特利尔举行的神经信息处理系统大会(NIPS,AI业界最著名的会议之一)上供讨论。不 仅如此,非死book还打算稍后(可能下周末)将工作的代码开源出来供大家参考。
简单来说,非死book的AI技术可以自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本令观看者信以为真。非死book这项研 究成果的特别之处是,其AI采用的是无监督学习。以往包括Faebook在内的大公司和初创企业采用的普遍都是监督式学习,即需要利用大量带标签的数据去 训练人工神经网络,后者才能逐渐学会识别东西。比方说,给它看1000张猫的图片,看多了之后AI才会逐步对猫建立模型并识别新的图像。
Google的人工神经网络可以根据原图生成带魔幻色彩的图像,但非死book的Rob Fergus认为,自家生成以假乱真图像取得的技术进展更高。
而无监督学习中样本数据是不包含标签的。这更接近于人学习认东西的方式。比方说,看过1、2部手机之后,我们很快就能认出第3部。在实现 上,非死book采用了两套受训神经网络,一套是产生式的,赋予其随机向量后就能生成图像;而另一套则用来确定图像是否看起来是真的。目前这套系统能 生成64x64像素的图像。
由于不需要对训练数据打上标签,这项技术无疑可以帮助非死book更好地进行图像、视频、语音的识别工作,自然语言处理技术也可以相应提高。Google前两天也公布了自己的一项 AI成果 ,利用人工神经网络生成迷幻图像。尽管看起来很酷,但非死book的研究科学家Rob Fergus认为,与非死book可生成以假乱真图像相比,自家的技术显然更难,取得的学术进展更多。当然,64x64的分辨率尚不具备使用价 值,非死book的下一步计划是逐步提高生成图像的分辨率,届时,虚拟与现实的界限将进一步模糊,人类距离AI的圣杯越来越近了。
本文参考了多个信息来源: venturebeat.com 、 arxiv.org 、 googleresearch.blogspot.com