吴恩达:神经网络模型将替代传统算法,真的做到深度学习
原文 http://www.36kr.com/p/218927.html
百度首席科学家吴恩达在未来论坛上发表了演讲,会后 36氪 对他进行了简短的【独家采访】。
神经网络模型让数据的潜力更大
我们都知道,在海量数据时代,深度学习为人工智能带来了新的机会。这些机会集中在三个地方:文本、图片和语音识别。
吴恩达提到,人工智能有一个正循环链条。有了好的产品,可以吸引更多的用户,然后会生成海量的数据,接着数据又能带来更为优秀的产品。但是,如果 采用传统的人工智能算法,数据增长到一定体量,算法效果会遇到瓶颈。但如果运用新的深度学习算法,随着数据的增长,算法的效果可以持续提升。
什么神经网络模型呢?以下是他举的例子:
7年前,我让学生利用当时最好的算法完成一项简单任务——在一张放了很多餐具的图片中判断哪个是杯子,结果没有做到。基本上柱状的工具都被识别成了杯子。
虽然在人的眼里,看到的是这些物品的外形,但是在计算机的眼里,他们得到的信息只是照片上每一个像素点上代表色彩的数字,利用数字谱与其他的图像 对比。再举一个语音识别的例子,过去我们将声音分解为不同的音调、音素等等,希望通过数据解码来识别一段对话,但得到的结果还是与自然语音本身不同。
人脑是怎么学习的呢?这里要声明,虽然叫做神经网络模型,但并不是真的让算法模仿人的大脑工作,因为我们并不确定大脑到底如何工作的,只是希望接 近这种机制。以上面的杯子为例,我们只是提供大量的杯子图片,让计算机来发现这些样本具有怎样的特征,然后它就可以进行判断了,和我们平时学习的方式很相 似。
这件事过去做不了,所以需要依赖传统的数据解码算法,但现在对数据的存储和计算都达到巨量级,能够实现海量样本对照。
语音识别将推动手机的革命
越来越多的人正在使用语音识别,深度学习语音识别系统的准确率比传统方式提升了很多。
在移动端应用场景下,语音交互与手指输入相比,是一种更自然的人机交互方式。我们可能不再需要在手机上安装那么多的Apps,你只需要跟手机进行 语言交互,告诉它你需要什么,他就能为你连接服务。我相信语音将会推动手机的革命。想象一下,未来我们将围绕语音界面来重新设计移动产品,重新定义人与手 机的交互界面。
在这里,吴恩达说了一句模棱两可的话: 接下来,我们会为你带来更好的智能手机 。不知道该理解为百度手机重出江湖,还是仅仅泛指所有的手机商呢?
不用担心机器人会占领世界
人工智能技术仍然存在挑战。比如,有的国家使用AI技术威胁到了人的权利(脑补 疑犯追踪 ),这是很严肃的道德议题。但即使不存在AI,这样的情况也是存在的。至于说AI达到了比人更聪明的程度,甚至可能会控制我们的世界。我认为这并不是目前急需关心的问题。机器统治世界不会很快发生,或许100年后我们才需要担心这个问题。
即使我们说深度学习算法具有自我学习的能力,但也不需要为此担心。大量的神经网络算法中的模型训练,即机器学习的过程,都是 有监督的训练 。这种训练方式应用在语音识别、图像识别中时,效果是非常好的。但如果站在机器可能统治人的角度,这是完全不同的事情。
[ 36氪 原创文章,作者: 厨子与剑客]