Andrew Ng的机器学习问答季

jopen 9年前

Writing Sessions是知识共享网站Quora推出的一个与专家交流互动的新板块，在这里你可以看到各个行业领域的专家、学者、名人等对引人注目的问题的独特见解。最近推出的系列围绕如今最热门的技术之一——机器学习所展开，本次机器之心推送是百度首席科学家、Coursera主席、创始人之一、斯坦福大学教师Andrew Ng在Quora上对部分问题的回答，后续还会陆续更新并推出其他专家系列，敬请期待！

问题一：AI对人类存在威胁吗？

在当今，担心人工智能的罪恶超能力就如同担心火星移民计划导致的人口过剩一样，为时过早。因为实际上，我们甚至还没有登陆到火星表面！

人工智能目前已经有了巨大的进展，并且我对于机器智能技术由上之下构建服务更好的人类社会抱持乐观态度。但是到目前为止，人工智能的发展仍然非常局限。几乎所有深度学习的经济价值和社会价值仍然依赖于监督学习，即同时受限制于特定格式（比如，标记过的数据）。即便人工智能已经能够帮助者数亿人，并以积极的姿态准备去帮助更多的人，我也仍然没有发现任何现实意义上能够威胁到人类社会的人工智能方法。

长久来看，我发现很多种除了监督式学习之外的人工智能方法技术都非常激动人心，比如无监督式学习（由于数据无需再被标记，就有了更多的可用数据）。我个人或是其他的研究组在其他形式的学习方面也都有很多令人振奋的进展。我们所有人都希望看到一个技术性的突破，但谁都没法预测什么时候会真正到来。

我认为诸如对于「邪恶智能杀手」的恐惧，已经都成为了决策者和领导人滥用资源来解决一个根本不存在的幻影的借口。实际上人工智能会引发的其他问题，但更集中于工作的取代上。即便人工智能在未来十年能够帮助我们建立一个更好的社会，我们作为人工智能的创造者同时也应该对可能引发的一系列问题肩负起应有的责任。我希望MOOCs（Coursera）成为解决问题的一部分，但是我们仍需要除教育之外更多的东西。

对于这个问题，我们看看深度学习三巨头之一的Yoshua Bengio的回答：

在未来，我们是否能研发出具备人类水平智能、甚至超越人类的AI？这个问题依然有很大的不确定性。尽管我是一个乐观主义者，但基于上述不确定性，我不能否认，我们不想看到的事依然有可能会发生。这就是我在FLI（Future of Life）呼吁AI应该稳健且有益于人类的公开信上签字的原因。

然而，必须注意到，这种潜在的危险距离现在的我们还很遥远。新闻媒体总倾向于在这方面夸大其词，以吸引注意力。这将损害AI研究。相反，我们应该鼓励研究者去更好地理解这些问题，如果有那么一天这些问题真的迫在眉睫，他们能让我们准备好，并为我们提供尊重人类价值的更安全的AI。

说到这里，我相信，将媒体的注意力从科幻片中的长期恐惧转向AI短期内可能带来的更具体的社会、经济和政治问题上，是一件很重要的事。但是，我们必须提前思考这些问题，不要等到大多数人遭受不幸（比如失业）而少数幸运者变得超级富裕且强势时才想到这些问题。在决定要怎样使用AI带来的进展时，我们必须发挥群体的智慧，让它有利于大多数人，而不是少数人。为了与科技带来的不断增长的力量相匹配，弱肉强食的丛林法则是不合适的：为了当代人以及我们后代的利益，个人和群体的智慧都必须有所增长。

问题二：无人驾驶汽车何时能真正上路？

我希望在三年之内能够看到大量的无人驾驶汽车问世，而在五年之内能够进行大规模生产。（如果你愿意，你可以在你的日程中写下这一点，三到五年之后再来检验我的预测是否正确。）

最近我们刚刚度过了斯坦福大学赢得DARPA无人驾驶汽车挑战赛十周年纪念日。但是为什么无人驾驶技术花费了这么久的时间还没有成熟呢？

首先，我认为建造一辆可以满世界跑的汽车的方法本身就非常具有挑战性，而且通常情况下第一个要解决的目标也是错误的（或者说不切实际的）。无人驾驶汽车最大的问题是解决所有的极端情况——即每行驶1万甚至10万英里才会发生的一些奇怪的事情。机器学习有助于将你的表现从90%的准确率提高到99.9%，但是却不会从99.9%提高到99.9999%。我认为以另外一个目标为起点或许更合适（更有希望）：区间车只能选择一条巴士路线，或者仅仅在很小的范围内活动。如果我们可以保证该路线的道路表面和车道标线维护良好，例如没有进行施工等；这样我们可以使得可触范围内保持真正的安全；然后依照这样我们可以慢慢加入新的路线，从而逐渐使得在这个区域内我们都能安全行驶。这也是百度正在进行的方案，我希望其他的小组也能采取这样的方法。

其次，汽车看待世界的方式和我们不一样。例如，今天的计算机视觉不能有效地分辨建筑工人朝你挥手时是在让你「过来」还是「停下来」。另一方面，我们的无人驾驶汽车并没有任何的盲点，随时都可以进行360°全方位观察；我们的车载HPC系统的反应速度也要比人类的反应速度要快。因此，我并不认为我们应该期待无人驾驶汽车和人类驾驶汽车的方式一样。我们可以让无人驾驶汽车变得安全、有预测能力和更加可靠；但是，它们将会和人类驾驶的汽车不同。作为技术人员，我们必须要有政府和社会的参与，他们的参与不仅可以帮助建立新的法规，而且能有效l了解社会对于这些汽车的新期望。

当然，对于无人驾驶汽车的未来，我们非常乐观。它将帮助人类节省大量的时间，以及避免大量的交通事故。我希望全球的科技社群能够和政府与社会一起，通力合作，早日实现这一美好愿景。

问题三：未来20年的工作会是什么？

如果你是一名50岁的货车司机，有一天你的工作突然被自动驾驶汽车抢了，你该怎么办？

其实，我们的社会是很擅长为有技能的人提供机会的，问题在于30多年累计的经验技能在一息之间就贬值了。在这种情况下，我们有道德上的义务去帮助这些受影响的个体，获取新技能和新机会。

幸运的是，随着MOOCs及其他可快速扩张的教育形式的兴起（如 Coursera, Khan Academy, Lynda），我们现在可以用较为实际的成本做到这点。我并不为20年后我们是否会缺少重要的工作岗位而担心，因为其实有很多人们正在担任的工作是机器在当下或许在可预见的未来都无法胜任的；但是我为个体的再教育需求感到担心。

同时，我认为基础收入也是有必要的。这样做可以为个体提供保障措施以及获取新技能的机会。当今社会以及政治现状可能还不能接受「毫无缘由地付钱给人们」这个想法。所以，我提议向人们支付薪水，作为他们学习的回报。这样，既不会使大家无所事事，又可以有效地引导失业者去做一些有利于他们重新进入劳动大军的事情。

我十分喜欢Erik Brynjolfsson和Andrew McAfee写的「第二次机器时代」，他们在其中有讨论这些问题。

问题四：开启机器学习职业生涯最好的方法是什么？

Cousera上的斯坦福大学的机器学习课程就是为了让更多的人可以开始接触机器学习而设计的。如果你熟悉基本的编程（通过任何一种语言），我都推荐你从这个课程开始。

很多人通过完成了这门网络公开课得到了机器学习相关的工作。还有一些其他的类似的课程也很有用；比如约翰霍普金斯的数据科学专家系列。参加Kaggle或者其他的机器学习竞赛也帮助很多人获得了不少经验。Kaggle有一个带有在线讨论的社区，你可以从中学到很多实用的技巧。参加本地的meetup见面会或学术会议（如果你愿意付这个价钱），还有多和有经验的人聊聊也很有帮助。

但是最重要的是要坚持学习。不单单是几个月，而是几年。

每周六，你都要在是在家里读论文或实践算法与看电视之间选择。如果你整个周六都在工作，短期内也不会有太多回报，而且你现在的老板甚至不会知道，也不会对你说「干得好」。此外，即使一个周六的学习过后，你也不是真的就对机器学习那么在行。但是秘密在于：如果你不仅仅只是一个周末如此，而是坚持这样学习一年，那么你会变得非常优秀。

如今社会对具备机器学习技能的人才有很高的需求；一旦你得到一份机器学习的工作，你的学习只会进步的更快。

世界需要更多的懂得机器学习的人来帮助解决问题。我们的社会有太多的数据和计算资源，（这些使得）机器学习就像有超能力一般，允许你创造令人震惊的东西；但是现在只是没有足够的（懂的机器学习）的我们来做这些事。我希望我的读者们可以更加努力，学好机器学习。

对这个问题，我们来听听Yoshua Bengio的回答：

首先，你要经过基础的数学和计算机科学的训练。就深度学习而言，你可以看麻省理工出版社出版的深度学习的书的第一部分（现在网上有电子版，最终麻省理工出版社会出版纸质版）来温习或者看数学和计算机科学领域最相关的内容。然后你需要阅读机器学习方面的内容，比如Chris Bishop和 Kevin Murphy的书，Andrew Ng的coursera课程，和Hugo Larochelle关于神经网络的视频，然后你在深度学习书的第五部分中总结出许多基本问题。然后你就需要开始练习了，比如自己编写一些算法，用数据训练它们，试着参加Kaggle的比赛。试着在优化超参数和选择合适模型方面成为专家，同时继续阅读。如果你对深度学习感兴趣，我的书的第二部分会告诉你最基本的算法基础。此时，你已经有足够的知识背景积累，可以开始选择你喜欢的书籍阅读了。

问题五：Coursera早期时候最有趣的故事是什么？

慕课（MOOCs）从早期创建就与众不同。

2011年，斯坦福大学推出了三个引人注目的MOOCs，包括机器学习、数据库和人工智能；也正是这一举动导致了今天的MOOC运动。人们当时的反应是，「哇，这真的是横空出世的新鲜事物！」

但是如果你是其中的建造者之一，你就会看到它一步步的发展历程，到最后如何实现了「横空出世」。2011年推出的这个MOOC是我做的第六个在线教育网站。之前的一些都远不如这一个网站成功，或许你从未听说过。但是我们从早期的原型中不断地学习、总结，直到2011年我们成功地建立了这样实现质变的产品。从Jennifer Widom和我写的《现代MOOC的起源》中你可以读到更多早期的故事（我们俩负责2011年MOOC推出的三门课中的两门）。

后来，在深度学习中我们也看到了类似的现象。在外行人看来，他们的印象是「哇，这真的是横空出世的新鲜事物！」（这种类似反应出现在2012年，当时我正负责谷歌大脑计划，并宣布了猫的研究结果。）但是对于我们中这些为MOOC工作多年的人来说，这种进步真的是一步步取得的。

线性范畴上的指数式进步看起来通常都是一个不连续的变化过程。在科技领域我们看到了太多这样的例子。

既然你问了这样的问题，这里我就讲述一个故事：2011年，我与斯坦福大学的四个学生一起工作。我们需要为已经注册的10万学生建造新的功能，因此我们的压力非常大。其中的一名学生（Frank Chen）声称另一名学生Jiquan Ngiam经常将他滞留在斯坦福大学的大楼中，知道深夜才让他搭车会宿舍，因此他没有别的选择，只有留下来并继续工作。我从来没有去核实这件事情的真实性。

（未完待续，敬请期待……）

本文选自Quora，机器之心编辑出品，参与成员： Angulia、杨超、Yipu、之乎、Rita、汪汪、孟婷。

</div>

来自： http://www.almosthuman.cn/2016/01/30/kuu4x/