世界最聪明计算机已经学会脏话
不知道大家还记不记得 IBM 的 Watson,虽然它的运算能力跟 Top500 那些老大哥比不得,但早在 2 年前,Watson 就在一档智力竞赛节目 Jeopardy 上战胜了另外两名人类选手,赢得了“世界上最聪明的计算机”的称号。今天,我们要告诉大家一个很不幸的消息,Watson 学会讲脏话了。
IBM Watson
以现在的超级计算机为标准衡量,Watson 的运算能力并不强,它之所以如此“聪明”,是因为 IBM 为它研发了一套集高级自然语言处理、信息检索、知识表示、自动推理、机器学习等开放式问答技术的应用。也就是说,Watson 是可以自我学习的,它的信息来源包括百科全书、字典、词典、新闻和文学作品等。所有的参考材料需要存储在足足有 4TB 的磁盘上,这套系统可以说这是 IBM 研发团队的骄傲。但是最近 IBM 发现,这台世界上最聪明的计算机好像有些聪明过头了。
Watson 需要通过不断学习来扩充它的资料库,也就意味着要不断学习人类的语言。那么教材的来源是什么呢?答案就是词典。不幸的是,Watson 好像从这个没有节操的世界里学到了一些不该学的词汇。如 absurd、profane 和 physiological impossible (解释请自行查阅词典)等令人害臊的词语。Watson 无所不包的词汇量开始令它用一些不可思议的词汇来描述问题的解答(请读者自行想象),在测试中,它甚至会用“bullshit”(胡说,废话)来回答测试 人员的提问。据《财富》杂志的 Michal Lev-Ram 表示,Watson 并不能区分礼貌用语和脏话之间的区别,这使它养成了不好的习惯。
最终,Watson 计划负责人 Brown 不得不清空 Watson 内存中来源于词典的数据。事实再次证明了人类语言的复杂性,在这个无节操的世界里,计算机还是小心谨慎为妙。