斯坦福大学发布免费在线文本分析工具
斯坦福计算机科学家开发了 etcML(Easy Text Classification with Machine Learning)网站,该网站通过机器学习引擎进行文本分析,目前该网站向所有人免费开放。
维基百科对机器学习的解释是:他是人工智能的分支之一,是一套能够从数据中学习的系统。
斯坦福大学官网对此进行了说明:etcML 网站基于成熟的文本分析引擎,估计总体的情感倾向(是消极还是积极)。etcML 项目负责人 Richard Socher 表示:
“我们想开发一套供普通人和研究人员使用的标准的机器学习技术,所有使用者都不需要编程能力。”
斯坦福大学候选博士研究生 Rebecca Weiss 表示:
etcML 提供了一种简单的方式,对单词和短语所体现的观点进行分类。
我可以训练分类器,也可以对任何一段文本打上标签,实现这一切并不需要写一行代码。我还可以和记者或研究人员分享我的分类器。
斯坦福大学计算机语言学研究者 Rob Voigt 通过 etcML 对 Kickstarter(一个创意方案众筹平台)上的项目进行评估。他发现,多使用“我们”、“我们的”这些复数代词能够提高项目宣讲成功的概率。Voigt 表示:
“我们并没有声称我们的分析是决定性的,etcML 分类范式提供了有价值的成功线索。”
斯坦福大学计算机科学博士生 Chinmay Kulkarni 使用 etcML 对 2000 名学生的简答题测验进行打分。此前,简答题打分是通过学生之间的互相打分完成的,平局每道题有 4 个学生进行打分。通过 etcML 打分后,平局每道题只需要 3 个或更少的学生打分。Kulkarni 表示:
“我们获得了同样的精确度,同时减少了学生的负担。”
Kulkarni 发布了这一项目的论文。
Socher 认为 etcML 能吸引许多人尝试有趣的语义分析项目并提供反馈,从而提升 etcML 背后的计算引擎。
值得一提的是,Andrew Ng(吴恩达)是 etcML 项目的顾问,他是斯坦福人工智能实验室的主管,也是在线公开课程平台 Coursera 的创始人之一。