微软重金收购机器学习厂商Equivio为哪般?
根据外媒消息,微软收购了以色列一家机器学习厂商 Equivio,其拥有的机器学习技术可用于对企业或政府的海量办公文件、电子邮件进行智能分析和归类。
大数据时代,机器学习(Machine Learning)成为一个热门的前沿科技领域。机器学习属于人工智能的一个分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能, 重新组织已有的知识结构使之不断改善自身的性能。机器学习过去被认为是属于研发机构和实验室的深不可测的新技术,但其实离我们并不那么遥远。不信,你且 看。
当你使用苹果的 Siri,或是谷歌的 Google Now,或者是百度语音,甚至是出门问问,来寻找附近的美食餐厅、电影院或者购物广场时,你所使用的工具背后也使用了机器学习技术。
只是,机器学习技术尽管不如人工智能那么宽泛,但其实也是一个大的技术范围,未来可能涉及生活的方方面面。微软收购的 Equivio 公司,其研发的机器学习技术,可以利用分析软件对大量的非结构性数据和文件进行智能分析,然后进行分组归类。更准确的叫法,划分到更细分的分类,应该属于 文本分析技术(也称文本挖掘技术)领域。
根据百度百科的定义,文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining)。
更加详细的解释是:
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现。文本挖掘利用智能算法,如神经网络、基于案例的推理、可能性推理等,并结合文字处 理技术,分析大量的非结构化文本源(如文档、电子表格、客户电子邮件、问题查询、网页等),抽取或标记关键字概念、文字间的关系,并按照内容对文档进行分 类,获取有用的知识和信息。
但微软为什么会收购这么一家公司呢,而且还花费了不小的资金,2 亿美刀?
时代的发展和用户需求的必然
全世界的企业和政府,每天产生海量的数据,数据规模的增长,已经超过了人类手工处理的能力,传统的搜索、发现相关文件的手段,也已经过时。
巩固自己在办公软件领域的霸主地位
在办公软件领域占据优势的微软,通过收购 Equivio,有望将文本挖掘带入到工作人员日常处理的电子邮件和文档中。一方面可以满足用户需求,提升用户体验,另一方面,微软也在通过创新技术保持 竞争力,巩固自己在办公软件领域的霸主地位。在 Office 系列产品中,微软已经有了 eDiscovery 等信息检索和整理的功能,未来利用 Equivio 公司的文本挖掘技术,微软将会让这些工具更加智能、更加易于使用。
除了微软, 非死book、谷歌、苹果都已经设立了团队进行研发,机器学习技术的发展,也推动了许多互联网消费者产品的进步。
未来我们很可能在很多领域都使用到文本挖掘技术,甚至是机器学习技术,真正感受科技改变生活。
航空安全领域
数据和文本一样,都可以通过不同的途径、运用多样化的方式进行分析,比如算法式和可视化。通过文本挖掘技术可以帮助各国的航空航天领域的机构能 够密切关注流行趋势、事件的增幅减幅以及跑道入侵事故的因素。通过短时间内把所有数据汇集到一起、进行同时分析,能够对诸如航空系统这样的真实系统进行高 精确度预测,最终有利于预防和降低事故发生。
金融分析领域
据国外媒体报道,华尔街开始利用程序来读取各类新闻、社论、公司网站信息、推ter 等,分析其中的词汇、语法结果、甚至是表情符号,这些程序会判断解析得到信息对市场的影响,并且自动进行交易。就是典型的用户交易情绪的挖掘和分析,试想 要是能早一点判断用户恐慌性抛售股票,那对很多金融企业是何等的重要。
消费场景推荐
亚马逊向消费者推荐商品,或者淘宝天猫京东向你推荐商品时,也将用到文本挖掘技术。而推荐的信息依据其可能是你的评论,也可能是一个提问等等。利用文本挖掘技术,来更好地了解用户的想法,最终实现精准推荐。
实体商场同样也可以用到,通过网络信息获取甚至是线下的客户意见反馈卡的分析,实现更加的消费场景布局,营造体验拉动购物。
未来,企业竞争情报、CRM、搜索引擎、医疗、保险和咨询等等行业都离不开文本挖掘技术。
更多高大上的领域,诸如图像识别、语音识别、机器翻译等领域也会用到文本挖掘。
不过文本挖掘技术,甚至是更宽泛的机器学习技术,人工智能技术,都不会在大众用户中有较高的认知度和知名度,核心原因在于从来没有一个单独的产 品叫人工智能,但无论是自动交易机还是谷歌无人驾驶汽车,都是人工智能在应用层面的体现。不管你记不记得,认知不认知,都无法阻挡文本挖掘技术、机器学习 技术在你生活的方方面面存在着。