分布式机器学习的故事(转 ) 博客

从毕业加入Google开始做分布式机器学习,到后来转战腾讯广告业务,至今已经七年了。我想说说我见到的故事和我自己的实践经历。这段经历给我的感觉是:虽然在验证一个新的并行算法的正确性的时候,我们可以利用现有框架,尽量快速实现,但是

jopen 2014-02-12   38015   0

机器学习基础】过拟合 经验

最后还有一个原因是数据量有限,这使得模型无法真正了解整个数据的真实分布。 学习曲线(Learning curves) 我们以二次多项式和十次多项式的曲线来对比,由之前了解的学习曲线(learning curves)显示随着数据量的增加,误差是如何变化的。

jopen 2015-02-10   51148   0

Java开源机器学习框架:Datumbox Machine Learning Framework 经验

Learning Framework是一个Java开发的开源机器学习框架。 用于快速开发机器学习和统计应用。该框架的主要重点是包括了大量的机器学习算法和统计检验,并能够处理中小规模的数据集。 详细介绍:

jopen 2014-10-19   28759   0

也谈 机器学习到底有没有用 ? 经验

文字化了@老师木谈机器学习的一系列文章,其中有一篇我很感兴趣的文章《机器学习有没有用?》,文字版连接:http://php-52cs.rhcloud.com/?p=87 作为一个机器学习爱好者,也想谈

jopen 2014-11-16   24757   0

机器学习入门资源不完全汇总 经验

基本概念 机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计 算机可以自动“学习”的算法。机器学习算

jopen 2015-01-11   59922   0

机器学习方面源代码库整理 经验

经典的机器学习方面源代码库整理。全面收集,可用于数据挖掘,计算机视觉,模式识别,信息检索相关领域。 机器学习开源软件网 2 :收录了各种机器学习的各种编程语言学术与商业的开源软件 Dmoz机器学习网址目录

jopen 2015-01-08   29195   0

研究机器学习之MLlib实践经验 经验

,广告CTR预估使用最多的基础算法还是L1正则化的Logistic Regression。 机器学习任务主要分为两种:Supervised Machine Learning 和 Unsupervised

jopen 2014-12-27   51748   0

Python的一个机器学习工具箱:Milk 经验

Milk是Python的一个机器学习工具箱,其重点是提供监督分类法与几种有效的分类分析:SVMs(基于libsvm),K-NN,随机森林经济和决策树。它还可以进行特征选择。这些分类可以在许多方面相结合

jopen 2014-07-29   18042   0

机器学习--k-近邻(kNN)算法 经验

array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]]) labels = ['A', 'A', 'B', 'B'] return group, labels

jopen 2015-04-19   15687   0
算法  

机器学习实战ByMatlab(3):K-means算法 经验

原文出处: Liu_LongPo的专栏(@Liu_LongPo) K-means算法属于无监督学习聚类算法,其计算步骤还是挺简单的,思想也挺容易理解,而且还可以在思想中体会到EM算法的思想。 K-means

fff8 2015-05-26   50946   0

大数据机器学习工具:Apache MADlib 经验

Apache MADlib 是为数据科学提供的 SQL 大数据机器学习工具。Apache MADlib 拥有强大的大数据分析能力。Apache MADlib 支持 Postgres, Pivotal Greenplum

jopen 2015-11-03   26628   0

构建机器学习系统的20个经验教训 经验

ora的 工程副总裁Xavier Amatriain 在Netflix和Quora从事推荐系统和机器学习工作时所 总结的20条经验教训 。 更多的数据 & 更好的模型 并不是数据越多结果就越好

jopen 2015-12-21   23717   0

机器学习框架,Fuzzy 1.2 发布 资讯

Fuzzy 机器学习框架是一个程序库和一个使用直觉模糊数据的机器学习的GUI前端。该方法是基于直觉模糊集和可能性理论。进一步的特点是模糊的功能和类;基于语言 变量的数值,枚举的功能和特点;用户自定义特

jopen 2012-05-28   8794   0

Google推出机器学习图表搜索功能 资讯

面图表中包含的一些参数信息,例如CMOS像素、重量等(下图)。 目前Google正在通过机器学习技术区分哪些是包含有用信息的图表(table),哪些是无效(例如网页样式设计)的图表,然后系统会根据相关度和质量来决定显示哪些信息。

jopen 2014-09-23   7356   0
Google  

微软开始提供Azure机器学习服务 资讯

Learning as a Service 微软于近期发布了 Azure ML 。这是一个基于云的机器学习平台,旨在帮助基于过去的行为对未来事件进行预测。微软已经将机器学习应用于 Bing、Xbox

jopen 2014-09-24   5837   0
微软  

七种基于云计算的机器学习服务 资讯

Services 开发机器学习解决方案提升现有的预测算法并不是一件容易的事情。这需要大量的工作来保证其正确性,包括清除数据、建立基础结构、测试和再测试模型以及最终部署算法。 这里有六种机器学习服务,它们可以帮助你减少部署机器学习解决方案的痛苦。

xg48 2015-04-10   13812   0

机器学习库,Mahout 0.10.0 发布 资讯

Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout

xg48 2015-04-10   7214   0
Mahout  

机器学习:更多的数据总是优于更好的算法吗? 资讯

more data always better than better algorithms? 在机器学习中,更多的数据总是比更好的算法好吗?对于 Quora 上的这个问题,Netflix 公司工程总监

jopen 2015-06-18   10169   0

Airbnb如何设计机器学习模型 资讯

据专家建立了各种各样的机器学习模型来帮助识别交易中的风险。作为公司业务的后盾,该团队究竟是如何建立机器学习模型的呢?近日,Airbnb公司 公布 了利用相关数据建立和改善机器学习模型的过程。接下来,本文就对该过程进行简单介绍。

w8y5 2015-07-09   12011   0

机器学习编程语言之争,Python夺魁 资讯

数据科学领域中所采用的机器学习编程语言大相径庭。究竟哪种语言最适合机器学习成为争论不休的话题。近日,密西根州立大学的博士生Sebastian Raschka再次发起了 机器学习编程语言之争 ,分析了自己选择Python的原因。

jopen 2015-09-08   30388   0
1 2 3 4 5 6 7 8 9 10