开源项目,开源代码,开源文档,开源新闻,开源社区

，广告CTR预估使用最多的基础算法还是L1正则化的Logistic Regression。机器学习任务主要分为两种：Supervised Machine Learning 和 Unsupervised

jopen 2014-12-27 51748 0

Milk是Python的一个机器学习工具箱，其重点是提供监督分类法与几种有效的分类分析：SVMs(基于libsvm)，K-NN，随机森林经济和决策树。它还可以进行特征选择。这些分类可以在许多方面相结合

jopen 2014-07-29 18042 0

存在一个样本数据集合（也称训练样本集），并且样本集中每个数据都存在标签。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。我们一般只选择样本集中前k（k通常是不大于20的整数）个最相似的数据，最后选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

jopen 2015-04-19 15687 0

算法

原文出处： Liu_LongPo的专栏（@Liu_LongPo） K-means算法属于无监督学习聚类算法，其计算步骤还是挺简单的，思想也挺容易理解，而且还可以在思想中体会到EM算法的思想。 K-means

fff8 2015-05-26 50946 0

机器学习

Apache MADlib 是为数据科学提供的 SQL 大数据机器学习工具。Apache MADlib 拥有强大的大数据分析能力。Apache MADlib 支持 Postgres, Pivotal Greenplum

jopen 2015-11-03 26628 0

分布式/云计算/大数据 Apache MADlib

ora的工程副总裁Xavier Amatriain 在Netflix和Quora从事推荐系统和机器学习工作时所总结的20条经验教训。更多的数据 & 更好的模型并不是数据越多结果就越好

jopen 2015-12-21 23717 0

机器学习数据挖掘

Fuzzy 机器学习框架是一个程序库和一个使用直觉模糊数据的机器学习的GUI前端。该方法是基于直觉模糊集和可能性理论。进一步的特点是模糊的功能和类;基于语言变量的数值，枚举的功能和特点;用户自定义特

jopen 2012-05-28 8794 0

机器学习

面图表中包含的一些参数信息，例如CMOS像素、重量等（下图）。目前Google正在通过机器学习技术区分哪些是包含有用信息的图表（table），哪些是无效（例如网页样式设计）的图表，然后系统会根据相关度和质量来决定显示哪些信息。

jopen 2014-09-23 7356 0

Google

Service 微软于近期发布了 Azure ML 。这是一个基于云的机器学习平台，旨在帮助基于过去的行为对未来事件进行预测。微软已经将机器学习应用于 Bing、Xbox 和其他产品多年。但是，这是微软首次将内部技术以云服务的方式提供给外界使用。

jopen 2014-09-24 5837 0

微软

Services 开发机器学习解决方案提升现有的预测算法并不是一件容易的事情。这需要大量的工作来保证其正确性，包括清除数据、建立基础结构、测试和再测试模型以及最终部署算法。这里有六种机器学习服务，它们可以帮助你减少部署机器学习解决方案的痛苦。

xg48 2015-04-10 13812 0

机器学习

Software Foundation (ASF) 开发的一个全新的开源项目，其主要目标是创建一些可伸缩的机器学习算法，供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头，目前只有一个公共发行版。Mahout

xg48 2015-04-10 7214 0

Mahout

more data always better than better algorithms? 在机器学习中，更多的数据总是比更好的算法好吗?对于 Quora 上的这个问题，Netflix 公司工程总监

jopen 2015-06-18 10169 0

机器学习

据专家建立了各种各样的机器学习模型来帮助识别交易中的风险。作为公司业务的后盾，该团队究竟是如何建立机器学习模型的呢？近日，Airbnb公司公布了利用相关数据建立和改善机器学习模型的过程。接下来，本文就对该过程进行简单介绍。

w8y5 2015-07-09 12011 0

机器学习

数据科学领域中所采用的机器学习编程语言大相径庭。究竟哪种语言最适合机器学习成为争论不休的话题。近日，密西根州立大学的博士生Sebastian Raschka再次发起了机器学习编程语言之争，分析了自己选择Python的原因。

jopen 2015-09-08 30388 0

机器学习

最近媒体报道谷歌正在利用机器学习帮助处理搜索结果，这引发了人们对于这一人工智能领域的兴趣和疑问。什么是“机器学习”，机器是如何自学的呢？这里有一些 Google 内部关于机器学习的背景介绍。昨天

jopen 2015-11-13 12257 0

机器学习

你周围的人是否都在谈论着“机器学习”？而你是否也听说过一些算法技术却仍旧缺乏一个全局的认识？本文也许就是一个好的起点…… 智力的新纪元在科学界，机器学习是目前很热门的话题。通过把计算机和人类的能

uebpk8056 2016-12-01 18164 0

数据挖掘机器学习

SmileMiner是一个汇集了各种机器学习算法的纯Java函数库，它是自包含的，仅仅需要Java标准库。主要部件为：Smile，-Math，-Data，-Graph，-Interpolation，-

码头工人 2016-02-27 17153 0

机器学习 SmileMiner

BP神经网络，训练的时候，给定一组输入和输出，不断的对权值进行训练，使得输出达到稳定。但BP神经网络并不是适合所有的场景，并不真正的体现出某些场景的真正特点。回到经典的概率论问题，抛硬币问题，假设你已经抛了100次的，90次是正面的，10次是反面的，问现在继续在抛一次，出现正面的概率是多少？如果没有前面几次的经验，很正常的会认为再次出现正面的概率是50%，但由于我们之前有对这个进行了实验，即有了经验了，按照贝叶斯定律，出现正面的概率肯定会大于50%。BP神经网络也少了对前面结果的一种反馈。

thre1233 2017-03-24 86653 0

神经网络

为了保证可读性，本文采用意译而非直译。另外，本文版权归原作者所有，翻译仅用于学习使用JavaScript做机器学习？不是应该用Python吗？是不是我疯了才用JavaScript做如此繁重的计

吴青强 2017-07-02 29633 0

机器学习 JavaScript开发 JavaScript

随着基于人工智能与机器学习的应用如雨后春笋般不断涌现，我们也看到有很多提供类似功能的 API 悄悄登上了舞台。 API 是用于构建软件应用的程序、协议以及工具的组合；本文是对2015 中这个列表的修正与完善，移除了部分被废弃的

Chr8016 2017-03-09 17732 0

数据挖掘机器学习

研究机器学习之MLlib实践经验经验

Python的一个机器学习工具箱：Milk 经验

机器学习--k-近邻(kNN)算法经验

机器学习实战ByMatlab（3）：K-means算法经验

大数据机器学习工具：Apache MADlib 经验

构建机器学习系统的20个经验教训经验

机器学习框架，Fuzzy 1.2 发布资讯

Google推出机器学习图表搜索功能资讯

微软开始提供Azure机器学习服务资讯

七种基于云计算的机器学习服务资讯

机器学习库，Mahout 0.10.0 发布资讯

机器学习：更多的数据总是优于更好的算法吗？资讯

Airbnb如何设计机器学习模型资讯

机器学习编程语言之争，Python夺魁资讯

机器学习是如何运作的？谷歌来告诉你资讯

揭开机器学习的面纱经验

SmileMiner：开源统计机器智能与学习引擎经验

机器学习系列：递归神经网络经验

JavaScript机器学习之线性回归经验

52 个有用的机器学习与预测接口盘点经验

分布式机器学习的故的相关搜索

关键词

研究机器学习之MLlib实践经验 经验

Python的一个机器学习工具箱：Milk 经验

机器学习--k-近邻(kNN)算法 经验

机器学习实战ByMatlab（3）：K-means算法 经验

大数据机器学习工具：Apache MADlib 经验

构建机器学习系统的20个经验教训 经验

机器学习框架，Fuzzy 1.2 发布 资讯

Google推出机器学习图表搜索功能 资讯

微软开始提供Azure机器学习服务 资讯

七种基于云计算的机器学习服务 资讯

机器学习库，Mahout 0.10.0 发布 资讯

机器学习：更多的数据总是优于更好的算法吗？ 资讯

Airbnb如何设计机器学习模型 资讯

机器学习编程语言之争，Python夺魁 资讯

机器学习是如何运作的？谷歌来告诉你 资讯

揭开机器学习的面纱 经验

SmileMiner：开源统计机器智能与学习引擎 经验

机器学习系列：递归神经网络 经验

JavaScript机器学习之线性回归 经验

52 个有用的机器学习与预测接口盘点 经验

分布式机器学习的故 的相关搜索

关键词

研究机器学习之MLlib实践经验经验

机器学习--k-近邻(kNN)算法经验

机器学习实战ByMatlab（3）：K-means算法经验

构建机器学习系统的20个经验教训经验

机器学习框架，Fuzzy 1.2 发布资讯

Google推出机器学习图表搜索功能资讯

微软开始提供Azure机器学习服务资讯

七种基于云计算的机器学习服务资讯

机器学习库，Mahout 0.10.0 发布资讯

机器学习：更多的数据总是优于更好的算法吗？资讯

Airbnb如何设计机器学习模型资讯

机器学习编程语言之争，Python夺魁资讯

机器学习是如何运作的？谷歌来告诉你资讯

揭开机器学习的面纱经验

SmileMiner：开源统计机器智能与学习引擎经验

机器学习系列：递归神经网络经验

JavaScript机器学习之线性回归经验

52 个有用的机器学习与预测接口盘点经验

分布式机器学习的故的相关搜索