推荐算法综述（一）

原文 http://www.infoq.com/cn/articles/recommendation-algorithm-overview-part01

【编者按】推荐系统在各种系统中广泛使用，推荐算法则是其中最核心的技术点，InfoQ接下来将会策划系列文章来为读者深入介绍。推荐算法综述分文五个部分，本文作为第一篇，将会简要介绍推荐系统算法的主要种类。其中包括算法的简要描述、典型的输入、不同的细分类型以及其优点和缺点。在第二和第三篇中，我们将会详细介绍这些算法的区别，让你能够深入理解他们的工作原理。

注：本文翻译自 Building Recommenders ，InfoQ中文站在获得作者授权的基础上对文章进行了翻译。

为推荐系统选择正确的推荐算法是非常重要的决定。目前为止，已经有许多推荐算法可供选择，但为你需要解决的特定问题选择一种特定的算法仍然很困难。每一种推荐算法都有其优点和缺点，当然也有其限制条件，在作出决定之前，你必须要一一考量。在实践中，你可能会测试几种算法，以发现哪一种最适合你的用户，测试中你也会直观地发现它们是什么以及它们的工作原理。

推荐系统算法通常是某类推荐模型的实现，它负责获取数据，例如用户的喜好和可推荐项的描述，以及预测给定的用户组会对哪些选项感兴趣。

推荐算法通常被分为四大类（1-4）：

协同过滤推荐算法
基于内容的推荐算法
混合推荐算法
流行度推荐算法

除了这些种类以外，还有一些高级非传统的推荐算法（5）。

推荐算法综述是分文五个部分的系列文章，本文作为第一篇，将会简要介绍推荐系统算法的主要种类。其中包括算法的简要描述、典型的输入、不同的细分类型以及其优点和缺点。在第二和第三篇中，我们将会详细介绍这些算法的区别，让你能够深入理解他们的工作原理。系列文章中的一些内容参考了一篇来自 RecSys 2014 tutorial 的文章：由 Xavier Amatriain 编写的 The Recommender Problem Revisited 。

1.协同过滤推荐算法

简介：通过在用户的一系列行为中寻找特定模式来产生用户特殊推荐
输入：仅仅依赖于惯用数据（例如评价、购买、下载等用户偏好行为）
类型：
- 基于邻域的协同过滤（基于用户和基于项）
- 基于模型的协同过滤（矩阵因子分解、受限玻尔兹曼机、贝叶斯网络等等）
</li>
优点：
- 需要最小域
- 不需要用户和项
- 大部分场景中能够产生足够好的结果
- 缺点：
  - 冷启动问题
  - 需要标准化产品
  - 需要很高的用户和项的比例（1：10）
  - 流行度偏见（有长尾的时候表现不够好）
  - 难于提供解释

推荐算法综述（一）

1.协同过滤推荐算法

2.基于内容的推荐算法

3.混合推荐算法

4.流行度推荐算法

5.高级非传统推荐算法

关于作者

相关资讯