计算机科学丛书:统计推荐系统
作者: [美]Deepak K.Agarwal
出版时间:2019年版
丛编项:计算机科学丛书
内容简介
《统计推荐系统》由LinkedIn公司的技术专家撰写,着眼于推荐系统的核心—统计方法,不仅讲解理论知识,而且分享了作者在LinkedIn和Yahoo!的实践经验。
《统计推荐系统》分为三部分:第一部分介绍推荐系统的组成、经典推荐方法及评估方法,并引出了探索与利用问题;第二部分围绕点击通过率(CTR)预估这一重要问题,重点介绍快速在线双线性因子模型和面向回归的隐因子模型,为热门推荐和个性化推荐提供解决方案;第三部分讨论进阶主题,涵盖分解的隐含狄利克雷分布模型、张量分解模型、层次收缩模型以及多目标优化方法。
目录
出版者的话
译者序
前言
第一部分 基础知识
第1章 简介
1.1 面向网络应用的推荐系统概述
1.1.1 算法
1.1.2 优化指标
1.1.3 探索与利用之间的权衡
1.1.4 推荐系统的评估
1.1.5 推荐和搜索:推送与拉取
1.2 一个简单的评分模型:热门推荐
1.3 练习
第2章 经典推荐方法
2.1 物品特征
2.1.1 分类
2.1.2 词袋模型
2.1.3 主题建模
2.1.4 其他物品特征
2.2 用户特征
2.2.1 声明的个人信息
2.2.2 基于内容的画像
2.2.3 其他用户特征
2.3 基于特征的方法
2.3.1 无监督方法
2.3.2 有监督方法
2.3.3 上下文信息
2.4 协同过滤
2.4.1 基于用户-用户相似度的方法
2.4.2 基于物品-物品相似度的方法
2.4.3 矩阵分解
2.5 混合方法
2.6 小结
2.7 练习
第3章 面向推荐问题的探索与利用
3.1 探索与利用之间的权衡简介
3.2 多臂赌博机问题
3.2.1 贝叶斯方法
3.2.2 极小化极大方法
3.2.3 启发式赌博方案
3.2.4 方法评价
3.3 推荐系统中的探索与利用
3.3.1 热门推荐
3.3.2 个性化推荐
3.3.3 数据稀疏性的挑战
3.4 处理数据稀疏性的探索与利用
3.4.1 降维方法
3.4.2 降维中的探索与利用
3.4.3 在线模型
3.5 小结
3.6 练习
第4章 评估方法
4.1 传统的离线评估方法
4.1.1 数据划分方法
4.1.2 准确度指标
4.1.3 排序指标
4.2 在线分桶测试
4.2.1 设置分桶测试
4.2.2 在线性能指标
4.2.3 测试结果分析
4.3 离线模拟
4.4 离线回放
4.4.1 基本回放估计
4.4.2 回放的扩展
4.5 小结
4.6 练习
第二部分 常见问题设置
第5章 问题设置与系统架构
5.1 问题设置
5.1.1 常见的推荐模块
5.1.2 应用设置
5.1.3 常见的统计方法
5.2 系统架构
5.2.1 主要组件
5.2.2 示例系统
第6章 热门推荐
6.1 应用案例:雅虎“今日”模块
6.2 问题定义
6.3 贝叶斯方案
6.3.1 2×2案例:两件物品,两个间隔
6.3.2 K×2案例:K件物品,两个间隔
6.3.3 一般解
6.4 非贝叶斯方案
6.5 实验评估
6.5.1 比较分析
6.5.2 方案刻画
6.5.3 分段分析
6.5.4 桶测试结果
6.6 大规模内容池
6.7 小结
6.8 练习
第7章 基于特征回归的个性化
7.1 快速在线双线性因子模型
7.1.1 FOBFM概述
7.1.2 FOBFM详解
7.2 离线训练
7.2.1 EM算法
7.2.2 E步骤
7.2.3 M步骤
7.2.4 可扩展性
7.3 在线学习
7.3.1 在线高斯模型
7.3.2 在线逻辑模型
7.3.3 探索与利用方案
7.3.4 在线模型选择
7.4 雅虎数据集上的效果展示
7.4.1 My Yahoo!数据集
7.4.2 雅虎首页数据集
7.4.3 不包含离线双线性项的FOBFM
7.5 小结
7.6 练习
第8章 基于因子模型的个性化
8.1 面向回归的隐因子模型
8.1.1 从矩阵分解到RLFM
8.1.2 模型详解
8.1.3 RLFM的随机过程
8.2 拟合算法
8.2.1 适用于高斯响应的EM算法
8.2.2 适用于逻辑响应的基于ARS的EM算法
8.2.3 适用于逻辑响应的变分EM算法
8.3 冷启动效果展示
8.4 时间敏感物品的大规模推荐
8.4.1 在线学习
8.4.2 并行拟合算法
8.5 大规模问题效果展示
8.5.1 MovieLens-1M数据
8.5.2 小规模雅虎首页数据
8.5.3 大规模雅虎首页数据
8.5.4 结果讨论
8.6 小结
8.7 练习
第三部分 进阶主题
第9章 基于隐含狄利克雷分布的分解
9.1 简介
9.2 模型
9.2.1 模型概述
9.2.2 模型详解
9.3 训练和预测
9.3.1 模型拟合
9.3.2 预测
9.4 实验
9.4.1 MovieLens数据
9.4.2 Yahoo! Buzz应用
9.4.3 BookCrossing数据集
9.5 相关工作
9.6 小结
第10章 上下文相关推荐
10.1 张量分解模型
10.1.1 建模
10.1.2 模型拟合
10.1.3 讨论
10.2 层次收缩模型
10.2.1 建模
10.2.2 模型拟合
10.2.3 局部增强张量模型
10.3 多角度新闻文章推荐
10.3.1 探索性数据分析
10.3.2 实验评估
10.4 相关物品推荐
10.4.1 语义相关性
10.4.2 响应预测
10.4.3 预测响应和预测相关性的结合
10.5 小结
第11章 多目标优化
11.1 应用设置
11.2 分段方法
11.2.1 问题设置
11.2.2 目标优化
11.3 个性化方法
11.3.1 原始表示
11.3.2 拉格朗日对偶
11.4 近似方法
11.4.1 聚类
11.4.2 采样
11.5 实验
11.5.1 实验设置
11.5.2 实验结果
11.6 相关工作
11.7 小结
参考文献
索引