新書推薦:
《
淡水鱼类营养生理与饲料
》
售價:HK$
333.8
《
人体结构绘画重点
》
售價:HK$
143.4
《
中国妖怪故事(全集·增订版)
》
售價:HK$
221.8
《
于胥斯原 乡族、风水与地方记忆
》
售價:HK$
177.0
《
以经治国与汉代社会
》
售價:HK$
98.6
《
我真正想要什么?:智慧瑜伽答问/正念系列
》
售價:HK$
58.2
《
元朝理财记 从成吉思汗的崛起到元朝的衰亡
》
售價:HK$
98.6
《
欧洲史:一本书历览欧洲数千年兴衰起伏,理解欧洲文明何以铸就今日世界
》
售價:HK$
333.8
|
內容簡介: |
推荐系统作为近年来非常热门的AI技术落地场景,已广泛应用于各行业的互联网应用,从衣食住行到娱乐消费,以及无处不在的广告,背后都依赖推荐系统的决策。本书贴合工业级推荐系统,以推荐系统的整体技术框架为切入点,深入剖析推荐系统中的内容理解、用户画像、召回、排序、重排等核心模块,介绍每个模块的核心技术和业界应用,并展开介绍了推荐冷启动、推荐偏置与消偏等常见问题和解决方案。此外,还对当前推荐系统领域的热门前沿技术进行了介绍,包括强化学习、因果推断、端上智能等。
|
關於作者: |
胡澜涛,毕业于清华大学计算机系,快手推荐算法技术总监。曾任字节跳动高级算法工程师,腾讯高级研究员。在推荐系统领域有丰富的实践经验,负责过包括Tikok、快手、微信看一看在内的多个大规模工业级推荐系统的核心研发工作。主要研究方向为推荐系统,发表相关领域的学术论文6篇,拥有专利5项。李?h亭,毕业于大连理工大学计算机专业。曾先后就职于百度、小米等公司,参与百度凤巢广告CTR预估模型的研发,负责小米音乐、阅读、应用商店、游戏中心等多个产品推荐服务从0到1的搭建,在搜索、广告、推荐领域有丰富的实战经验。目前转战智能家居领域,探索智能感知、智能决策等AI技术在新场景的落地。崔光范,毕业于中国科学院软件研究所,爱奇艺助理研究员,负责短视频信息流推荐业务。曾任小米推荐算法工程师,负责应用商店、游戏中心、有品等业务的推荐工作,从零构建了小米垂域业务的深度推荐引擎。主要研究方向是推荐系统、计算广告、搜索等,发表过多篇论文和专利。易可欣,毕业于北京大学,先后在爱奇艺、快手担任推荐系统算法工程师,主要研究方向为召回策略与模型、数据挖掘、样本优化等。
|
目錄:
|
第1章 初识推荐系统11.1 推荐系统大时代11.1.1 推荐系统的定义21.1.2 推荐系统的价值31.1.3 推荐系统的天时地利41.1.4 推荐系统架构概览51.2 推荐系统的核心模块71.2.1 内容理解:理解和刻画推荐内容71.2.2 用户画像:理解和刻画用户71.2.3 召回:为用户初筛内容81.2.4 排序:为用户精选内容91.2.5 重排:从业务角度进行内容调整101.2.6 推荐系统质量评估体系11总结11第2章 多模态时代的内容理解132.1 内容标签体系建设142.1.1 标签体系的作用142.1.2 标签体系设计和建设142.1.3 标签提取和生成162.2 文本内容理解182.2.1 文本分类182.2.2 文本标签提取212.2.3 文本聚类222.2.4 文本Embedding222.2.5 知识图谱262.3 多模态内容理解282.3.1 图像分类282.3.2 视频分类302.3.3 视频多模态内容Embedding312.4 内容理解在推荐系统中的应用32总结33第3章 比你更了解自己的用户画像343.1 初识用户画像343.1.1 什么是用户画像353.1.2 用户画像的作用353.1.3 用户画像系统架构363.2 用户画像标签体系373.2.1 用户基础属性标签373.2.2 用户社交属性标签393.2.3 用户行为属性标签393.2.4 用户兴趣标签403.2.5 用户分层标签413.2.6 其他常用维度标签413.3 用户画像标签开发423.3.1 标签的基础数据423.3.2 标签计算整体流程423.3.3 规则类标签443.3.4 统计类标签443.3.5 模型类标签453.4 用户画像实践案例46总结51第4章 包罗万象的召回环节524.1 召回的基本逻辑和方法论524.1.1 召回的重要性524.1.2 召回与排序的区别534.1.3 主要的召回策略与算法544.2 传统召回策略554.2.1 基于内容的召回554.2.2 经典协同过滤召回564.2.3 探索类召回584.3 向量化模型召回594.3.1 向量化模型召回原理594.3.2 从KNN到ANN604.3.3 经典向量化召回模型624.4 基于用户行为序列的召回654.4.1 SASRec——经典行为序列召回模型654.4.2 BERT4Rec与BST——NLP技术与用户行为序列结合664.4.3 MIND及其衍生——多兴趣召回模型684.4.4 超长序列召回——建模用户全期兴趣704.5 图Embedding在召回中的应用724.5.1 图Embedding技术734.5.2 DeepWalk——经典图Embedding方法744.5.3 Node2Vec——DeepWalk更进一步754.5.4 PinSAGE——GCN在推荐系统领域的工业化应用764.5.5 MetaPath2Vec——异构图Embedding方法774.6 前瞻性召回策略与模型794.6.1 TDM——模型与索引结合的艺术794.6.2 对比学习——样本的魔法814.7 召回质量评估方法824.7.1 召回评估方法概述834.7.2 召回率、精确率、F1值——基准评估指标834.7.3 HR、ARHR——TopN推荐评价指标844.7.4 CG、DCG、nDCG——信息增益维度的评估指标844.7.5 长尾覆盖评估85总结86第5章 投你所好的排序环节875.1 排序环节的意义和优化方向875.1.1 排序环节的意义875.1.2 排序环节的优化方向885.2 从Embedding看排序模型的演进895.2.1 什么是Embedding905.2.2 Embedding的产生过程915.2.3 特征组合在深度排序模型中的应用945.2.4 用户历史行为建模在深度排序模型中的应用1015.2.5 超大规模Embedding在实际中的应用1075.3 推荐系统粗排阶段及其发展历程1135.3.1 粗排定位与技术路线选择1145.3.2 粗排模型架构的演变1165.3.3 使用知识蒸馏增强粗排与精排的一致性1205.3.4 缓解样本选择偏差1285.3.5 粗排效果的评价1305.4 多目标排序建模1315.4.1 多目标排序建模的意义和挑战1315.4.2 多目标排序建模方法概览1325.4.3 多目标融合寻参1425.5 推荐系统排序阶段的评估1425.5.1 排序评估的两个阶段1435.5.2 常用的效果评估指标1445.5.3 常用的系统评估指标1455.5.4 离线和线上效果的一致性问题146总结147第6章 权衡再三重排序1486.1 重排序的必要性和作用1486.2 重排模型1506.2.1 重排模型建模的出发点1506.2.2 序列重排模型1516.2.3 基于强化学习的重排模型1576.3 重排多样性策略1606.3.1 重排多样性的出发点1606.3.2 多样性评估指标1616.3.3 规则多样性打散1626.3.4 多样性模型策略1646.4 重排中的业务规则167总结169第7章 如若初见冷启动1707.1 推荐冷启动的定义与挑战1707.2 冷启动一般解决思路1717.3 新用户推荐冷启动1737.3.1 新用户召回策略1737.3.2 新用户排序模型1757.3.3 新用户重排策略1777.4 新物品分发冷启动1787.4.1 新物品冷启动召回策略1797.4.2 新物品冷启动排序策略1807.4.3 新物品冷启动流量分配机制181总结184第8章 推荐系统中的魔术手1858.1 特征工程1858.1.1 特征的理解和分类1868.1.2 特征挖掘维度1868.1.3 工程视角下的特征工程开发1878.1.4 特征工程的流程和方法1908.2 样本加工艺术1938.2.1 如何提取有效样本1938.2.2 负样本优化1958.2.3 样本迁移1978.2.4 其他样本优化技巧1988.3 推荐系统实效性1988.3.1 推荐数据实效性1998.3.2 推荐模型实效性2018.3.3 在线学习整体机制2028.4 推荐中的偏差与消偏策略2028.4.1 推荐偏差的缘由2038.4.2 推荐系统常见偏差2038.4.3 常用的消偏技术和策略205总结209第9章 系统进化的利器——AB实验平台2109.1 什么是AB实验2109.2 AB实验平台框架2129.3 AB实验分流机制&实验类型2149.4 AB实验效果评估2179.4.1 推荐系统常见的AB指标2189.4.2 AB实验的假设检验2199.4.3 AB实验的流量大小2219.5 AB实验并不是万能的221总结225第10章 推荐系统中的前沿技术22610.1 强化学习22610.2 因果推断23010.3 端上智能23510.4 动态算力分配23810.5 增益模型241总结246
|
|