新書推薦:
《
理想城市:环境与诗性
》
售價:HK$
85.8
《
大模型推荐系统:算法原理、代码实战与案例分析
》
售價:HK$
97.9
《
逆风翻盘 危机时代的亿万赢家 在充满危机与风险的世界里,学会与之共舞并找到致富与生存之道
》
售價:HK$
137.5
《
工业互联网导论
》
售價:HK$
97.9
《
木偶的恨意(法国悬念大师米歇尔普西悬疑新作)
》
售價:HK$
64.9
《
孤独传:一种现代情感的历史
》
售價:HK$
85.8
《
家、金钱和孩子
》
售價:HK$
64.9
《
形而上学与测量
》
售價:HK$
74.8
|
編輯推薦: |
深入理解推荐系统
丰富案例实操落地
业务角度全面思考
助力产品运营人员给业务和自己带来可期增量
资深产品管理者、教育者闫泽华新作!
|
內容簡介: |
如今,推荐算法已经普遍应用于在线各个领域和场景,越来越多的商品、服务、用户通过推荐算法高效地连接彼此,每个人都享受到更加个性化的内容和服务。推荐已深刻地改变了我们与世界连接的方式。
本书聚焦在产品运营的角色上,探讨产品运营人员应该如何理解推荐算法,如何在不同的功能场景下应用推荐算法,如何从平台业务的角度对算法结果进行干预和再平衡。此外,本书着重于阐述不同功能场景下推荐的应用,辅以内容、电商、社交等业务下的应用实例。在每个章节中,都会枚举市面上已有产品功能或作者本人经历过的业务实践,以期给读者提供可以实操落地的借鉴。
|
關於作者: |
闫泽华
资深产品管理者、教育者。BOSS 直聘策略产品负责人,字节跳动策略产品专家,拥有丰富的互联网产品管理经验。著有《内容算法:把内容变成价值的效率系统》《人人都该懂点产品思维》《把自己视作产品:互联网大厂求职进阶之道》。
|
目錄:
|
序 001
第一章 走近推荐系统
从断物识人开始理解推荐 002
推荐算法:物以类聚、人以群分 024
推荐架构:推荐结果是如何产出的 030
本章小结 047
第二章 推荐能力的应用
冷启动:一回生二回熟 050
用户兴趣探索:从一元到多元 072
生产者分级:从货品到供货商 078
列表页推荐:屏幕亦有屏效 090
列表页交互:单列还是双列,该怎么选? 099
相关推荐:相关不相关?全靠文案掰 106
拆解推送:拉得来人、留得住客 111
搜索与推荐:探索未知的不同方式 121
关注分发:机器推荐为何还需要关注 136
推荐的场景化表达 142
本章小结 147
第三章 常见的推荐问题
重复推荐问题 149
推荐密集问题 159
推荐频次控制 163
易反感内容的推荐优化 166
时空限定内容的推荐优化 172
本章小结 177
第四章 从推荐到业务
不同业务下的推荐差异性 179
如何用立体的指标衡量业务 189
不止于推荐效率,更是变现效率 200
本章小结 207
第五章 与推荐协作
推荐产品经理的自我迭代 210
如何正确地开设实验 231
如何高效地与算法协作 237
尽信数,不如无数 242
本章小结 250
第六章 推荐外的思考
推荐会导致低质? 253
个性化的好与好的个性化 264
改变流量去往的方向 266
本章小结 275
后 记 277
|
內容試閱:
|
当我们审视不同的业务模型时,发现最核心的就是“连接”二字:
内容业务:如抖音、知乎,连接的是人和内容;
电商业务:如拼多多、淘宝,连接的是人和商品;
社交业务:如Boss直聘、陌陌,连接的是人和人。
应用于不同“连接”场景下的算法模型,即便再复杂,也跳不出基础的框架:更深刻地理解业务两端的对象(人和内容、人和商品、人和人),才能实现更高效准确的连接。
产品运营人员通过理解推荐算法的基础原理和推荐系统的工作方式,设定合理的目标与评价标准,就能够和算法人员协作好,将推荐能力应用于推荐系统。
那么,就让我们从画像开始,理解我们的用户和服务,一起走近推荐系统。
从断物识人开始理解推荐
从线性规则干预到协同算法的应用,再到只可意会难以言传的深度学习、神经网络和大模型等,今天的推荐算法正在变得越来越精妙,推荐系统也在变得越来越高深和复杂。对与推荐系统协作的产品运营人员来说,我们或许不需要一上来就陷进推荐算法背后复杂的数学模型和论文里,而是可以更朴素地,从理解推
荐系统的基础原理出发:
推荐系统是一个连接器,一端是物(内容、商品、服务),一端是人。 物的部分,无论是内容、商品还是服务,当它们投射到线上后,都是以信息的方式来呈现的:商品和服务需要通过详情页的图文、视频信息来呈现自己的特点,以帮助用户进行决策。
l 人的部分,当用户投射到线上,是以行为动作的方式来呈现自己的轨迹:是否有查看特定信息的行为、是否有点击相关信息的动作、是否有更进一步的交互沉淀,如评论、分享、下单,等等。
经由物和人的线上化投射,我们不难发现:与其说推荐系统连接的是具象的物与人,不如说推荐系统连接起的是两个抽象的信息集合。当物和人都变成了信息与动作的流动字节,只要我们能够更好地理解这些信息,就可以更高效地完成双方的对接。
理解用户和消费对象的特点,构建出人与物的业务画像,断物识人是一切推荐系统的起点。
何为画像:标签化人与物
既然推荐系统是用来高效地连接人和物的,那么,就让我们模拟一个场景,你会如何给朋友推荐一首歌曲呢?
你的回答或许是:“这是某某歌手某张专辑的主打,是一首情歌,拿下了当年的金曲奖。”
在这一句短短的介绍中,你就已经提及了这首歌曲的几个标签信息:
l 创作者信息:某歌手、某专辑;
l 歌曲分类:情歌;
l 获奖信息:某年金曲奖。
单个标签可以表征物品特定维度的特性,多个标签的结合就可以更完整立体地描述一个物品。
延续上面歌曲推荐的例子,如果我们想要构建一个歌曲标签库,从而尽可能完备地刻画每一首歌曲各方面的特点,又该如何做呢?
业界给出了两个答案:其一,引入专家的知识进行自上而下的构建(PGC);其二,调动群众的力量进行自下而上的构建(UGC)。
引入专家知识就像是传统词典的编撰工作,邀请行业内专家前置构建出一部尽可能完备的词典,从而让待推荐的对象能在其中找到可关联的标签。
一 个 典 型 的 专 家 系 统 示 例, 是 音 乐 推 荐 引 擎 潘 多 拉(Pandora)的音乐基因工程。在这项工程中,歌曲体系被抽离出450 个标签,细化到如主唱性别、电吉他失真程度、背景和声类型等。 每一首歌曲都会经由工作人员耗时二三十分钟,有选择性地标注一些标签,并以从 0 到 5 的分值代表这一标签的表征程度。正是这项浩瀚的工程奠定了潘多拉音乐推荐的基础,并成了它的专利法宝。
尽管结构严谨、叙事完备,专家系统仍然有其不方便的地方。最典型的问题就是因为标签体系是事前定义的,所以灵活性打了折扣,无法响应新内容的产生。比如,最近一两年兴起的国风化和不同音乐形式的结合,如国风摇滚、国风饶舌,就很难在事先编辑好的专家系统里找到对应的标签。
伴随着去精英化的叙事,很多平台选择将定义标签的权力下放,就像维基百科一样,希望通过普通用户的力量构筑起一个更多元化、更实时化的标签集合。
以豆瓣为例,给音乐打标签的过程从专家产出转为了普通网友贡献。群体力量为豆瓣积累了大量的具有语义表意性的内容,也让整个标签库的更新迭代速度变得更快:如最新的获奖信息、新的融合曲风等时效性相关的标签能够及时地被绑定到对应的歌曲上。
有所得必然有所失,因为缺乏专家的标准化约束,群体贡献的标签存在信息冗余、错误等问题,需要进行清洗、归一化和降噪后,才能够被有效地应用。以图 1-2 为例,该图截自豆瓣音乐的标签系统,图中被框选的部分:J-POP 和 JPOP、英国和 UK 等标签,都是表意相同的重复标签,只有经过表述归一化的清洗后,这些标签才可以被更有效地应用。
既然物品可以通过标签来刻画,那么用户也可以通过标签的方式来刻画。如图 1-3,就是笔者在豆瓣FM的音乐基因名片。
那这张音乐基因名片是怎么来的呢?恰如消费主义时代常见的一句话:“你消费了什么样的内容,你就是什么样的人。”平台首先对提供的物品进行了标签化,再基于我们消费了哪些物品,这些物品上高频共现的标签是什么,来体现作为消费者的我们具有什么样的标签。
以豆瓣FM为例,它基于用户的红心歌曲、专辑收藏记录进行计算,从而得出了这幅记录用户音乐偏好的歌手和风格列表的标签云,图中标签的尺寸越大代表用户对这个类型的音乐越感兴趣。
在应用场景内,给物品或用户打标签的过程就被称作构建物品画像和用户画像。在这一过程中,我们有如下的拓展应用空间:
l 应用场景限定信息切片:尽管人是丰富而立体的,但是当我们在使用特定应用的时候,就只有一部分行为被沉淀在对应场景下。这就使得应用内的标签是有场景限定的,比如音乐软件只关心我偏好什么样的音乐,电商软件只关心我的消费习惯。各个应用更聚焦于自己应用场景的用户和物品画像。
l 信息丰富度的多维扩展:物品是可以绑定多重标签的,当一个物品被挖掘出更多维度的标签,就能够被更充分地理解、更广泛地推荐。比如一首歌曲既有歌手标签,又有曲风的标签,还有场景的标签,就可以被推荐给歌手的歌迷群体,推荐给对这一曲风感兴趣的用户,或者结合场景(如读书、运动等)进行推荐。
l 基于一致标签建立连接:如果物品和用户身上都打上了同一种标签,那么双方自然可以高效地连接在一起。比如,发现用户对爵士乐比较感兴趣,那么系统就可以源源不断地将更多的爵士乐推荐出来。作为一个连接双边的推荐系统,探索出更多物品的标签,沉淀出更多用户的标签,就能够更好地提升系统的连接规模和连接效率。
|
|