新書推薦:
《
资治通鉴臣光曰辑存 资治通鉴目录(司马光全集)(全二册)
》
售價:HK$
296.7
《
明代社会变迁时期生活质量研究
》
售價:HK$
308.2
《
律令国家与隋唐文明
》
售價:HK$
74.8
《
紫云村(史杰鹏笔下大唐小吏的生死逃亡,新历史主义小说见微之作,附赠5张与小说内容高度契合的宣纸彩插)
》
售價:HK$
101.2
《
现代吴语的研究(中华现代学术名著3)
》
售價:HK$
66.7
《
天下的当代性:世界秩序的实践与想象(新版)
》
售價:HK$
79.4
《
德国天才4:断裂与承续
》
售價:HK$
112.7
《
妈妈的情绪,决定孩子的未来
》
售價:HK$
43.7
編輯推薦:
过去十年中,社会媒体蓬勃发展,彻底改变了人们的社交行为和企业的商业模式。人们在社会媒体上交互、分享和阅读内容,进而以空前的速度产生了大量数据。理解和处理这类新型数据,并从中发现有用的模式,对于交叉学科研究、新算法和工具的研发来讲是挑战与机遇并存。
本书整合了社会媒体、社会网络分析以及数据挖掘的相关知识,为学生、从业者、研究人员和项目经理理解社会媒体挖掘的基础知识和潜能,提供了一个方便的平台。本书介绍了社会媒体数据独有的问题,并阐述了网络分析以及数据挖掘中的基本概念、新出现的问题和有效的算法。
本书可作为高年级本科生和低年级硕士生的教材,也可以作为短期专业课程用书。书中涵盖了不同难度的练习题,可以帮助读者在社会媒体数据挖掘的不同场景中理解和应用相关的概念、原理以及方法。
內容簡介:
本书集成了近年来社会媒体、社会网络分析以及数据挖掘的前沿成果,为学生、从业者、研究人员和项目经理提供了一个方便的平台,以便理解社会媒体挖掘的基础知识和潜能。本书介绍了社会媒体数据的问题,并阐述了网络分析和数据挖掘的基本概念、新问题以及有效的算法。
關於作者:
Reza Zafarani 雪城大学助理教授,曾为亚利桑那州立大学计算机科学与工程专业助理研究员。研究方向为社会媒体挖掘、机器学习、社会网络分析和社会计算。研究重点是大规模用户行为分析,以及跨社会媒体网站的信息整合和建模。
Mohammad Ali Abbasi 亚利桑那州立大学计算机科学与工程专业助理研究员。研究方向为文本分析、信息检索、数据挖掘、机器学习和社会计算。研究重点是用户归档、用户可信度评估、推荐系统、社会网络分析,以及社会媒体在现实世界的应用。
Huan Liu(刘欢) 亚利桑那州立大学计算机科学与工程专业教授,在教学和科研领域都取得了公认的优异成绩。研究方向为数据挖掘、机器学习、社会计算、人工智能,以及真实数据密集型应用的问题。
目錄 :
第1 章 引言 1
1.1 什么是社会媒体挖掘 1
1.2 挖掘领域的新挑战 2
1.3 本书概览和读者指南 3
1.4 小结 5
1.5 参考文献及注释 5
1.6 习题 6
**部分 基础知识
第2 章 图的基本要素 10
2.1 图的基础知识 11
2.1.1 结点 11
2.1.2 边 11
2.1.3 度和度的分布 12
2.2 图的表示 14
2.2.1 邻接矩阵 14
2.2.2 邻接表 15
2.2.3 边列表 15
2.3 图的类型 16
2.4 图的连通性 17
2.5 特殊图 21
2.5.1 树和森林 21
2.5.2 特殊子图 21
2.5.3 完全图 23
2.5.4 平面图 23
2.5.5 二分图 23
2.5.6 正则图 24
2.5.7 桥 25
2.6 图算法 25
2.6.1 图树的遍历 25
2.6.2 *短路径算法 27
2.6.3 *小生成树 29
2.6.4 网络流算法 31
2.6.5 二分图**匹配 34
2.6.6 桥检测 35
2.7 小结 36
2.8 参考文献及注释 37
2.9 习题 37
第3 章 网络度量 40
3.1 中心性 40
3.1.1 度中心性 40
3.1.2 特征向量中心性 42
3.1.3 Katz 中心性 44
3.1.4 PageRank 46
3.1.5 中间中心性 47
3.1.6 接近中心性 48
3.1.7 群体中心性 50
3.2 传递性与相互性 51
3.2.1 传递性 51
3.2.2 相互性 53
3.3 平衡和地位 55
3.4 相似度 57
3.4.1 结构等价性 57
3.4.2 规则等价性 59
3.5 小结 61
3.6 参考文献及注释 61
3.7 习题 62
第4 章 网络模型 64
4.1 真实世界网络的属性 64
4.1.1 度分布 65
4.1.2 聚类系数 66
4.1.3 平均路径长度 67
4.2 随机图模型 67
4.2.1 随机图的演变 69
4.2.2 随机图的属性 71
4.2.3 基于随机图的真实世界网络
建模 73
4.3 小世界模型 73
4.3.1 小世界模型的属性 75
4.3.2 基于小世界模型对真实世界
网络建模 77
4.4 优先链接模型 77
4.4.1 优先链接模型的属性 78
4.4.2 基于优先链接模型对真实世界
网络进行建模 80
4.5 小结 80
4.6 参考文献及注释 81
4.7 习题 81
第5 章 数据挖掘的基本要素 83
5.1 数据 84
5.2 数据预处理 87
5.3 数据挖掘算法 89
5.4 监督学习 89
5.4.1 决策树 90
5.4.2 朴素贝叶斯分类器 92
5.4.3 *近邻分类器 93
5.4.4 利用社交信息辅助分类 94
5.4.5 回归 96
5.4.6 监督学习评估 99
5.5 无监督学习 99
5.5.1 聚类算法 100
5.5.2 无监督学习的评估 102
5.6 小结 104
5.7 参考文献及注释 105
5.8 习题 106
第二部分 社区和交互
第6 章 社区分析 110
6.1 社区发现 112
6.1.1 社区发现算法 113
6.1.2 基于成员的社区发现 114
6.1.3 基于群组的社区发现 119
6.2 社区演变 126
6.2.1 网络是如何演变的 126
6.2.2 演变网络中的社区发现 129
6.3 社区评价 131
6.3.1 存在真实答案时的评价 131
6.3.2 无真实答案的评价 134
6.4 小结 135
6.5 参考文献及注释 136
6.6 习题 137
第7 章 社会媒体中的信息传播 139
7.1 羊群效应 140
7.1.1 羊群效应的贝叶斯建模 142
7.1.2 干预 144
7.2 信息级联 145
7.2.1 独立级联模型 145
7.2.2 级联范围**化 147
7.2.3 干预 149
7.3 社交网络中的创新扩散 149
7.3.1 创新的特征 150
7.3.2 创新扩散模型 150
7.3.3 创新扩散过程建模 152
7.3.4 干预 155
7.4 流行病模型 155
7.4.1 定义 156
7.4.2 SI 模型 156
7.4.3 SIR 模型 158
7.4.4 SIS 模型 159
7.4.5 SIRS 模型 160
7.4.6 干预 161
7.5 小结 161
7.6 参考文献及注释 162
7.7 习题 163
第三部分 应用
第8 章 影响力和同质性 166
8.1 度量同配性 167
8.1.1 度量符号属性的同配性 167
8.1.2 度量序数属性的同配性 170
8.2 影响力 172
8.2.1 度量影响力 172
8.2.2 影响力建模 175
8.3 同质性 179
8.3.1 度量同质性 179
8.3.2 同质性建模 179
8.4 区分影响力和同质性 180
8.4.1 洗牌测试 180
8.4.2 边缘反转测试 181
8.4.3 随机化测试 181
8.5 小结 184
8.6 参考文献及注释 184
8.7 习题 185
第9 章 社会媒体中的推荐 187
9.1 挑战 188
9.2 经典的推荐算法 188
9.2.1 基于内容的算法 189
9.2.2 协同过滤 189
9.2.3 将个人推荐推广到群体推荐 195
9.3 基于社会背景知识的推荐系统 197
9.3.1 单独使用社会背景知识 198
9.3.2 基于社会背景知识的经典算法
扩展 198
9.3.3 社会背景知识受限的推荐 200
9.4 推荐系统评价 202
9.4.1 评估预测的准确率 202
9.4.2 评估推荐的相关性 203
9.4.3 评估推荐的排序 204
9.5 小结 205
9.6 参考文献及注释 206
9.7 习题 207
第10 章 行为分析 208
10.1 个体行为 208
10.1.1 个体行为分析 209
10.1.2 个体行为建模 213
10.1.3 个体行为预测 214
10.2 群体行为 217
10.2.1 群体行为分析 217
10.2.2 群体行为建模 221
10.2.3 群体行为预测221
10.3 小结 222
10.4 参考文献及注释 223
10.5 习题 224
参考文献 225