登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

2025年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

一月出版：大陸書台灣書
12月出版：大陸書台灣書
11月出版：大陸書台灣書
十月出版：大陸書台灣書
九月出版：大陸書台灣書
八月出版：大陸書台灣書
七月出版：大陸書台灣書
六月出版：大陸書台灣書
五月出版：大陸書台灣書
四月出版：大陸書台灣書
三月出版：大陸書台灣書
二月出版：大陸書台灣書
一月出版：大陸書台灣書
12月出版：大陸書台灣書

『簡體書』Hadoop大数据开发基础（第3版）（微课版）

書城自編碼： 4146273
分類：簡體書→大陸圖書→教材→研究生/本科/专科教材
作者：张军，张良均
國際書號(ISBN)： 9787115666178
出版社：人民邮电出版社
出版日期： 2025-08-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：HK$ 65.8

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《大学问·近代中国工业发展史（1860—1916）（著名历史学家张玉法先生学术代表作）》
售價：HK$ 86.9

《战争与人性》
售價：HK$ 71.5

《品格之路戴维布鲁克斯著《社会动物》《如何了解一个人》作者布鲁克斯经典作品自我价值心理学书》
售價：HK$ 96.8

《可怜的东西》
售價：HK$ 85.8

《整理国故：文化运动与考证学风》
售價：HK$ 118.8

《霍布斯的政治科学及其起源》
售價：HK$ 85.8

《百年星辰：寻找现代中国的大师》
售價：HK$ 107.8

《情绪的真相：关于情绪的内在力量》
售價：HK$ 74.8

編輯推薦：

“十四五”职业教育国家规划教材
紧贴“1+X”大数据应用开发（Python）中级证书考核标准，项目驱动，实战导向。
全书全面升级，采用Hadoop 3.3.6、Hive 3.1.3、HBase 2.5.7等新版本，全面提升教学兼容性与前沿性，贴近企业真实应用环境。
教材结构优化为项目任务式，每章融合“电影网站影评分析”贯穿案例，实现知识学习与实操训练的有机融合，打通学习闭环。
覆盖虚拟机安装、集群搭建、MapReduce开发、日志分析、Hive数据仓库、HBase数据存储等关键技能，适配IDEA 2023等主流工具版本。
新增“素养目标”与“思维导图”，引导学生构建知识体系、提升综合能力，兼顾职业素养培养与技术提升。

內容簡介：

本书以“电影网站用户影评分析”项目为导向，较为全面地介绍Hadoop大数据技术及其生态系统组件Hive、HBase的相关知识。本书共6个项目，具体内容包括分析电影网站用户影评需求及环境搭建、存储电影网站用户影评分析数据、统计电影网站用户影评数据、多维度分析电影网站用户影评、基于Hive实现电影网站用户影评分析和基于HBase实现存储电影网站用户影评分析结果。本书每个项目均包含实训与习题，读者可通过操作和练习，巩固所学的内容。
本书可以作为高校大数据技术相关专业的教材，也可以作为“1+X”证书制度试点工作中的大数据应用开发（Python）职业技能等级证书（中级）考试的培训用书和大数据技术爱好者的自学用书。

關於作者：

张军，副教授，主要研究领域为大数据技术与应用技术、高职教育教学改革。现任广东科学技术职业学院计算机学院副院长，广东省品牌专业(大数据技术)负责人，大数据省级教学团队负责人，软件技术中国特色高水平专业群建设项目、首批国家级职业教育教学创新团队核心骨干成员，广东省农村科技特派员，广东科学技术职业学院专业领军人才，兼任广东省大数据产教融合协会副秘书长。

项目1　分析电影网站用户影评需求及环境搭建　1
【学习目标】　1
【项目背景】　1
【思维导图】　2
【知识准备】　2
1.1　Hadoop简介　2
1.1.1　什么是Hadoop　2
1.1.2　了解Hadoop的特点　3
1.1.3　了解Hadoop核心组件　4
1.1.4　了解Hadoop生态系统　11
1.1.5　了解Hadoop应用场景　14
1.2　安装及配置虚拟机　15
1.2.1　创建Linux虚拟机　16
1.2.2　设置固定IP地址　24
1.2.3　远程连接虚拟机　26
1.2.4　配置本地YUM源及安装常用软件　29
1.3　搭建Hadoop完全分布式集群　33
1.3.1　在Linux下安装Java　34
1.3.2　修改配置文件　35
1.3.3　克隆虚拟机　38
1.3.4　配置SSH免密码登录　41
1.3.5　配置时间同步服务　42
1.3.6　启动和关闭Hadoop集群　44
1.3.7　监控Hadoop集群　45
【项目实践】　47
任务1　了解数据字段　47
任务2　分析影评统计需求　49
【项目总结】　49
【实训】　49
实训1　修改master虚拟机的IP地址　49
实训2　编写Shell脚本同步集群时间　50
【习题】　50
项目2　存储电影网站用户影评分析数据　53
【学习目标】　53
【项目背景】　53
【思维导图】　54
【知识准备】　54
2.1　认识Hadoop安全模式　54
2.1.1　了解Hadoop安全模式　54
2.1.2　查看、解除和开启Hadoop安全模式　55
2.2　查看Hadoop集群的基本信息　57
2.2.1　查询集群的存储系统信息　57
2.2.2　查询集群的计算资源信息　60
2.3　上传文件到HDFS目录　61
2.3.1　了解HDFS　61
2.3.2　HDFS的基本操作　64
2.4　运行MapReduce任务　68
2.4.1　了解Hadoop官方的示例程序包　68
2.4.2　提交MapReduce任务给集群运行　68
2.5　管理多个MapReduce任务　71
2.5.1　查询MapReduce任务　71
2.5.2　中断MapReduce任务　74
【项目实践】　76
任务3　上传用户影评数据至HDFS　76
【项目总结】　77
【实训】　78
实训1　统计文件中所有单词的长度的标准差　78
实训2　查询与中断MapReduce任务　78
【习题】　79
项目3　统计电影网站用户影评数据　81
【学习目标】　81
【项目背景】　81
【思维导图】　82
【知识准备】　82
3.1　在IntelliJ IDEA中搭建MapReduce开发环境　82
3.1.1　在Windows下安装Java　82
3.1.2　下载、安装并启动IntelliJ IDEA　85
3.1.3　创建MapReduce工程　88
3.1.4　配置MapReduce环境　90
3.2　通过源码初识MapReduce编程　91
3.2.1　了解MapReduce实现词频统计的执行流程　92
3.2.2　读懂官方提供的WordCount源码　93
3.3　根据登录次数对网站用户登录次数数据进行升序排序　98
3.3.1　分析思路与处理逻辑　98
3.3.2　编写核心模块代码　100
3.3.3　打包程序并提交MapReduce任务给集群运行　101
【项目实践】　101
任务4　创建并配置工程项目　101
任务5　统计所有电影的评分次数　103
任务6　统计不同性别的用户对电影的评分　108
【项目总结】　113
【实训】　113
实训1　使用MapReduce编程统计某超市1月商品被购买的次数　113
实训2　使用MapReduce编程统计各科目的平均成绩　114
实训3　使用MapReduce编程统计网站每日访问次数　115
【习题】　116
项目4　多维度分析电影网站用户影评　118
【学习目标】　118
【项目背景】　118
【思维导图】　119
【知识准备】　119
4.1　设置MapReduce输入输出格式　119
4.1.1　设置MapReduce输入格式　120
4.1.2　设置MapReduce输出格式　121
4.1.3　筛选日志文件并生成序列化文件　122
4.2　使用Hadoop Java API实现文件操作　124
4.2.1　使用FileSystem API管理文件夹　124
4.2.2　使用FileSystem API操作文件　127
4.2.3　使用FileSystem API读/写数据　129
4.2.4　使用Hadoop Java API读取序列化文件　131
4.3　优化MapReduce统计程序　133
4.3.1　自定义键值类型　133
4.3.2　初步探索Combiner　136
4.3.3　浅析Partitioner　139
4.3.4　自定义计数器　141
4.4　在IntelliJ IDEA中打包并提交MapReduce程序　143
4.4.1　传递参数　144
4.4.2　使用Hadoop辅助类ToolRunner　145
4.4.3　自动打包并提交MapReduce程序　146
【项目实践】　149
任务7　统计评分次数最多的10部电影并分析　149
任务8　统计不同性别的用户评分最高的10部电影并分析　152
任务9　计算指定电影的各年龄段用户的平均评分并分析　156
任务10　统计影评库中各种类型电影中评分最高的5部电影并分析　159
【项目总结】　164
【实训】　165
实训1　使用MapReduce编程统计各科目成绩最高的学生　165
实训2　使用MapReduce编程筛选出指定出版年份的图书　165
实训3　使用MapReduce编程统计水稻品种的数量　166
【习题】　167
项目5　基于Hive实现电影网站用户影评分析　170
【学习目标】　170
【项目背景】　170
【思维导图】　171
【知识准备】　171
5.1　认识Hive数据仓库　171
5.1.1　什么是Hive　171
5.1.2　了解Hive与传统数据库的对比　172
5.1.3　了解Hive系统架构　173
5.1.4　了解Hive数据模型　174
5.1.5　了解Hive执行流程　175
5.2　Hive的安装模式　175
5.2.1　设置内嵌模式　175
5.2.2　设置直连数据库模式　177
5.2.3　设置远程模式　181
5.3　实现Hive表的创建与修改　183
5.3.1　了解Hive数据定义语言的基本语法　183
5.3.2　创建表的基本操作　186
5.3.3　修改表的基本操作　189
5.4　实现Hive表中数据的增删查改　190
5.4.1　了解Hive数据操作语言的基本语法　190
5.4.2　向数据表中装载文件　192
5.4.3　查询数据　193
5.4.4　插入数据　197
5.4.5　删除数据　198
【项目实践】　199
任务11　创建电影、用户、评分数据表　199
任务12　分析电影、用户、评分数据表　200
【项目总结】　202
【实训】　202
实训1　查询图书馆图书的被借阅次数及读者借阅图书的次数　202
实训2　基于Hive实现表的连接及信息查询处理　203
实训3　查询电商货品订单数据　204
【习题】　206
项目6　基于HBase实现存储电影网站用户影评分析结果　208
【学习目标】　208
【项目背景】　208
【思维导图】　209
【知识准备】　209
6.1　认识HBase分布式数据库　209
6.1.1　什么是HBase　209
6.1.2　了解HBase系统架构　211
6.1.3　了解HBase数据模型　213
6.1.4　了解HBase读/写流程　215
6.2　安装和部署HBase集群　217
6.2.1　了解并安装ZooKeeper　217
6.2.2　安装及配置HBase集群　221
6.3　掌握HBase常用的Shell命令　225
6.3.1　修改与删除表　227
6.3.2　查询表数据　228
6.4　使用HBase Java API实现表设计　231
6.4.1　创建Java项目　231
6.4.2　实现表的创建　233
6.4.3　向表中插入数据　234
【项目实践】　235
任务13　存储评分次数最多的10部电影的数据　235
任务14　存储不同性别的用户评分最高的10部电影及评分信息的数据　238
任务15　存储电影ID为2858的电影各年龄段用户的平均评分数据　240
任务16　存储影评库中各种类型电影中评分最高的5部电影的数据　242
【项目总结】　244
【实训】　244
实训1　使用HBase Shell命令创建学生信息表并插入数据　244
实训2　使用HBase Java API对HBase数据库的表进行操作　245
实训3　使用HBase Java API查询并分析通话记录数据　246
【习题】　247

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　海外用户

	megBook.com.hk
Copyright © 2013 - 2026 （香港）大書城有限公司　 All Rights Reserved.