登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書

『簡體書』Hadoop技术与应用(21世纪技能创新型人才培养系列教材·大数据系列;“十四五”新工科应用型教材建设项目成果)

書城自編碼: 3887117
分類:簡體書→大陸圖書→教材高职高专教材
作者: 徐鲁辉
國際書號(ISBN): 9787300316789
出版社: 中国人民大学出版社
出版日期: 2023-06-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 56.4

我要買

share:

** 我創建的書架 **
未登入.


新書推薦:
在虚无时代:与马克斯·韦伯共同思考
《 在虚无时代:与马克斯·韦伯共同思考 》

售價:HK$ 57.2
斯大林格勒:为了正义的事业(格罗斯曼“战争二部曲”的第一部,《生活与命运》前传)
《 斯大林格勒:为了正义的事业(格罗斯曼“战争二部曲”的第一部,《生活与命运》前传) 》

售價:HK$ 184.8
日内交易与波段交易的资金风险管理
《 日内交易与波段交易的资金风险管理 》

售價:HK$ 85.8
自然信息图:一目了然的万物奇观
《 自然信息图:一目了然的万物奇观 》

售價:HK$ 140.8
经纬度丛书·州县之民:治乱之间的小民命运
《 经纬度丛书·州县之民:治乱之间的小民命运 》

售價:HK$ 96.8
女性史:古代卷(真正意义上的女性大历史)
《 女性史:古代卷(真正意义上的女性大历史) 》

售價:HK$ 123.2
你当我好骗吗?
《 你当我好骗吗? 》

售價:HK$ 120.9
跨代伴侣治疗
《 跨代伴侣治疗 》

售價:HK$ 96.8

 

建議一齊購買:

+

HK$ 48.3
《幼儿园探究式学习项目课程》
+

HK$ 79.4
《建筑施工技术(第2版)(高职高专土木与建筑规划教材)》
+

HK$ 51.8
《养牛生产技术》
+

HK$ 56.4
《中外学前教育史(第四版)》
+

HK$ 42.6
《中医基础理论学习指导与习题集(第3版/高职基础课配教)》
+

HK$ 40.3
《新媒体文案写作教程(21世纪技能创新型人才培养系列教材·新媒》
內容簡介:
本书主要介绍了Hadoop、HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop、Flume、Kafka的功能、特点,以及体系架构、数据类型、运行环境等内容,相关内容均配有项目实战内容,供读者深入了解应用。本书在每个项目开篇处均设有【职业素养】栏目,帮助学生深刻理解数据技术是未来技术的理念,充分认识实施国家大数据战略的重要意义,树立学好大数据技术、成为数据新人才的目标,培养学生服务社会的责任感和报效祖国的使命感。
關於作者:
徐鲁辉,副教授,西京学院信息工程学院数据科学与大数据技术专业负责人、教研室主任,目前主讲课程包括《Python语言程序设计》《大数据技术原理及应用》等。主编教材《Hadoop大数据原理与应用》《Hadoop大数据原理与应用实验教程》等。先后参与国家自然科学基金项目1项、省厅级项目7项、校级科研项目4项,主持校级教改项目1项、参与校级教改项目2项;公开发表教研论文和学术论文8篇;获得软件著作权1项;主持获得省级教学成果奖一等奖1项、三等奖1项,参与获得校级教学成果奖特等奖1项。
目錄
项目1部署全分布模式Hadoop 集群
1.1 初识Hadoop
1.2 Hadoop 生态系统
1.3 Hadoop 体系架构
1.4 Hadoop 部署要点
1.5 项目实训 部署全分布模式Hadoop 集群
1.6 习题与实践
项目2HDFS 实战
2.1 初识HDFS
2.2 HDFS 体系架构
2.3 HDFS 文件存储原理
2.4 HDFS 数据读写
2.5 HDFS 接口
2.6 项目实训 HDFS 实战
2.7 习题与实践
项目3MapReduce 编程
3.1 初识MapReduce
3.2 MapReduce 作业执行流程
3.3 MapReduce 入门案例WordCount 剖析
3.4 MapReduce 数据类型
3.5 MapReduce 接口
3.6 项目实训 MapReduce 编程
3.7 习题与实践
项目4YARN 实战
4.1 初识YARN
4.2 YARN 体系架构
4.3 YARN 工作流程
4.4 YARN 接口
4.5 项目实训 YARN 实战
4.6 习题与实践
项目5部署ZooKeeper 集群和ZooKeeper 实战
5.1 初识ZooKeeper
5.2 ZooKeeper 工作原理
5.3 ZooKeeper 数据模型
5.4 ZooKeeper 部署要点
5.5 ZooKeeper 接口
5.6 项目实训 部署ZooKeeper 集群和ZooKeeper 实战
5.7 习题与实践
项目6部署全分布模式HBase 集群和HBase 实战
6.1 初识HBase
6.2 HBase 数据模型
6.3 HBase 体系架构
6.4 HBase 部署要点
6.5 HBase 接口
6.6 项目实训 部署全分布模式HBase 集群和HBase 实战
6.7 习题与实践
项目7部署本地模式Hive 和Hive 实战
7.1 初识Hive
7.2 Hive 体系架构
7.3 Hive 数据类型
7.4 Hive 数据模型
7.5 Hive 函数
7.6 Hive 部署要点
7.7 Hive 接口
7.8 项目实训 部署本地模式Hive 和Hive 实战
7.9 习题与实践
项目8Sqoop 实战
8.1 初识Sqoop
8.2 Sqoop 体系架构
8.3 Sqoop 部署要点
8.4 Sqoop 接口
8.5 项目实训 部署Sqoop 和Sqoop 实战
8.6 习题与实践
项目9Flume 实战
9.1 初识Flume
9.2 Flume 体系架构
9.3 Flume 部署要点
9.4 Flume Shell 常用命令
9.5 项目实训 部署单机模式Flume 和Flume 实战
9.6 习题与实践
项目10Kafka 实战
10.1 初识Kafka
10.2 Kafka 体系架构
10.3 Kafka 部署要点
10.4 Kafka Shell 常用命令
10.5 项目实训 部署Kafka 集群和Kafka 实战
10.6 习题与实践
內容試閱
项目1 部署全分布模式Hadoop 集群
项目导读
本项目简要介绍了Hadoop 的功能、起源和版本;详细介绍了Hadoop 的生态系统、体系架构、运行环境、运行模式及配置文件等基本原理和知识;最后在上述理论基础上引入项目实训,详细阐述了在Linux 操作系统下安装、配置、启动和验证全分布模式Hadoop 集群的实战过程。
学习目标
了解Hadoop 的功能、起源和版本。
理解Hadoop 的生态系统组成及各组件的作用。
理解Hadoop 的体系架构。
掌握Hadoop 的部署要点,包括运行环境、运行模式和主要配置文件等。
能够熟练地在Linux 环境下部署全分布模式Hadoop 集群。
职业素养
本项目通过引入Hadoop 的起源,让学生学习前辈们勇于攀登的科学精神、刻苦钻研的学习精神;通过部署Hadoop 集群的实训,解决部署过程中遇到的问题和困难,帮助学生养成锲而不舍、严谨求实的科学素养,培养学生善于发现问题、勇于解决问题的能力,提高学习内驱力,并内化为行为准则。
1.1初识Hadoop
Hadoop 是Apache 开源组织提供的一个分布式存储和计算的软件框架,它具有高可用、弹性可扩展的特点,非常适合处理海量数据。Apache Hadoop 于2008 年1 月成为Apache 顶级项目。
Hadoop 是由Apache Lucence 的创始人道格·卡丁(Doug Cutting)创建的,Lucence是一个应用广泛的文本搜索系统库。Hadoop 起源于开源的网络搜索引擎Apache Nutch,它本身是Lucence 项目的一部分。
第一代Hadoop(即Hadoop 1.0)的核心由分布式文件系统HDFS 和分布式计算框架MapReduce 组成。后来,为了克服Hadoop1.0 中HDFS 和MapReduce 的架构设计和应用性能方面的各种问题,设计者提出了第二代Hadoop(即Hadoop 2.0),Hadoop 2.0的核心包括分布式文件系统HDFS、统一资源管理和调度框架YARN、分布式计算框架MapReduce。HDFS 是谷歌文件系统GFS 的开源实现,是面向普通硬件环境的分布式文件系统,适用于大数据场景的数据存储,提供了高可靠、高扩展、高吞吐率的数据存储服务。MapReduce 是谷歌MapReduce 的开源实现,是一种简化的分布式应用程序开发的编程模型,允许开发人员在不了解分布式系统底层细节和缺少并行应用开发经验的情况下,能快速轻松地编写出分布式并行程序,并将其运行于计算机集群上,完成对大规模数据集的存储和计算。YARN 是将MapReduce 1.0 中JobTracker 的资源管理功能单独剥离出来而形成,它是一个纯粹的资源管理和调度框架,解决了Hadoop 1.0 中只能运行MapReduce 框架的限制,可在YARN 上运行各种不同类型的计算框架,包括MapReduce、Spark、Storm 等。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.