《MapReduce设计模式》 - [美]Donald Miner Adam Shook 著 - 人民邮电出版社 - 香港大書城

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　運費計算　 \|　聯絡我們　 \|　幫助中心　\|　加入書簽
		會員登入新用戶登記

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

臺灣用戶

品種：超過100萬種各類書籍/音像和精品，正品正價，放心網購，悭钱省心

服務：香港／台灣／澳門／海外

送貨：速遞／郵局／服務站

新書上架：簡體書繁體書
暢銷書架：簡體書繁體書
好書推介：簡體書繁體書

『簡體書』MapReduce设计模式

書城自編碼： 2452282
分類：簡體書→大陸圖書→計算機/網絡→程序設計
作者： [美]Donald Miner Adam Shook 著
國際書號(ISBN)： 9787115360946
出版社：人民邮电出版社
出版日期： 2014-09-01
版次： 1 印次： 1
頁數/字數： 213/293
書度/開本： 16开釘裝：平装

售價：HK$ 127.4

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《漫画中小学生体育运动》
售價：HK$ 54.8

《扁鹊（秦越人）医学全书 ; 华佗医学全书》
售價：HK$ 46.2

《手绘鱼图典藏》
售價：HK$ 198.0

《透过地图看欧洲格局：从拿破仑时代到冷战时期》
售價：HK$ 118.8

《柳岸居藏日本画》
售價：HK$ 184.8

《中国古代科技遗产》
售價：HK$ 217.8

《历史深处的南丝路一部关于南丝路的纪实性文学作品》
售價：HK$ 86.9

《中国航天立体翻翻书》
售價：HK$ 63.8

建議一齊購買：

HK$ 243.6
《深度学习》

HK$ 114.6
《大数据之路：阿里巴巴大数据实践》

HK$ 214.6
《Hadoop权威指南：大数据的存储与分析（第4版）》

HK$ 129.1
《Hadoop构建数据仓库实践》

HK$ 192.0
《数据算法：Hadoop/Spark大数据处理技巧》

HK$ 162.0
《Hadoop 2.X HDFS源码剖析》

編輯推薦：

到目前为止，基于MapReduce框架的设计模式散见于各种研究论文、博客和书籍中。这本书将各种有价值的MapReduce设计模式汇集在一起，形成一本独特的合集，可以帮读者节省大量的时间和精力，无论读者身处哪个领域，使用哪种编程语言，使用什么开发框架。
书中对每一种模式都会详细解释其使用的上下文、可能存在的陷阱及使用的注意事项，以帮助读者在对大数据问题架构建模时避免常见的设计错误。本书还提供了MapReduce的一个完整综述，解释其起源和实现，并说明设计模式如此重要的原因。书中的所有示例代码都是基于Hadoop平台编写的。

內容簡介：

MapReduce作为一种分布式海量数据处理的编程框架，已经得到业界的广泛关注。随着Hadoop的普及，MapReduce目前已经成为海量数据处理的最基础但也是最重要的方法之一。
《MapReduce设计模式》是一本关于设计模式的书，为读者提供解决问题的模板或通用指南。书中主要介绍编程模式，即如何利用MapReduce框架解决一类问题，重在提供解决问题的方法和思路。作者花大量篇幅介绍各种模式的原理及实现机制，并给出相应的应用实例，让读者对每种模式能有更直观的理解。
由于本书不会过多涉及底层框架及MapReduce API，所以希望读者阅读《MapReduce设计模式》之前，能够对Hadoop系统有所了解，知道如何编写MapReduce程序，并了解MapReduce程序框架的工作原理。《MapReduce设计模式》面向中高级MapReduce开发者，涵盖了绝大部分MapReduce编程可能面对的场景，相信初学者和专家同样可以在本书中得到一些启示。

關於作者：

Donald Miner目前是EMC Greenplum的解决方案架构师，为实现与使用基于Greenplum的大数据系统的用户提供咨询和帮助。在加入Greenplum之前，Miner博士作为承包商为美国政府部署和构建了多个规模巨大且涉及关键任务的Hadoop集群。他还参与了教学，在马里兰大学巴尔的摩分校（UMBC）讲授Hadoop方面的业界前沿相关的课程以及各种人工智能课程。Miner博士在UMBC获得了计算机科学的博士学位，读博士期间他的研究主题为机器学习，博士论文的主题是多智能体系统。
Adam Shook是ClearEdge IT Solutions公司的软件工程师，从事一些大数据技术工作，如Hadoop、Accumulo、Pig以及ZooKeeper。Shook在马里兰大学巴尔的摩分校（UMBC）获得了计算机科学的学士学位，并得到了一份为游戏工作室构建一个全新的高性能图像引擎的工作。为了寻求新的挑战，他在UMBC就读研究生，主要专注的研究方向是分布式计算的相关技术。他很快找到了一份开发工作，作为美国政府承包商，从事大规模的Hadoop部署。Shook参与了Hadoop和Pig的开发及培训课程的指导。在繁忙工作的间隙他喜欢参与相关项目，玩视频游戏。

目　录
第1章　设计模式与MapReduce　1
1.1　设计模式　2
1.2　MapReduce简史　3
1.3　MapReduce和Hadoop简介　4
1.4　Hadoop示例：单词计数　6
1.5　Pig和Hive　10
第2章　概要模式　12
2.1　数值概要　12
2.1.1　模式描述　12
2.1.2　数值概要示例　16
2.2　倒排索引概要　30
2.2.1　模式描述　30
2.2.2　倒排索引示例　32
2.3　计数器计数　34
2.3.1　模式描述　34
2.3.2　计数器计数示例　36
第3章　过滤模式　39
3.1　过滤　40
3.1.1　模式描述　40
3.1.2　过滤示例　43
3.2　布隆过滤　45
3.2.1　模式描述　45
3.2.2　布隆过滤器示例　48
3.3　Top 10　53
3.3.1　模式描述　53
3.3.2　Top 10示例　58
3.4　去重　60
3.4.1　模式描述　60
3.4.2　去重示例　63
第4章　数据组织模式　65
4.1　分层结构　65
4.1.1　模式描述　65
4.1.2　分层结构示例　69
4.2　分区　76
4.2.1　模式描述　76
4.2.2　分区示例　79
4.3　分箱　81
4.3.1　模式描述　81
4.3.2　分箱示例　83
4.4　全排序　85
4.4.1　模式描述　85
4.4.2　全排序示例　88
4.5　混排　92
4.5.1　模式描述　92
4.5.2　混排示例　93
第5章　连接模式　96
5.1　连接简介　97
5.2　reduce端连接　102
5.2.1　模式描述　102
5.2.2　reduce端连接示例　104
5.2.3　使用布隆过滤器的reduce端连接　110
5.3　复制连接　112
5.3.1　模式描述　112
5.3.2　复制连接示例　114
5.4　组合连接　116
5.4.1　模式描述　116
5.4.2　组合连接示例　119
5.5　笛卡儿积　121
5.5.1　模式描述　121
5.5.2　笛卡儿积示例　124
第6章　元模式　131
6.1　作业链　131
6.1.1　关于驱动程序　132
6.1.2　作业链示例　133
6.1.3　关于shell脚本　142
6.1.4　关于JobControl　145
6.2　链折叠　149
6.2.1　ChainMapper方法和ChainReducer方法　153
6.2.2　链折叠示例　153
6.3　作业归并　158
作业归并示例　160
第7章　输入和输出模式　166
7.1　在Hadoop中自定义输入和输出　166
7.1.1　InputFormat　167
7.1.2　RecordReader　168
7.1.3　OutputFormat　169
7.1.4　RecordWriter　170
7.2　生成数据　170
7.2.1　模式描述　170
7.2.2　生成数据示例　172
7.3　外部源输出　177
7.3.1　模式描述　177
7.3.2　外部源输出示例　179
7.4　外部源输入　183
7.4.1　模型描述　183
7.4.2　外部源输入示例　185
7.5　分区裁剪　190
7.5.1　模式描述　190
7.5.2　分区裁剪示例　192
第8章　最后的思考与设计模式的未来　203
8.1　数据的本质趋势　203
8.1.1　图像、音频和视频　203
8.1.2　流式数据　204
8.2　YARN的影响　204
8.3　作为库或者组件的模式　205
8.4　读者可以帮到什么　205
附录　布隆过滤器　207

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　海外用户

	megBook.com.hk
Copyright © 2013 - 2025 （香港）大書城有限公司　 All Rights Reserved.