图书介绍
普通高等教育新工科人才培养规划教材 Hadoop大数据开发 大数据专业PDF|Epub|txt|kindle电子书版本网盘下载
![普通高等教育新工科人才培养规划教材 Hadoop大数据开发 大数据专业](https://www.shukui.net/cover/15/31361447.jpg)
- 刘春阳,张学龙,刘丽军主编;陈勇,陈艳男,蒋中洲,王宇希副主编 著
- 出版社: 北京:中国水利水电出版社
- ISBN:9787517069034
- 出版时间:2018
- 标注页数:176页
- 文件大小:31MB
- 文件页数:183页
- 主题词:数据处理软件-高等学校-教材
PDF下载
下载说明
普通高等教育新工科人才培养规划教材 Hadoop大数据开发 大数据专业PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 大数据概论1
1.1 大数据概述1
1.1.1 大数据产生的时代背景1
1.1.2 大数据的特征2
1.1.3 大数据应用案例2
1.1.4.大数据的机遇与挑战5
1.2 大数据处理技术5
1.3 大数据与云计算6
1.4 本章小结7
第2章 大数据处理平台Hadoop8
2.1 Hadoop生态系统8
2.2 Hadoop架构11
2 2.1 HDFS12
2.2.2 MapReduce12
2.2.3 Yarn13
2.3 Hadoop版本变迁13
2.3.1 Hadoop发展史13
2.3.2 如何选择Hadoop开发版本14
2.4 本章小结14
第3章 Hadoop平台搭建15
3.1 基础环境配置15
3.2 Hadoop配置文件修改15
3.3 Hadoop平台运行及验证22
3.4 本章小结23
第4章 分布式文件系统HDFS24
4.1 HDFS架构24
4.1.1 HDFS的基本框架24
4.1.2 HDFS的特点26
4.2 HDFS的工作机制27
4.2.1 HDFS读写过程分析27
4.2.2 NameNode的工作机制29
4.2.3 元数据的CheckPoint32
4.2.4 DataNode的工作机制33
4.3 HDFS shell命令34
4.3.1 帮助相关命令35
4.3.2 查看相关命令36
4.3.3 文件及目录相关命令37
4.3.4 统计相关命令46
4.3.5 快照命令47
4.4 本章小结48
第5章 HDFS Java API编程49
5.1 远程开发环境搭建49
5.2 HDFS Java API接口53
5.3 HDFS Java API编程53
5.3.1 获取文件系统55
5.3.2 列出所有DataNode的名字信息56
5.3.3 创建文件目录57
5.3.4 删除文件或文件目录58
5.3.5 查看文件是否存在59
5.3.6 文件上传至HDFS59
5.3.7 从HDFS下载文件60
5.3.8 文件重命名61
5.3.9 遍历目录和文件62
5.3.10 根据filter获取目录下的文件63
5.3.11 取得数据块所在的位置65
5.4 程序打包66
5.5 本章小结68
第6章 并行计算MapReduce69
6.1 MapReduce编程模型69
6.1.1 并行编程模型概述69
6.1.2 并行计算编程模型70
6.1.3 MapReduce编程模型72
6.2 MapReduce工作原理73
6.3 Yarn75
6.3.1 Yarn基本框架与组件75
6.3.2 Yarn工作流程76
6.3.3 新旧Hadoop MapReduce框架对比77
6.4 MapReduce Shuffle性能调优79
6.5 本章小结80
第7章 MapReduce Java API编程81
7.1 MapReduce Java API接口讲解81
7.1.1 InputFormat接口82
7.1.2 Mapper类85
7.1.3 Partitioner类87
7.1.4 Combiner类88
7.1.5 Reducer类89
7.1.6 OutputFormat接口90
7.1.7 GenericOptionsParser类91
7.1.8 DistributedCache类91
7.2 MapReduce Java API应用实例92
7.2.1 统计单词出现频率92
7.2.2 统计出现的单词96
7.2.3 统计平均成绩99
7.2.4 排序101
7.2.5 求年最高温度103
7.2.6 关系运算——投影运算106
7.2.7 关系运算——并运算108
7.2.8 关系运算——交运算110
7.2.9 关系运算——差运算111
7.2.10 关系运算——连接运算114
7.3 MapReduce Java API高级编程116
7.3.1 多输入路径方式116
7.3.2 使用Partitioner实现输出到多个文件119
7.3.3 自定义OutputFormat文件输出122
7.3.4 文本文件转化成XML文件127
7.3.5 通过MultipleOutputs完成多文件输出130
7.3.6 将MapReduce产生的结果集导入到MySQL中135
7.3.7 自定义比较器140
7.3.8 MapReduce分析明星微博数据145
7.3.9 MapReduce最佳成绩统计152
7.3.10 MapReduce链接作业158
7.3.11 利用Job嵌套求解二度人脉162
7.4 本章小结168
附录CentOS7安装169