图书介绍

大规模图数据的分布式处理PDF|Epub|txt|kindle电子书版本网盘下载

大规模图数据的分布式处理
  • 谷峪,于戈,鲍玉斌著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302420729
  • 出版时间:2015
  • 标注页数:236页
  • 文件大小:84MB
  • 文件页数:250页
  • 主题词:分布式数据处理-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大规模图数据的分布式处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 大规模图数据处理:问题与挑战1

1.1 大图数据处理的背景1

1.2 图数据的表示2

1.3 传统的大图数据管理方法4

1.4 云计算环境处理大图数据的优势6

1.5 新型大图计算系统面临的挑战7

1.6 关键技术问题8

第2章 大图分布式处理的计算模型和执行机制11

2.1 大图分布式处理的基本计算框架11

2.1.1 基于MapReduce的计算框架11

2.1.2 基于BSP的计算框架与GAS模型14

2.1.3 MapReduce与BSP对比16

2.1.4 其他处理框架17

2.2 图查询处理的遍历模式19

2.2.1 以顶点为中心19

2.2.2 以子图为中心19

2.2.3 以边和路径为中心19

2.3 消息通信20

2.3.1 消息发送时序控制20

2.3.2 消息交换模式20

2.3.3 网络通信平台22

2.3.4 上层消息优化技术23

2.4 同步控制23

2.4.1 同步模式24

2.4.2 异步模式25

2.4.3 混合模式25

2.4.4 跨步模式26

2.5 容错管理26

2.5.1 故障恢复技术26

2.5.2 故障侦测技术30

2.6 任务调度30

2.7 可扩展性32

第3章 大图数据划分技术34

3.1 图数据划分技术综述34

3.1.1 离线划分算法35

3.1.2 在线划分算法36

3.1.3 动态划分算法38

3.2 大图划分定义41

3.2.1 处理流程和定义41

3.2.2 真实图的局部性分析42

3.3 OnFlyP划分算法44

3.3.1 Range划分44

3.3.2 OnFlyP划分45

3.3.3 负载均衡控制机制47

3.3.4 计算接口描述49

3.3.5 动态调整机制51

3.4 性能评价52

3.5 小结55

第4章 大图数据分布式存储与索引技术56

4.1 大图数据的存储索引技术综述56

4.2 图迭代算法的状态转换模型60

4.3 大图的磁盘存储管理机制62

4.3.1 基于列存储模型的静态Hash索引策略62

4.3.2 基于状态转换的动态Hash索引策略66

4.4 基于消息有序的磁盘迭代71

4.4.1 消息有序迭代MSI71

4.4.2 OERSV数据模型72

4.4.3 两阶段计算过程74

4.5 性能评价75

4.6 小结77

第5章 大图数据分布式三角形查询技术78

5.1 大图三角形查询技术综述78

5.1.1 集中式算法79

5.1.2 分布式算法81

5.1.3 近似算法84

5.2 分布式大图三角形查询优化技术84

5.2.1 存储结构84

5.2.2 EN-Iterator算法86

5.2.3 消息优化87

5.3 基于采样的近似处理技术89

5.3.1 采样策略89

5.3.2 算法描述91

5.4 性能评价92

5.5 小结95

第6章 大图数据分布式最大k边连通子图查询技术96

6.1 大图最大k边连通子图查询技术综述96

6.2 分布式最大k边连通子图优化技术103

6.2.1 顶点优化103

6.2.2 剪枝策略104

6.2.3 消息优化106

6.3 基于采样的近似处理技术107

6.3.1 采样策略107

6.3.2 算法描述108

6.4 性能评价109

6.5 小结112

第7章 大图数据分布式最小生成树查询技术113

7.1 大图数据最小生成树综述113

7.2 顶点驱动的并行MST算法118

7.2.1 PB算法(分区Prim算法+Bor?vka算法)118

7.2.2 算法正确性119

7.2.3 双重索引120

7.2.4 终止条件121

7.2.5 索引维护122

7.3 基于并行处理模型的PB算法122

7.3.1 基于MapReduce模型的PB算法122

7.3.2 基于BSP模型的PB算法124

7.3.3 PB算法代价分析124

7.4 动态图的MST维护算法126

7.4.1 MST结果预处理126

7.4.2 删除边维护127

7.4.3 删除顶点维护129

7.4.4 维护代价129

7.5 性能评价130

7.6 小结132

第8章 大图数据分布式频繁子图挖掘技术133

8.1 图数据频繁子图挖掘技术综述133

8.1.1 图数据集中的频繁模式挖掘算法134

8.1.2 单个大图的频繁模式挖掘算法134

8.1.3 并行图频繁模式挖掘136

8.2 基于最大团频繁计数的频繁子图挖掘137

8.2.1 整体框架137

8.2.2 挖掘频繁1-子图140

8.2.3 候选子图产生141

8.2.4 频繁计数143

8.3 频繁子图挖掘分布式处理的优化146

8.4 基于AMNI频繁计数的子图挖掘149

8.5 频繁子图挖掘的BSP实现151

8.6 性能评价152

8.7 小结155

第9章 大图数据分布式重叠社区发现技术156

9.1 复杂网络重叠社区发现技术综述156

9.1.1 团渗透方法158

9.1.2 边图与边划分方法159

9.1.3 局部扩展最优化算法159

9.1.4 模糊检测法160

9.1.5 基于混合概率模型算法161

9.1.6 基于非负矩阵分解算法161

9.1.7 其他类型算法162

9.2 分布式并行极大团枚举162

9.2.1 问题描述163

9.2.2 极大团枚举方法164

9.2.3 极大团枚举方法优化166

9.2.4 并行极大团枚举方法169

9.2.5 复杂度分析172

9.3 复杂网络中并行重叠社区发现173

9.3.1 问题描述173

9.3.2 GCE基本算法174

9.3.3 GCE算法的优化175

9.3.4 GCE算法并行化177

9.4 性能评价183

9.5 小结185

第10章 大规模图数据分布式处理系统和应用186

10.1 基于MapReduce模型的大图处理系统186

10.1.1 PECASUS186

10.1.2 HaLoop187

10.1.3 Twister187

10.2 基于BSP模型的大图处理系统188

10.2.1 Pregel188

10.2.2 Hama188

10.2.3 Giraph189

10.2.4 Giraph++190

10.2.5 GPS191

10.2.6 X-Pregel191

10.2.7 Pregelix192

10.2.8 MOCgraph192

10.2.9 Kylin193

10.3 其他代表性系统193

10.3.1 PowerGraph193

10.3.2 Trinity194

10.3.3 GBase194

10.3.4 Spark(GraphX)195

10.3.5 GraphLab195

10.3.6 Chronos196

10.3.7 LFGraph196

10.3.8 GraphChi、X-Stream和TurboGraph197

10.4 BC-BSP系统介绍200

10.4.1 体系结构概况200

10.4.2 图处理作业的执行流程201

10.4.3 PageRank算法示例203

10.5 大规模图数据分布式处理的应用207

10.5.1 Web应用207

10.5.2 社会网络应用210

10.5.3 生物和化学领域应用215

参考文献220

热门推荐