图书介绍

大规模分布式内容检索技术PDF|Epub|txt|kindle电子书版本网盘下载

大规模分布式内容检索技术
  • 陈汉华,金海著 著
  • 出版社: 北京:科学出版社
  • ISBN:9787030314178
  • 出版时间:2011
  • 标注页数:295页
  • 文件大小:30MB
  • 文件页数:308页
  • 主题词:机器检索:情报检索

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大规模分布式内容检索技术PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1对等网络概述1

1.2基于对等模式的大规模分布式文本内容检索5

1.3大规模分布式文本内容检索研究面临的挑战6

1.4大规模分布式文本内容检索技术分类7

1.4.1基于结构化分布式哈希表的分布式全局倒排索引7

1.4.2基于非结构化对等网络的联邦式搜索网络9

1.4.3混合对等网络搜索引擎11

1.5本书内容12

参考文献15

第2章 分布式哈希表及单关键字全局索引20

2.1分布式哈希表21

2.1.1 Chord:基于二分查找的环状对等结构24

2.1.2 CAN:基于多维空间划分的对等结构28

2.1.3 Pastry:基于多分查找的前缀匹配对等结构34

2.1.4 Tapestry:基于多分查找的对等结构40

2.2现有分布式哈希表算法的比较45

2.3利用分布式哈希表构建单关键字全局索引46

2.3.1 eSearch:基于分布式哈希表的水平索引47

2.3.2 Minerva:在查询中挖掘关联关键字48

2.3.3局限性52

参考文献53

第3章 布隆滤波54

3.1哈希编码的时间/空间权衡54

3.1.1一种经典的哈希编码方法55

3.1.2两种存在误判率的哈希编码方法56

3.1.3计算因子56

3.1.4三种哈希编码方法的数学分析58

3.1.5时空性能比较61

3.2布隆滤波的基本理论62

3.2.1布隆滤波概念62

3.2.2位向量长度的下界64

3.2.3布隆滤波与集合运算65

3.3布隆滤波的扩展形式66

3.3.1计数布隆滤波66

3.3.2压缩布隆滤波71

3.3.3动态布隆滤波74

3.4布隆滤波的应用87

3.4.1早期应用87

3.4.2分布式缓存88

3.4.3 P2P网络88

3.4.4资源路由89

3.4.5数据包路由90

3.4.6基础设施测量91

参考文献91

第4章 基于分布式哈希表单关键字索引的搜索94

4.1结构化对等网多关键字检索面临的挑战94

4.2 Top-k查询策略95

4.2.1倒排索引95

4.2.2 Top- k裁剪算法97

4.2.3性能评估102

4.3 PWEB系统104

4.3.1 PWEB网络结构105

4.3.2多关键字搜索通信开销优化策略106

4.3.3扩展性算法112

4.3.4分布式交集运算执行顺序优化策略114

4.3.5搜集关键字全局统计信息115

4.3.6模拟仿真方法117

4.3.7性能评估121

4.4小结132

参考文献132

第5章 多关键字全局索引及搜索135

5.1分布式关键字集索引面临的挑战135

5.2文本检索中的关键字权重方法136

5.2.1关键字权重模型TF × IDF136

5.2.2理解逆文档频率140

5.2.3用逆向总关键字频率替换逆文档频率的尝试144

5.2.4词频在相关权重模型中的探索144

5.3 HDK:基于高区分关键字集的索引技术146

5.3.1关键字集倒排索引147

5.3.2高区分关键字集索引147

5.3.3基于高区分关键字集索引的搜索148

5.3.4扩展性分析148

5.3.5性能评估150

5.4 TSS:基于关键字集索引的P2P搜索系统153

5.4.1 TSS系统结构153

5.4.2分布式关键字集索引155

5.4.3模拟测试方法159

5.4.4性能评估161

参考文献167

第6章 基于复制的联邦式对等搜索策略169

6.1理论分析169

6.1.1模型建立170

6.1.2均匀复制策略和比例复制策略170

6.1.3平方根复制策略171

6.1.4混合复制策略173

6.1.5分布式复制算法的实现174

6.2基于随机游走的随机复制策略176

6.2.1生日悖论和理论下界177

6.2.2随机游走复制策略和搜索协议179

6.2.3性能评估183

6.3 BubbleStorm:基于随机多图的概率穷尽搜索策略187

6.3.1副本数量的确定188

6.3.2网络大小的测量188

6.3.3随机多图与随机采样189

6.3.4洪泛和随机游走的完美结合189

6.3.5系统分析190

6.3.6性能评估191

6.4 BloomCast:基于轻量级分布式哈希表的随机采样194

6.4.1 BloomCast网络结构194

6.4.2网络结点数量估计195

6.4.3随机结点采样197

6.4.4基于布隆滤波的复制算法198

6.4.5多关键字搜索198

6.4.6性能评估199

6.5 PlanetP:基于全局摘要索引的复制策略205

6.5.1全局目录索引复制206

6.5.2结点排序模型207

6.5.3查询处理算法208

6.5.4性能评估208

参考文献211

第7章 基于内容路由的联邦式搜索策略213

7.1基于语言模型的路由选择213

7.1.1联邦式搜索引擎的两层结构213

7.1.2语言模型214

7.1.3相对熵216

7.1.4搜索算法216

7.1.5性能评估219

7.2基于语义小世界模型的联邦式对等搜索221

7.2.1语义空间和向量221

7.2.2构造语义小世界223

7.2.3降低语义小世界的维度224

7.2.4基于语义小世界的搜索226

7.2.5性能评估226

7.3基于兴趣局部性的路由229

7.3.1兴趣局部性229

7.3.2基于兴趣局部性的拓扑和路由229

7.3.3性能评估230

7.4 SemreX系统232

7.4.1 SemreX系统模型232

7.4.2语义覆盖网236

7.4.3基于语义覆盖网的查询搜索算法243

7.4.4性能评估246

参考文献252

第8章 混合式对等搜索策略254

8.1混合对等搜索面临的挑战254

8.2基于预先探测的混合策略256

8.2.1 Boon Thau Loo的Gnutella实验256

8.2.2 SimpleHybrid混合P2P搜索策略260

8.2.3性能评估261

8.3基于Gossip的混合搜索选择262

8.3.1收集全局统计信息262

8.3.2使用全局信息进行搜索选择264

8.3.3洪泛阈值的调节264

8.3.4性能评估265

8.4难度感知的混合式搜索策略268

8.4.1很多复本≠很多结点268

8.4.2 QRank设计269

8.4.3用QRank进行混合查询273

8.4.4自适应混合查询274

8.4.5 QRank仿真器设计275

8.4.6性能评估276

参考文献285

第9章 大规模在线社会网络搜索287

9.1大规模在线社会网络搜索面临的挑战287

9.2在线社会网络系统研究现状288

9.3流行在线社会网络的数据划分与定位289

9.4大规模在线社会网络内容搜索关键技术290

9.4.1流式文本摘要技术291

9.4.2基于摘要索引的排序算法292

9.4.3多跳邻居摘要聚合技术292

9.4.4基于社区局部性降低摘要索引开销293

参考文献294

热门推荐