图书介绍

高性能计算的问题解决之道 Linux态势感知方法、实用工具及实践技巧PDF|Epub|txt|kindle电子书版本网盘下载

高性能计算的问题解决之道 Linux态势感知方法、实用工具及实践技巧
  • (美)伊戈尔·卢布希斯著;张文力译 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111589785
  • 出版时间:2018
  • 标注页数:253页
  • 文件大小:30MB
  • 文件页数:270页
  • 主题词:Linux操作系统-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

高性能计算的问题解决之道 Linux态势感知方法、实用工具及实践技巧PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

引言 数据中心与高端计算1

数据中心一览1

现代数据中心布局1

欢迎来到BORG,抵抗是徒劳的2

那就是力量2

企业与Linux2

经典的办公室2

Linux计算环境3

Linux云3

10000个1不等于100003

问题的非线性扩展3

大数定律4

同质化4

企业的当务之急4

7天24小时全天候开放5

任务危急5

停机时间等于金钱5

千里之堤溃于蚁穴5

参考文献5

第1章 你有问题吗6

问题的识别6

如果森林里有一棵树倒下,没人能听到6

一步一步地识别7

总是优先使用简单工具7

过多的知识导致误区9

问题的定义9

当前发生或可能的问题10

停机规模和严重性与业务需求11

已知与未知13

问题的再现13

你能隔离问题吗13

偶发性问题需要特殊处理14

计划如何控制混乱14

放手是最难的事15

因与果16

不要流连于症状16

先有鸡还是先有蛋16

严格控制环境改变,直到你理解了问题的本质18

如果改变,确保你知道预期结果是什么18

结论19

参考文献19

第2章 开始研究20

隔离问题20

推动从生产到测试20

重新运行获得结果所需的最小集21

忽略偏见信息,避免假设21

与健康系统和已知参考的比较22

那不是程序错误,而是一个特性22

将预期结果与正常系统作比较23

性能和行为的参考是必需的24

对变化的线性与非线性响应24

一次一个变量25

线性复杂度的问题25

非线性问题25

响应可能会延迟或掩盖25

Y到X而不是X到Y26

组件搜索26

结论26

第3章 基础研究27

刻画系统状态27

环境监控27

机器可访问性、响应性和正常运行时间27

本地和远程登录以及管理控制台29

喊狼来了的监控29

读取系统信息和日志30

使用ps和top30

系统日志36

进程记账39

检查命令执行的模式40

与问题表现相关41

避免快速的结论41

统计作为辅助41

vmstat41

iostat43

系统活动报告(SAR)47

结论49

参考文献50

第4章 深入探讨系统51

使用/proc51

层次52

每个进程的变量52

内核数据56

进程空间60

检查内核可调参数63

sys子系统63

内存管理64

文件系统管理65

网络管理65

SunRPC66

内核67

sysctl69

结论70

参考文献70

第5章 变身极客——跟踪和调试应用72

使用strace和ltrace72

strace72

ltrace86

结合两种工具获得最佳结果87

其他工具90

使用perf93

介绍93

为什么不用OProfile94

前提94

基本使用94

基础实例99

高级实例103

小结107

使用gdb107

介绍107

前提108

简单实例108

不那么简单的实例113

其他有用的命令122

结论124

参考文献124

第6章 极客进级——应用和内核核心、内核调试器126

收集应用核心126

如何转储应用核心127

收集内核核心(Kdump)132

Kdump服务概览133

Kdump配置137

测试配置143

Kdump网络转储功能145

Kdump使用146

小结147

崩溃分析(crash)147

前提147

运行crash148

内核崩溃核心分析156

超级极客技能:C代码分析167

小例子168

中级例子172

困难的例子176

内核崩溃的bug报告182

崩溃分析结果184

内核bug与硬件错误185

小结186

内核调试器186

内核编译186

进入调试器187

基本命令187

小结189

结论189

参考文献189

第7章 问题的解决方案191

如何处理收集到的数据191

文档191

数据的杂乱193

最佳实践195

搜索引擎、邮件列表以及供应商支持202

找到根本原因203

消除问题204

实现和跟踪206

结论207

参考文献208

第8章 监控和预防209

监控什么数据209

过多的数据比没有数据更糟209

Y到X将定义你所需要的监控210

不要害怕改变210

如何监控和分析趋势211

设置你关心的监控211

监控不等于报告212

不监控随机指标212

定义数学趋势213

如何应对趋势215

当它来得太晚216

内务管理217

预防是解决问题的关键217

配置审核218

为什么审核有用218

控制环境的变化219

安全方面219

系统数据收集工具219

定制工具220

商业支持220

结论221

参考文献221

第9章 让你的环境更安全、更健壮222

版本控制222

为什么需要版本控制222

Subversion、 Git及相关软件223

简单回滚223

配置管理223

变懒:自动化224

大环境下的熵225

掌控混乱225

配置管理软件225

环境中引入变化的正确方法226

一次一个变化226

不要急着冲到截止时间227

理解影响228

没报告问题意味着什么都没有228

连锁反应228

结论229

参考文献229

第10章 微调系统性能230

日志大小与日志轮转230

系统日志会一直增长230

慢点,倒带232

确定消息的内容232

文件系统调优234

Ext3/4文件系统234

XFS文件系统235

sysfs文件系统236

层次236

block子系统237

FS子系统237

内核子系统237

模块子系统238

结合proc和sys238

内存管理实例238

CPU调度实例238

网络优化实例241

结论243

参考文献243

第11章 整合所有的部分245

自上而下的方法245

保持简单:从简单开始245

首先理解环境245

它就像洋葱:分层而且会使你流泪246

“自我消失”的问题会重现,且扩大影响246

没有捷径:努力是金科玉律246

使用的方法学247

文档247

一种清晰的方法247

Y到X应该是座右铭247

统计工程不受重视248

数学是强大的,但没人用248

使用的工具248

使用的工具概述248

所选工具的优缺点249

从简单到复杂249

不要过多涉猎:知识是你的敌人249

逐步进阶的方法249

不要害怕退步250

有时你只需要缓解问题250

操作约束250

钱,钱,钱250

你的客户永远无法忍受停机250

你将不得不妥协251

聪明的做法251

分享就是关怀251

请教别人:他们以前碰到过类似问题252

工作安全根本没有安全可言252

授人以鱼或者授人以渔253

只有你知道什么对你而言是最好的253

结论253

热门推荐