图书介绍
GPU高性能运算之CUDAPDF|Epub|txt|kindle电子书版本网盘下载
![GPU高性能运算之CUDA](https://www.shukui.net/cover/33/34998001.jpg)
- 张舒,禇艳利主编 著
- 出版社: 水利水电出版社
- ISBN:9787508465432
- 出版时间:2009
- 标注页数:276页
- 文件大小:84MB
- 文件页数:284页
- 主题词:图象处理-程序设计
PDF下载
下载说明
GPU高性能运算之CUDAPDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 GPU通用计算1
1.1 多核计算的发展2
1.1.1 CPU多核并行3
1.1.2 超级计算机、集群与分布式计算4
1.1.3 CPU+GPU异构并行5
1.2 GPU发展简介8
1.2.1 GPU渲染流水线8
1.2.2 着色器模型10
1.2.3 NVIDIA GPU发展简介11
1.3 从GPGPU到CUDA12
1.3.1 传统GPGPU开发12
1.3.2 CUDA开发13
第2章 CUDA基础14
2.1 CUDA编程模型14
2.1.1 主机与设备14
2.1.2 Kernel函数的定义与调用15
2.1.3 线程结构16
2.1.4 硬件映射20
2.1.5 deviceQuery示例22
2.1.6 matrixAssign示例26
2.2 CUDA软件体系36
2.2.1 CUDAC语言37
2.2.2 nvcc编译器37
2.2.3 运行时API与驱动API39
2.2.4 CUDA函数库43
2.3 CUDA存储器模型44
2.3.1 寄存器45
2.3.2 局部存储器45
2.3.3 共享存储器46
2.3.4 全局存储器47
2.3.5 主机端内存52
2.3.6 主机端页锁定内存52
2.3.7 常数存储器57
2.3.8 纹理存储器58
2.4 CUDA通信机制68
2.4.1 同步函数68
2.4.2 Volatile关键字72
2.4.3 ATOM操作72
2.4.4 VOTE操作76
2.5 异步并行执行76
2.5.1 流79
2.5.2 事件81
2.6 CUDA图形学API互操作87
2.6.1 CUDA与OpenGL的互操作87
2.6.2 CUDA与Direct3D 操作91
2.7 多设备与设备集群102
2.7.1 CUDA设备控制102
2.7.2 CUDA与openMP114
2.7.3 CUDA与集群117
第3章 CUDA硬件架构120
3.1 NVIDIA显卡构造简介120
3.1.1 图形显卡概览120
3.1.2 PCI-E总线121
3.1.3 显存122
3.1.4 GPU芯片123
3.2 Tesla图形与计算架构124
3.2.1 SPA-TPC-SM126
3.2.2 主流GPU架构129
3.3 Tesla通用计算模型131
3.3.1 数据与指令的加载131
3.3.2 warp指令的发射与执行133
3.3.3 纹理、渲染和存储器流水线137
第4章 CUDA程序的优化141
4.1 CUDA程序优化概述141
4.2 测量程序运行时间144
4.2.1 设备端测时144
4.2.2 主机端测时148
4.3 任务划分148
4.3.1 任务划分原则148
4.3.2 grid和block维度设计150
4.4 存储器访问优化152
4.4.1 主机—设备通信优化152
4.4.2 全局存储器访问优化155
4.4.3 共享存储器访问优化160
4.4.4 使用纹理存储器和常数存储器加速163
4.5 指令流优化163
4.5.1 算术指令164
4.5.2 控制流指令166
4.5.3 访存指令166
4.5.4 同步指令167
4.6 CUDA profiler的使用167
4.6.1 图形分析167
4.6.2 图表分析167
4.7 优化应用举例169
4.7.1 矩阵乘法的优化169
4.7.2 并行归约的优化176
4.7.3 矩阵转置的优化184
第5章 综合应用190
5.1 基本应用190
5.1.1 双调排序网络190
5.1.2 Scan197
5.1.3 CUBLAS简单应用206
5.1.4 CUFFT简单应用211
5.2 高级应用217
5.2.1 共轭梯度法的CUBLAS实现217
5.2.2 AC多模式匹配算法的CUDA实现227
附录A 安装、配置、编译及调试237
附录B 常见问题与解答247
附录C 技术规范249
附录D C扩展253
附录E 数学函数263
附录F 纹理拾取272
附录G 着色器模型275