大小:487K
更新时间:23-09-05
系统:Pc
版本:v
opencl是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码。
本次小编将给大家带来opencl编程指南,它是由OpenCL核心设计人员亲自执笔,不仅全面而深刻地解读了OpenCL规范和编程模型,而且通过大量案例和代码演示了基于OpenCL编写并行程序和实现各种并行算法的原理、方法、流程和最佳实践,以及如何对OpenCL进行性能优化,如何对硬件进行探测和调整。
第一部分 OpenCL 1.1语言与API
第1章 OpenCL介绍2
1.1 什么是OpenCL,或者为什么需要这本书2
1.2 多核的未来:异构平台2
1.3 多核世界中的软件4
1.4 OpenCL的概念基础7
1.4.1 平台模型7
1.4.2 执行模型8
1.4.3 内存模型13
1.4.4 编程模型15
1.5 OpenCL与图形18
1.6 OpenCL的内容19
1.6.1 平台API19
1.6.2 运行时API20
1.6.3 内核编程语言20
1.6.4 OpenCL小结22
1.7 嵌入式简档22
1.8 学习OpenCL23
第2章 HelloWorld:一个OpenCL例子24
2.1 构建示例24
2.1.1 必备条件25
2.1.2 Mac OS X与Code::Blocks25
2.1.3 Microsoft Windows与Visual Studio26
2.1.4 Linux与Eclipse28
2.2 HelloWorld示例29
2.2.1 选择OpenCL平台并创建一个上下文31
2.2.2 选择设备并创建命令队列33
2.2.3 创建和构建程序对象34
2.2.4 创建内核和内存对象36
2.2.5 执行内核37
2.3 检查OpenCL中的错误39
第3章 平台、上下文和设备41
3.1 OpenCL平台41
3.2 OpenCL设备44
3.3 OpenCL上下文53
第4章 OpenCL C编程64
4.1 使用OpenCL C编写数据并行内核64
4.2 标量数据类型65
4.3 矢量数据类型67
4.3.1 矢量字面量68
4.3.2 矢量分量69
4.4 其他数据类型71
4.5 衍生类型71
4.6 隐式类型转换72
4.7 显式强制类型转换76
4.8 显式转换77
4.9 将数据重新解释为另一种类型80
4.10 矢量操作符82
4.10.1 算术操作符83
4.10.2 关系和相等操作符84
4.10.3 位操作符85
4.10.4 逻辑操作符85
4.10.5 条件操作符86
4.10.6 移位操作符86
4.10.7 一元操作符87
4.10.8 赋值操作符88
4.11 限定符89
4.11.1 函数限定符89
4.11.2 内核属性限定符90
4.11.3 地址空间限定符91
4.11.4 访问限定符94
4.11.5 类型限定符95
4.12 关键字95
4.13 预处理器指令和宏96
4.13.1 pragma指令97
4.13.2 宏98
4.14 限制99
第5章 OpenCL C内置函数101
5.1 工作项函数101
5.2 数学函数103
5.2.1 浮点pragma107
5.2.2 浮点常量108
5.2.3 相对误差作为ulp108
5.3 整数函数111
5.4 公共函数113
5.5 几何函数115
5.6 关系函数116
5.7 矢量数据加载和存储函数119
5.8 同步函数124
5.9 异步复制和预取函数125
5.10 原子函数127
5.11 杂项矢量函数130
5.12 图像读、写函数131
5.12.1 读图像132
5.12.2 采样器134
5.12.3 确定边界颜色137
5.12.4 写图像137
5.12.5 查询图像信息138
第6章 程序与内核140
6.1 程序和内核对象概述140
6.2 程序对象140
6.2.1 创建和构建程序141
6.2.2 程序构建选项143
6.2.3 由二进制码创建程序145
6.2.4 管理和查询程序153
6.3 内核对象153
6.3.1 创建内核对象和设置内核参数153
6.3.2 线程安全性156
6.3.3 管理和查询内核157
第7章 缓冲区和子缓冲区159
7.1 内存对象、缓冲区和子缓冲区概述159
7.2 创建缓冲区和子缓冲区160
7.3 查询缓冲区和子缓冲区166
7.4 读、写和复制缓冲区和子缓冲区167
7.5 映射缓冲区和子缓冲区180
第8章 图像和采样器183
8.1 图像和采样器对象183
8.2 创建图像对象184
8.2.1 图像格式187
8.2.2 查询图像支持189
8.3 创建采样器对象189
8.4 处理图像的OpenCL C函数192
8.5 传输图像对象194
第9章 事件201
9.1 命令、队列和事件概述201
9.2 事件和命令队列202
9.3 事件对象206
9.4 宿主机上生成事件208
9.5 影响宿主机上执行的事件209
9.6 使用事件完成评测212
9.7 内核中的事件216
9.8 OpenCL外部的事件217
第10章 与OpenGL的互操作218
10.1 OpenCL/OpenGL共享概述218
10.2 查询OpenGL共享扩展218
10.3 初始化OpenCL上下文实现OpenGL互操作220
10.4 从OpenGL缓冲区创建OpenCL缓冲区221
10.5 由OpenGL纹理创建OpenCL图像对象225
10.6 查询OpenGL对象的信息226
10.7 OpenGL和OpenCL之间的同步227
第11章 与Direct3D的互操作230
11.1 Direct3D/OpenCL共享概述230
11.2 初始化OpenCL上下文实现Direct3D互操作230
11.3 从Direct3D缓冲区和纹理创建OpenCL内存对象233
11.4 OpenCL中获取和释放Direct3D对象236
11.5 OpenCL中处理Direct3D纹理237
11.6 OpenCL中处理D3D顶点数据240
第12章 C++包装器API242
12.1 C++包装器API概述242
12.2 C++包装器API异常244
12.3 使用C++包装器API的矢量相加示例246
2.3.1 选择OpenCL平台并创建一个上下文246
12.3.2 选择一个设备并创建命令队列246
12.3.3 创建和构建程序对象247
12.3.4 创建内核和内存对象248
12.3.5 执行矢量相加内核248
第13章 OpenCL嵌入式简档253
13.1 OpenCL简档概述253
13.2 64位整数254
13.3 图像255
13.4 内置原子函数256
13.5 强制最小单精度数浮点能力256
13.6 OpenCL C程序中确定设备支持的简档258
二部分 OpenCL 1.1案例研究
第14章 图像直方图260
14.1 计算图像直方图260
14.2 并行实现图像直方图261
14.3 对并行图像直方图的优化266
14.4 每个通道使用半浮点或浮点值计算直方图268
第15章 Sobel边界检测过滤器272
15.1 什么是Sobel边界检测过滤器272
15.2 实现Sobel过滤器作为OpenCL内核272
第16章 并行实现Dijkstra单源最短路径图算法276
16.1 图数据结构276
16.2 内核278
16.3 利用多个计算设备281
第17章 Bullet Physics SDK中的布模拟286
17.1 布模拟介绍286
17.2 模拟柔软物体288
17.3 CPU上执行模拟290
17.4 实现基本GPU执行所需要的修改291
17.5 两层分批296
17.6 SIMD计算和局部内存优化298
17.7 增加OpenGL互操作302
第18章 用快速傅里叶变换模拟海洋305
18.1 Ocean应用程序概述305
18.2 Phillips频谱生成308
18.3 OpenCL离散傅里叶变换311
18.3.1 确定2D分解311
18.3.2 使用局部内存312
18.3.3 确定子变换大小313
18.3.4 确定工作组大小314
18.3.5 得到旋转因子314
18.3.6 确定需要多少局部内存314
18.3.7 避免局部内存库冲突315
18.3.8 使用图像315
18.4 详细分析FFT内核315
18.5 详细分析转置内核318
第19章 光流320
19.1 光流问题概述320
19.2 用硬件线性插值提供亚像素精度328
19.3 纹理缓存的应用329
19.4 使用局部内存329
19.5 提前退出和硬件调度331
19.6 利用OpenGL互操作实现高效可视化331
19.7 性能332
第20章 用PyOpenCL使用OpenCL333
20.1 PyOpenCL介绍333
20.2 运行PyImageFilter2D示例333
20.3 PyImageFilter2D代码334
20.4 上下文和命令队列创建337
20.5 加载到图像对象338
20.6 创建和构建程序339
20.7 设置内核参数和执行内核340
20.8 读取结果340
第21章 使用OpenCL完成矩阵乘法342
21.1 基本矩阵乘法算法342
1.2 直接转换到OpenCL343
21.3 增加每个内核的工作量347
21.4 优化内存移动:局部内存350
21.5 性能结果和优化原来的CPU代码352
第22章 稀疏矩阵矢量乘法354
22.1 稀疏矩阵矢量乘法算法354
22.2 实现描述355
22.3 分块和分组稀疏矩阵表示357
22.4 首部结构359
22.5 分块分组稀疏矩阵设计考虑359
22.6 可选的组信息360
22.7 测试的硬件设备和结果360
22.8 其他优化领域372
附录A OpenCL 1.1小结373
同类热门
类似软件
OpenCloner UltraBox(DVD刻录软件)155.77M128人在用OpenCloner UltraBox是由OpenCloner官方出品的一款优秀的DVD刻录软件,软件拥有六个程序,包含的程序使您能够下载/捕获在线电影并将其转换为各种视频和音频格式,能够复制,翻录和刻录DVD/蓝光电影,为用户提供多方面的优质服务。同时
查看热门标签
网友评论0人参与,0条评论
最新排行
opencv图像处理编程实例29.2M朱伟pdf扫描版opencv图像处理编程实例是一本OpenCV图像处理编程手册,由朱伟等人编著。本书将理论与实际案例相结合,始终秉承“学以致用”的理念,提供多个颇具实用性和前沿性的实例,用详细的代码验证实现,通过大量的例子让读者边学边练,注重给予读者一定的启发和引导。作
查看oracle sql高级编程64.34M莫顿pdf扫描版 oracle sql高级编程是一本Oracle SQL高级编程手册,由资深Oracle专家莫顿、Kerry Osborne、Robyn Sands和Jared Still编著。本书内容丰富翔实,通过作者多年的软件开发和教学培训经验,与大家分享了掌握
查看oracle性能诊断艺术35.65Mpdf扫描版 oracle性能诊断艺术是一本Oracle数据库优化的里程碑式著作,由瑞士资深数据库专家Christian Antognini编著。书中的最佳实践和诸多建议全部来源于作者在实战一线的丰富积累,不仅简单实用,而且发人深省,堪称一座“宝库”,适合各层次
查看嵌入式C/C++系统工程师实训教程30.25M庄严 pdf扫描版嵌入式C/C++系统工程师实训教程是一本嵌入式C/C++学习书籍,由庄严,王骁和汤建敏三人共同编著。本书涵盖了嵌入式系统开发的必备知识,面向具体的系统开发工作内容,范例着重培训实际工作能力,读者在学完之后可以顺利成为合格的嵌入式系统开发工程师。全书分为基
查看云计算架构技术与实践(第2版)6.16M顾炯炯pdf扫描版云计算架构技术与实践(第2版)是一本云架构技术教材,由华为首席架构师顾炯炯编著。本书内容丰富翔实,主要讲解了云计算的存储、网络、数据、管理、接入、安全等内容,同时增加了云计算前言创新领域热点技术,分享了华为云计算核心竞争力构建与价值转化经验,以及介绍了公
查看Android高级进阶43.81MPDF顾浩鑫高清扫描版Android高级进阶是由顾浩鑫所编写,作者实战经验非常的丰富,先后任职过华为、百度、平安科技,本书分为8个部分进行阐述,分别是基础篇、系统架构篇、经验总结篇、新技术篇、性能优化篇、移动安全篇、工具篇、测试篇。内容十分丰富,书中通过简单的代码示例详尽地展
查看深入解析oracle.dba入门进阶与诊断案例88.47M盖国强pdf扫描版 深入解析oracle.dba入门进阶与诊断案例是一本Oracle数据库深度解析书籍,由盖国强编著。本书内容丰富翔实,从基础知识入手,再进行深入研究,结合性能调整、诊断案例实践,将Oracle知识全面、系统、深入地展现给读者。全书内容更涉及Oracl
查看spss其实很简单pdf36.66M高清扫描版spss其实很简单是由美国加利福尼亚大学教授罗纳德·D·约克奇所编著的一本专注于spss统计分析的指导用书。适用的领域非常的广泛,现在经济、财政、金融、营销、会计、管理及人文社会科学等领域都需要处理大量的信息。统计学能有效地处理各种信息问题,统计软件SP
查看写给大家看的c语言书(第2版)41.09M佩里pdf扫描版写给大家看的c语言书(第2版)是一部别开生面、与众不同的C语言经典入门著作,由美国计算机编程专家佩里编著。本书内容丰富,将C语言的基础知识、必备的实战技能和宝贵编程经验尽数道来。没有云山雾罩,没有前因后果的行话,没有艰深而且不必要的内部技术细节,没有沉闷
查看sql server 2005安装图解5.26Mpdf高清版 SQL Server 2005是目前网络上使用率最高的数据库,虽然高版本的sql能够带给用户带多新功能,但迁移数据库以及熟练操作也需要一段时间,故此SQL Server 2005还是非常有市场的,本站在这里提供sql server 2005安装图解
查看商铺租赁合同范本大全3.74Mword电子版对于有商铺需要出租或是需要租用的的人群,那么商铺租赁合同是必不可少的吧,为此小编就带来了商铺租赁合同范本大全,其中包含了标准版、详细版、通常版、简易实用版等多种不同版本的范本,并且无论是pdf格式,还是doc格式在这里全都有,从未可以很好的满足用户们的使
查看