-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

OpenACC并行編程實戰

( 簡體 字)
作者:何滄平類別:1. -> 程式設計 -> 綜合
譯者:
出版社:機械工業出版社OpenACC并行編程實戰 3dWoo書號: 45494
詢問書籍請說出此書號!

缺書
NT售價: 345

出版日:10/28/2016
頁數:265
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111549659
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

第1章介紹超級計算技術發展趨勢和并行編程概況,可以從中了解OpenACC的作用。沒有CUDAC基礎的讀者能夠掌握基本概念,便于深入理解OpenACC的并行化技術。第2章介紹OpenACC語言的設計思路。第3~4章是本書的核心,將計算部分并行化,并將數據傳遞時間減到少。至此讀者已經能夠編寫性能良好的OpenACC程序。第5~7章介紹高級并行技術,用于極致性能優化、與CUDAC/CUDAFortran和各類庫的混合編程。第8章給出OpenACC規定的所有運行時例程,不用細讀,用到時再參考。第9章指導部署開發環境,以便快速上手。
目錄:

Contents 目  錄

前言
第1章 并行編程概覽1
1.1 加速器產品1
1.1.1 英偉達GPU3
1.1.2 英特爾至強融核處理器9
1.2 并行編程語言12
1.3 CUDA C14
1.3.1 線程組織方式16
1.3.2 運行過程18
1.3.3 內存層級20
1.3.4 性能優化技術21
第2章 OpenACC概覽22
2.1 OpenACC規范的內容23
2.1.1 抽象加速器模型25
2.1.2 存儲模型25
2.1.3 計算執行模型26
2.2 OpenACC 2.5規范29
第3章 OpenACC計算構件36
3.1 條件編譯37
3.2 導語格式38
3.3 計算構件kernels40
3.3.1 構件內有1個循環41
3.3.2 構件內2個循環44
3.3.3 構件內二重嵌套循環45
3.3.4 kernels構件內三重嵌套循環48
3.4 loop構件52
3.4.1 independent子語53
3.4.2 reduction歸約子語57
3.4.3 不常用的子語64
3.5 計算構件parallel66
3.5.1 gang單獨模式68
3.5.2 gang分裂模式70
3.5.3 二重循環73
3.5.4 三重循環75
3.6 組合導語77
3.7 案例研究:Jacobi迭代78
3.7.1 CPU上并行化84
3.7.2 GPU上并行化88
3.8 原子操作:atomic導語91
第4章 數據管理97
4.1 數據屬性、數據區域和數據生存期99
4.2 計算構件的伴隨數據區域100
4.2.1 引用計數101
4.2.2 present子語102
4.2.3 copy子語104
4.2.4 copyin子語105
4.2.5 copyout子語107
4.2.6 create子語108
4.2.7 數據子語內的子數組111
4.2.8 private私有子語112
4.2.9 承上私有firstprivate子語115
4.2.10 帶有預置數據屬性的變量116
4.2.11 default默認子語117
4.2.12 案例研究:Jacobi迭代優化數據傳輸117
4.3 data構件119
4.3.1 數據管理功能119
4.3.2 deviceptr子語121
4.3.3 案例研究:data構件迭代優化Jacobi數據傳輸122
4.4 enter data導語和exit data導語128
4.4.1 C++類的數據生存期129
4.4.2 傳遞設備數據指針133
4.5 update導語135
4.6 declare導語138
4.6.1 device_resident子語139
4.6.2 create子語140
4.6.3 link子語140
4.6.4 用法舉例141
4.7 特定設備的子語146
第5章 計算區域內的過程調用148
5.1 routine導語150
5.2 seq子語(C版)151
5.3 seq子語(Fortran版)152
5.4 routine(名字)154
5.5 bind子語155
5.6 用子語指定并行級別155
5.6.1 vector級別并行156
5.6.2 worker、worker級別并行159
5.7 計算圓周率π160
第6章 高級特性164
6.1 異步操作164
6.1.1 async子語165
6.1.2 wait子語165
6.1.3 wait導語166
6.2 設備計算與主機計算重疊166
6.3 設備上同時執行多個隊列169
6.4 重疊計算與數據傳輸172
6.4.1 步驟0:串行代碼174
6.4.2 步驟1:計算并行化177
6.4.3 步驟2:分塊計算178
6.4.4 步驟3:數據分塊傳輸179
6.4.5 步驟4:重疊計算與傳輸181
6.5 雙向傳輸183
6.6 多個設備同時運算185
6.6.1 環境變量186
6.6.2 運行過程中選擇設備186
6.6.3 OpenMP調動多個設備195
第7章 與GPU生態環境互操作202
7.1 OpenACC調用CUDA C203
7.2 OpenACC調用CUDA Fortran205
7.3 CUDA C調用OpenACC207
7.4 捆綁主機地址與設備地址208
7.5 CUDA Fortran調用OpenACC210
7.6 OpenACC(C)調用cuBLAS211
7.7 OpenACC(Fortran)調用cuBLAS212
第8章 運行時函數213
8.1 運行時庫的定義213
8.2 運行時庫例程215
8.2.1 acc_get_num_devices215
8.2.2 acc_set_device_type216
8.2.3 acc_get_device_type217
8.2.4 acc_set_device_num217
8.2.5 acc_get_device_num218
8.2.6 acc_init218
8.2.7 acc_shutdown219
8.2.8 acc_async_test219
8.2.9 acc_async_test_all220
8.2.10 acc_wait220
8.2.11 acc_wait_async221
8.2.12 acc_wait_all221
8.2.13 acc_wait_all _async222
8.2.14 acc_get_default_async222
8.2.15 acc_set_default_async223
8.2.16 acc_on_device223
8.2.17 acc_malloc224
8.2.18 acc_free224
8.2.19 acc_copyin225
8.2.20 acc_create226
8.2.21 acc_copyout227
8.2.22 acc_delete228
8.2.23 acc_update_device229
8.2.24 acc_update_self230
8.2.25 acc_map_data231
8.2.26 acc_unmap_data231
8.2.27 acc_deviceptr231
8.2.28 acc_hostptr232
8.2.29 acc_is_present232
8.2.30 acc_memcpy_to_device233
8.2.31 acc_memcpy_from_device233
8.2.32 acc_memcpy_device234
第9章 開發環境搭建235
9.1 Windows 7236
9.2 Linux(rhel)244
9.3 編譯工具、特性支持度247
第10章 在神威·太湖之光上使用OpenACC253
10.1 SW26010眾核處理器253
10.2 存儲模型254
10.3 執行模型256
10.4 數據管理256
附錄 著名超級計算機259
后記 碼農的悲喜264
序: