-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

基於CUDA的並行程式設計

( 簡體 字)
作者:劉金碩類別:1. -> 教材 -> 數位影像處理
譯者:
出版社:科學出版社基於CUDA的並行程式設計 3dWoo書號: 38630
詢問書籍請說出此書號!

缺書
不接受訂購

出版日:5/26/2014
頁數:262
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
不接受訂購
ISBN:9787030405319
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

劉金碩、鄧娟、周崢、曾秋梅等編著的《基于CUDA的并行程序設計》主要介紹基于CUDA的并行程序設計的原理、開發方法和硬件基礎,并給出了應用實例。全書內容共9章。第1∼5章為基礎知識部分,介紹CUDA并行程序設計的原理和開發環境,包括并行計算概述、GPU概述、CUDA編程基礎、GPU存儲器使用技巧和CUDA編程優化。第6∼9章為應用實例部分,分別詳細講解基于C++的遙感影像處理的CUDA優化、基于OpenGL的體繪制技術實現剪切波數據三維可視化的CUDA優化、基于MATLAB的生物細胞圖像病理診斷的CUDA優化和基于CUDA的核外計算集群中間件技術。書中包含實例代碼,需要讀者具有一定的編程開發基礎。
  《基于CUDA的并行程序設計》適合高等院校計算機、電子工程、通信工程等相關專業的教師、研究生閱讀,也可供從事CUDA設計與開發的科研技術人員、程序員參考。

 

目錄:

前言
第1章 并行計算概述
 1.1 并行計算簡介
 1.2 并行處理的計算機體系結構
  1.2.1 并行計算機分類
  1.2.2 并行計算機的物理結構模型
 1.3 并行算法的設計方法
  1.3.1 并行算法的相關概念
  1.3.2 設計并行算法應注意的問題
  1.3.3 并行算法的通用設計方法
 1.4 基于各種并行處理體系結構的算法對比
  1.4.1 SIMD算法
  1.4.2 MIMD算法
  1.4.3 MIMD進程通信和死鎖
  1.4.4 MIMD任務調度
 1.5 小結
 參考文獻
第2章GPU概述
 2.1 GPU的發展
 2.2 GPU的體系結構
  2.2.1 NVIDIA公司的GPU體系結構
  2.2.2 AMD公司的GPU體系結構
 2.3 多核CPU和GPU的協同工作原理
 2.4 GPU并行與分布式對比
 2.5 采用多核CPU和GPU的異構集群
 2.6 小結
 參考文獻
第3章 CUDA編程基礎
 3.1 CUDA簡介
 3.2 CUDA并行新思維
 3.3 CUDA的安裝及配置
  3.3.1 CUDA在Mac OS X中的配置
  3.3.2 CUDA在Linux中的配置
  3.3.3 CUDA存Windows中的配置
 3.4 CUDA編程模型
  3.4.1 CUDA C語言
  3.4.2 執行結構
  3.4.3 內核函數
  3.4.4 線程層次
  3.4.5 存儲器結構與線程映射機制
  3.4.6 通信機制
  3.4.7 CUDA的軟件體系
 3.5 nvcc編譯器
  3.5.1 nvcc編譯流程
  3.5.2 兼容性分析
 3.6 “Helloworld”CUDA編程實例
 3.7 小結
 參考文獻
第4章 GPU存儲器使用技巧
 4.1 GPU的8種存儲器及其訪問機制
 4.2 全局存儲器的使用技巧
 4.3 共享存儲器的使用技巧
 4.4 紋理存儲器的使用技巧
  4.4.1 紋理存儲器的特性
  4.4.2 綁定到紋理的數據類型
  4.4.3 紋理參考聲明
  4.4.4 運行時紋理參考屬性
  4.4.5 紋理存儲器的使用方法
 4.5 主機端頁鎖定內存的使用技巧
  4.5.1 頁鎖定內存的特性
  4.5.2 零復制(zero—copy)
  4.5.3 異步執行
 4.6 小結
 參考文獻
第5章 CUDA編程優化
 5.1 概述
 5.2 性能分析
  5.2.1 測時
  5.2.2 CUDA程序性能分析工具
  5.2.3 CUDA程序性能分析和優化
 5.3 存儲器訪問優化
 5.4 任務劃分
 5.5 指令優化
  5.5.1 存儲器訪問的指令優化
  5.5.2 算術運算的指令優化
  5.5.3 線程同步的指令優化
  5.5.4 控制流的指令優化
 5.6 優化實例
 5.7 小結
 參考文獻
第6章 基于C++的遙感影像處理的CUDA優化
 6.1 遙感影像常用處理算法的GPU加速
  6.1.1 均值濾波算法的CUDA并行化優化
  6.1.2 高斯濾波算法的CUDA并行化優化
  6.1.3 大圖像分塊的均值和方差算法
  6.1.4 圖像處理算法的串并行實驗結果對比與分析
 6.2 基于CUDA的SAR影像SIFT匹配
  6.2.1 遙感影像數據采集和影像幾何特征
  6.2.2 SIFT匹配算法原理
  6.2.3 SIFT匹配算法的CUDA并行化優化
 6.3 水平集曲線演化算法用于遙感圖像輪廓提取
  6.3.1 遙感圖像輪廓提取技術
  6.3.2 水平集曲線演化方法
  6.3.3 水平集曲線演化算法的CUDA并行優化
 6.4 小結
 參考文獻
第7章 基于OpenGL的體繪制技術實現剪切波數據三維可視化的CUDA優化
 7.1 地震剪切波數據的三維可視化
 7.2 體繪制技術和光線投射算法
 7.3 基于OpentGL的CUDA編程
 7.4 基于0pemGL的cuDA光線投射算法設計
  7.4.1 光線投射算法模型設計
  7.4.2 光線投射算法流程
  7.4.3 基于CUDA的光線投射算法設計
  7.4.4 可變采樣步長優化方法
 7.5 體繪制效率提升的GPU訪存優化策略
  7.5.1 采用紋理存儲器策略的體繪制算法優化
  7.5.2 采用全局存儲器策略的體繪制算法優化
  7.5.3 采用全局+共享策略的體繪制算法優化
  7.5.4 采用常量存儲器策略的體繪制算法優化
  7.5.5 采用紋理存儲器的體繪制
 7.6 GPU訪存優化策略效率分析
 7.7 剪切波三維可視化GPU加速實驗結果與分析
  7.7.1 準備工作
  7.7.2 串并行實現光線投射算法的實驗對比
  7.7.3 中國大陸南北帶地區剪切波速度數據的可視化結果與分析
 7.8 小結
 參考文獻
第8章 基于MATLAB的生物細胞圖像病理診斷的CUDA優化
 8.1 真菌隱球酵母菌病理診斷
 8.2 基于MATLAB的CUDA編程
 8.3 基于MATLAB的高噪聲細胞圖像處理的CuDA實現
  8.3.1 imadiust灰度調整算法加速
  8.3.2 imerode腐蝕算法加速
  8.3.3 imtophat高帽濾波算法加速
 8.4 實驗結果與分析
 8.5 小結
 參考文獻
第9章 基于CUDA的核外計算集群中間件
 9.1 基于CuDA的中間件技術
  9.1.1 中間件技術介紹
  9.1.2 DataCutter混合編程架構
 9.2 分布式核外計算中間件
  9.2.1 核外計算技術
  9.2.2 基于CIIDA的混合分布式全局數據管理
  9.2.3 分布式數據服務協議
  9.2.4 基于感知的任務調度策略
  9.2.5 DOoC中間件
 9.3 中間件編程接口
  9.3.1 LAF編程框架
  9.3.2 DOoC+LAF架構
 9.4 實驗結果與分析
  9.4.1 實驗環境
  9.4.2 外存訪問與混合計算能力測試
  9.4.3 MFDn綠色計算測試
  9.4.4 特征值求解器
 9.5 小結
 參考文獻
附錄A 數學函數
附錄B 原子函數
序: