動手做深度強化學習 @ 3dWoo大學簡體電腦書店

	-- 會員 / 註冊 --
帳號：　密碼：　 \| 註冊 \| 忘記密碼

3/26 新書到！ 3/19 新書到！ 3/14 新書到！ 12/12 新書到！
	購書流程‧Q & A‧站務留言版‧客服信箱

│ 3ds Max│ Maya│ Rhino│ After Effects│ SketchUp│ ZBrush│ Painter│ Unity│

│ PhotoShop│ AutoCad│ MasterCam│ SolidWorks│ Creo│ UG│ Revit│ Nuke│

│ C#│ C│ C++│ Java│ 遊戲程式│ Linux│ 嵌入式│ PLC│ FPGA│ Matlab│

│ 駭客│ 資料庫│ 搜索引擎│ 影像處理│ Fluent│ VR+AR│ ANSYS│ 深度學習│

│ 單晶片│ AVR│ OpenGL│ Arduino│ Raspberry Pi│ 電路設計│ Cadence│ Protel│

│ Hadoop│ Python│ Stm32│ Cortex│ Labview│ 手機程式│ Android│ iPhone│


可查書名,作者,ISBN,3dwoo書號		詳細書籍分類

動手做深度強化學習
( 繁體字)

作者：Maxim Lapan 類別：1. -> 程式設計 -> 深度學習

譯者：

出版社：博碩文化 3dWoo書號： 52186
詢問書籍請說出此書號！
【缺書】
NT定價： ~~690~~ 元
折扣價： 518 元

出版日：11/1/2019

頁數：528

光碟數：0

站長推薦：

印刷：黑白印刷語系： ( 繁體版 )

加入購物車 │加到我的最愛
(請先登入會員)

ISBN：9789864344307

作者序　|　譯者序　|　前言　|　內容簡介　|　目錄　|　序

(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)

作者序：

譯者序：

前言：

內容簡介：
實作現代強化學習方法：深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…強化學習（RL）的最新發展，結合使用深度學習（DL），在訓練代理人「像人類一樣地」解決複雜問題這方面，取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲，並擊敗了它們，這可以說是讓RL領域發光發熱的重要推手，而世界各地的研究人員正馬不停蹄地研發各種新的想法。《動手做深度強化學習》綜合性地介紹了最新的DL工具與它們的限制。讀者將評估包括交叉熵和策略梯度等方法，再把它們應用於真實的環境之中。本書使用Atari虛擬遊戲和一般家庭常玩的Connect4遊戲作為範例。除了介紹RL的基礎知識之外，作者亦詳述如何製作智慧型學習代理人等專業知識，讓讀者在面對一系列艱鉅的真實世界挑戰時，能游刃有餘。本書也會說明如何在網格世界（grid world）環境中實作Q學習、如何讓代理人學會買賣和交易股票，並學習聊天機器人是如何使用自然語言模型與人類對話的。在這本書中，你將學到：? 了解結合了RL的DL內容，並實作複雜的DL模型? 學習RL的基礎：馬可夫決策過程? 評估RL方法，包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等? 了解如何在各種環境中處理離散行動空間和連續行動空間? 使用值迭代法來擊敗Atari街機遊戲? 建立屬於自己的OpenAI Gym環境，來訓練股票交易代理人? 使用AlphaGo Zero演算法，教你的代理人玩Connect4? 探索最新的深度RL研究主題，包括AI驅動的聊天機器人等等下載範例程式檔案：本書的程式碼是由 GitHub 託管。下載本書的彩色圖片：我們還提供您一個PDF檔案，其中包含本書使用的彩色螢幕截圖／彩色圖表。

目錄：
前言
第1章：什麼是強化學習？
第2章： OpenAI Gym
第3章：使用PyTorch來做深度學習
第4章：交叉熵法
第5章：表格學習與貝爾曼方程式
第6章：深度Q網路
第7章：DQN擴充
第8章：以強化學習法來做股票交易
第9章：策略梯度－另一個選項
第10章：行動－評論者方法
第11章：非同步優勢行動－評論者
第12章：以強化學習法訓練聊天機器人
第13章：Web導航
第14章：連續行動空間
第15章：信賴域策略－TRPO、PPO與ACKTR
第16章：強化學習中的黑箱優化
第17章：超越無模型方法－想像
第18章：AlphaGo Zero

序：