回首頁  
帳號
 
關於博碩 博碩好讀 校園圖書 MOCC認證 下載教學 元學堂

博碩好讀
  新書推薦
  出版預告
  名家名著
  iT達人祕笈
 

分類索引

 

出版總覽

 

讀者服務

  徵求作者
 
首頁 >> 書籍介紹
 
 
點我可放大圖片
 
書名:動手做深度強化學習
書號:MP11812 作者:Maxim Lapan ISBN: 978-986-434-430-7
定價:NT$690元 印刷:單色 頁數:528頁
書籍規格:17*23 上市日:2019/11/1 譯者:劉立民
學習定位:初階 本書附件:官網下載   快速前往 範例
前往購買 >> 蝦皮購物 類別:電腦技術  
       
快速前往 快速前往        

 

 
    實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero…


    強化學習(RL)的最新發展,結合使用深度學習(DL),在訓練代理人「像人類一樣地」解決複雜問題這方面,取得了前所未有的進步。Google團隊利用演算法來玩知名的Atari街機遊戲,並擊敗了它們,這可以說是讓RL領域發光發熱的重要推手,而世界各地的研究人員正馬不停蹄地研發各種新的想法。

    《動手做深度強化學習》綜合性地介紹了最新的DL工具與它們的限制。讀者將評估包括交叉熵和策略梯度等方法,再把它們應用於真實的環境之中。本書使用Atari虛擬遊戲和一般家庭常玩的Connect4遊戲作為範例。除了介紹RL的基礎知識之外,作者亦詳述如何製作智慧型學習代理人等專業知識,讓讀者在面對一系列艱鉅的真實世界挑戰時,能游刃有餘。本書也會說明如何在網格世界(grid world)環境中實作Q學習、如何讓代理人學會買賣和交易股票,並學習聊天機器人是如何使用自然語言模型與人類對話的。

    在這本書中,你將學到:
    ・ 了解結合了RL的DL內容,並實作複雜的DL模型
    ・ 學習RL的基礎:馬可夫決策過程
    ・ 評估RL方法,包括交叉熵、DQN、Actor-Critic、TRPO、PPO、DDPG、D4PG…等等
    ・ 了解如何在各種環境中處理離散行動空間和連續行動空間
    ・ 使用值迭代法來擊敗Atari街機遊戲
    ・ 建立屬於自己的OpenAI Gym環境,來訓練股票交易代理人
    ・ 使用AlphaGo Zero演算法,教你的代理人玩Connect4
    ・ 探索最新的深度RL研究主題,包括AI驅動的聊天機器人等等

    下載範例程式檔案:
    本書的程式碼是由 GitHub 託管,可以在如下網址找到:https://github.com/PacktPublishing/Deep-Reinforcement-Learning-Hands-On。

    下載本書的彩色圖片:
    我們還提供您一個PDF檔案,其中包含本書使用的彩色螢幕截圖/彩色圖表,可以在此下載:https://static.packt-cdn.com/downloads/DeepReinforcementLearningHandsOn_ColorImages.pdf。
 
    前言
    第1章:什麼是強化學習?
    第2章: OpenAI Gym
    第3章:使用PyTorch來做深度學習
    第4章:交叉熵法
    第5章:表格學習與貝爾曼方程式
    第6章:深度Q網路
    第7章:DQN擴充
    第8章:以強化學習法來做股票交易
    第9章:策略梯度-另一個選項
    第10章:行動-評論者方法
    第11章:非同步優勢行動-評論者
    第12章:以強化學習法訓練聊天機器人
    第13章:Web導航
    第14章:連續行動空間
    第15章:信賴域策略-TRPO、PPO與ACKTR
    第16章:強化學習中的黑箱優化
    第17章:超越無模型方法-想像
    第18章:AlphaGo Zero
 
    Maxim Lapan是一位深度學習的愛好者,也是一位獨立研究人員。他有15 年的工作經驗,身分是「軟體開發人員」與「系統架構師」,參與的專案從低階的Linux 核心驅動程式開發,到在數千台伺服器上執行的「分散式應用程式」的「設計」與「性能優化」。憑藉著在大數據、機器學習以及大型平行分散式HPC 和非HPC 系統方面的豐富工作經驗,他能用「簡單的句子」與「生動的範例」來解釋複雜事物的關鍵重點。目前他最感興趣的領域是深度學習的實務應用,例如:「深度自然語言處理」和「深度強化學習」。

    Maxim 和他的家人住在莫斯科,俄羅斯聯邦,他在以色列新創公司擔任資深NLP 開發人員。
 

範例下載
 
  1. 範例 (5.54MB)
 
 
     

博碩文化客服信箱
 

[email protected]

 
文教業務團隊
台北、新北、桃園、基隆、宜蘭、花蓮、金門
汪 玉 鳳
LINE ID:0925177716
0925-177716
[email protected]
郭 南 彤
LINE ID:rgtech101
0917-727778
[email protected]
助理分機 519
新竹、苗栗、台中、彰化、南投、雲林
林 世 昌
LINE ID:0925275775
0925-275775
[email protected]
助理分機 519
嘉義、台南、高雄、屏東、台東、澎湖
林 月 玲
LINE ID:0926858627
0926-858627
[email protected]
助理分機 238
 
MOCC 認證小組
 
  林 雯 玲 電話:02-2696-2869 分機:623 [email protected]

 

 
 

 

博碩文化股份有限公司 DrMaster Press Co., Ltd.
台灣新北市汐止區新台五路一段112號10樓A棟
Building A, 10F, No.112, Xintai 5th Rd., Sec.1,Xizhi Dist., New Taipei City 221, Taiwan
Tel:02-2696-2869 Fax:02-2696-2867 劃撥帳號:17484299

Copyright© DrMaster Press Co., Ltd. All Rights Reserved.