小狐狸事務所: 好書 : 強化式學習-打造最強通用演算法 AlphaZero

2022年4月10日星期日

好書 : 強化式學習-打造最強通用演算法 AlphaZero

最近從市圖借到下面這本好書 :

Source : 博客來

這本書是日本人布留川英一寫的, 作者參考英國 DeepMind 公司發表的 AlphaZero 論文與網路上的實作自行改良演算法寫成此書, 主要是針對較簡單的黑白棋遊戲進行實作, 雖然不是複製 AlphaGo, 但也能一窺 AlphaGo 背後的技術-深度強化式學習的堂奧. 作者著作頗豐, 參考 :

# 布留川英一のおすすめランキング

此書大部分是在 Google Colab 上執行, 但遊戲部分則是在本機的 Anaconda 開發環境上執行, 這是因為 Colab 環境無法執行遊戲的 GUI 畫面所致. 書中範例可在旗標網站下載 :

# https://www.flag.com.tw/bk/t/f1315 (350MB)

我很想買這本書, 但最近發現書買來之後就會感到高枕無憂, 擁有後就隨手放在書架上, 要過很久才會看. 反而是借來的書因為後有追兵 (有人預約啦) 就會認真地在時限之前努力看完, 因為這樣的賤心理, 所以我決定不買了.

參考 :

# AlphaZero背後技術大解析！手把手用python實作完勝賽局