Home

Awesome

<img src="https://raw.githubusercontent.com/oreilly-japan/deep-learning-from-scratch-4/images/deep-learning-from-scratch-4.png" width="200px">

書籍『ゼロから作るDeep Learning ❹ 強化学習編』(オライリー・ジャパン)のサポートサイトです。本書籍で使用するソースコードがまとめられています。

ニュース

<a href="https://koki0702.github.io/dezero-p100/"><img src="https://raw.githubusercontent.com/oreilly-japan/deep-learning-from-scratch-4/images/p100.png" height="200px"></a>

本書の内容を確認するための「強化学習100題」を用意しています。

https://koki0702.github.io/dezero-p100/

ファイル構成

フォルダ名説明
ch011章で使用するソースコード
......
ch099章で使用するソースコード
common共通で使用するソースコード
notebooksJupyter Notebook形式のソースコード
pytorchPyTorchに移植したソースコード

Jupyter Notebook

本書のコードはJupyter Notebookでも用意しています。次の表にあるボタンをクリックすることで、Google ColabやKaggle Notebookなどのクラウドサービス上でNotebookを実行することができます。

ColabKaggleStudio Lab
1章 バンディット問題Open In ColabKaggleOpen In SageMaker Studio Lab
4章 動的計画法Open In ColabKaggleOpen In SageMaker Studio Lab
5章 モンテカルロ法Open In ColabKaggleOpen In SageMaker Studio Lab
6章 TD法Open In ColabKaggleOpen In SageMaker Studio Lab
7章 ニューラルネットワークとQ学習Open In ColabKaggleOpen In SageMaker Studio Lab
8章 DQNOpen In ColabKaggleOpen In SageMaker Studio Lab
9章 方策勾配法Open In ColabKaggleOpen In SageMaker Studio Lab

Pythonと外部ライブラリ

ソースコードを実行するには、下記のソフトウェアが必要です。

本書では、ディープラーニングのフレームワークとしてDeZeroを使います。DeZeroは「ゼロから作るDeep Learning」シリーズの3作目で作ったフレームワークです( pip install dezero からインストールできます)。

PyTorchを使った実装はpytorchフォルダにて提供しています。

実行方法

各章のフォルダに該当するコードがあります。 実行するためには、下記のとおりPythonコマンドを実行します(どのディレクトリからでも実行できます)。

$ python ch01/avg.py
$ python ch08/dqn.py

$ cd ch09
$ python actor_critic.py

ライセンス

本リポジトリのソースコードはMITライセンスです。 商用・非商用問わず、自由にご利用ください。

正誤表

本書の正誤情報は以下のページで公開しています。

https://github.com/oreilly-japan/deep-learning-from-scratch-4/wiki/errata

本ページに掲載されていない誤植など間違いを見つけた方は、japan@oreilly.co.jpまでお知らせください。