初学者の方々に向け、ディープラーニングの発展技術をまとめた解説書。
ディープラーニングは現在のAI/人工知能の発展の中核を担っており、スマートフォンからIoT、クラウドに至るまで幅広い領域で、画像、音声、言語処理をはじめとした多くの対象分野に浸透し、目覚ましい進展をもたらしています。
ディープラーニングの今の基本をまとめた前作に続き、本作ではニューラルネットワークにおける大きな謎である「なぜ学習できるのか」「なぜ汎化するのか」にスポットを当て平易に解説。合わせて、将来的な革新の可能性を秘める二大トピックとして、「生成モデル」「深層強化学習」も詳しく取り上げます。そして、4つのテーマのもと、ディープラーニングや人工知能について課題を整理し、今後を考えていきます。
多様な問題を一つのアプローチ、アルゴリズムで解ける驚異的な技術。ディープラーニングが一段と進化していく将来につながる、長く役立つ原理、原則、考え方を紐解く1冊です。
# 第0章 ディープラーニングとは何か 表現学習とタスク学習、本書解説の流れ
##0.1 [速習]ディープラーニング
##0.2 ニューラルネットワークの「学習」における大きな謎
##0.3 これから学ぶ生成モデル
##0.4 これから学ぶ強化学習
##0.5 ディープラーニングと人工知能の課題とこれから
# 第1章 ディープラーニングの最適化 なぜ学習できるのか
##1.1 最適化による学習
##1.2 [概要]学習の効率化
##1.3 モーメンタム法
##1.4 学習率の自動調整
##1.5 ハイパーパラメータの最適化
##1.6 本章のまとめ
# 第2章 ディープラーニングの汎化 なぜ未知のデータをうまく予測できるのか
##2.1 従来の汎化理論との矛盾
##2.2 ニューラルネットワークと陰的正則化
##2.3 明示的な正則化
##2.4 本章のまとめ
# 第3章 深層生成モデル 生成を通じて複雑な世界を理解する
##3.1 生成モデル&深層生成モデルとは何か
##3.2 VAE ニューラルネットワークを使った潜在変数モデル
##3.3 GAN 敵対的生成モデル
##3.4 自己回帰モデル
##3.5 正規化フロー
##3.6 拡散モデル
##3.7 本章のまとめ
# 第4章 深層強化学習 ディープラーニングと強化学習の融合
##4.1 強化学習の基本
##4.2 強化学習はどのような特徴を持つのか
##4.3 最適な方策を直接求める モンテカルロ推定
##4.4 方策と価値
##4.5 ベルマン方程式 隣り合う時刻間の価値の関係を表す
##4.6 MC学習、オンライン版MC学習 オンラインでの方策の価値推定1
##4.7 TD学習 オンラインでの方策の価値推定2
##4.8 予測から制御へ 問題のどこが変わるのか
##4.9 方策オン型学習 基本の考え方とSARSA
##4.10 方策オフ型学習 人の振り見て我が振り直せ
##4.11 関数近似 価値をパラメトリックモデルで近似する
##4.12 方策勾配法 方策の勾配を使って最適方策を学習する
##4.13 DQN ディープラーニングと強化学習の融合
##4.14 AlphaGo コンピュータ囲碁での強化学習の適用例
##4.15 モデルベース強化学習
##4.16 本章のまとめ
# 第5章 これからのディープラーニングと人工知能 どのように発展していくか
##5.1 学習手法の発展 自己教師あり学習
##5.2 人工知能と計算性能の関係
##5.3 問題固有の知識をどう組み込むか
##5.4 ディープラーニングの今後の課題
##5.5 本章のまとめ