ギャラクシースーパーはてなブログ

ギャラクシースーパーはてなブログ

ギャラクシースーパーノヴァ子の日記だお

強化学習

【強化学習】Bellman方程式の導出

はじめに モチベーション Bellman方程式ってなに Bellman方程式の導出の流れ 参考書籍 メイン サブ 計算ルール(確率,期待値の基本) 周辺化 基本 例 同時確率と条件付き確率の関係(乗法定理) 基本 例 条件付き期待値 基本1 基本2 例 本題 登場人物(強化…