Лекция 3. Уравнения Беллмана и динамическое программирование

  1. 00:16Повторение: марковский процесс принятия решений (MDP)
  2. 15:08Повторение: уравнения Беллмана
  3. 30:05Решение уравнения Беллмана (существование оптимальной политики)
  4. 01:01:07ε-жадная политика