Лекция 3. Уравнения Беллмана и динамическое программирование
- 00:16Повторение: марковский процесс принятия решений (MDP)
- 15:08Повторение: уравнения Беллмана
- 30:05Решение уравнения Беллмана (существование оптимальной политики)
- 01:01:07ε-жадная политика

