Лекция 4. Метод Монте-Карло и TD метод. Алгоритмы SARSA и Q-learning

Name: Лекция 4. Метод Монте-Карло и TD метод. Алгоритмы SARSA и Q-learning
Duration: 59 min 34 s