Лекция 4. Метод Монте-Карло и TD метод. Алгоритмы SARSA и Q-learning

  1. 00:16Вступление
  2. 03:21Метод Монте-Карло
  3. 19:38Temporal difference (TD) метод
  4. 34:31Алгоритмы SARSA и Q-learning
  5. 53:41TD(n)