Лекция 10. Мультиагентные LLM-системы: паттерны, ловушки, коллективное обучение

  1. 00:16Введение
  2. 04:07Мотивация и постановка
  3. 09:30Паттерны разработки: команды из одиночных LLM
  4. 19:19Формализм: Dec-POMDP и Markov Game
  5. 28:55Ловушки независимого обучения
  6. 39:07Коллективное обучение: VDN, QMIX, COMA
  7. 52:21MAPPO и переход к LLM-командам
  8. 57:27Открытые вопросы и итог