Лекция 10. Мультиагентные LLM-системы: паттерны, ловушки, коллективное обучение
- 00:16Введение
- 04:07Мотивация и постановка
- 09:30Паттерны разработки: команды из одиночных LLM
- 19:19Формализм: Dec-POMDP и Markov Game
- 28:55Ловушки независимого обучения
- 39:07Коллективное обучение: VDN, QMIX, COMA
- 52:21MAPPO и переход к LLM-командам
- 57:27Открытые вопросы и итог

