Лекция 5. Обучение больших языковых моделей. Часть 2
- 00:16Вводное слово
- 01:08Некоторые проблемы LLM
- 11:41Особенности создания ответов для диалогов
- 17:43Ошибки со счётом
- 22:33Этап 2b: обучение с подкреплением
- 27:33Модель DeepSeek
- 38:27Модель AlphaGo
- 41:59Обучение с подкреплением с обратной связью от человека
- 51:32Обучение LLM как обучение в школе
- 54:14LLM-АРЕНА
