Страница курса: https://intellect-foundation.r...
Обработка естественного языка включает различные задачи: информационный поиск, анализ тональности, машинный перевод, построение вопросно-ответных систем, определение эмоций, исправление опечаток. Наиболее современным подходом для их решения является использование методов машинного обучения: классических алгоритмов (логистическая регрессия, метод случайного леса), рекуррентных нейронных сетей (долгой краткосрочной памяти, с управляемым рекуррентным блоком), моделей на основе архитектуры Трансформер (автоэнкодерных, генеративных). Современные исследования в области обработки текстов обязательно содержат сравнение нескольких методов. Большие языковые модели ожидаемо показывают более высокое качество, чем алгоритмы классического машинного обучения. Однако вместе с качеством возрастает и требуемый объем вычислительных мощностей. Выбор оптимального метода для решения практической задачи зависит от множества факторов, таких как постановка задачи, метрики оценивания, доступность вычислительных ресурсов, объем обучающих данных.
Таким образом, умение всесторонне проанализировать задачу и выбрать предпочтительный метод машинного обучения является незаменимым навыком для специалиста по автоматической обработке текста.
Цель курса – сформировать практические навыки применения машинного обучения в задачах обработки текстов. Он состоит из двух модулей, в каждом из которых будет подробно рассмотрена определенная задача компьютерной лингвистики. Синтаксический модуль посвящен автоматической оценке приемлемости предложений, семантический – автоматическому распознаванию эмоций в тексте. Мы проанализируем, как эти задачи решаются в существующих исследованиях, разберем предложенные в статьях наборы данных и методы. В конце каждого модуля необходимо будет выполнить проектное задание: для одного из рассмотренных исследований предложить и применить новый метод решения задачи.
Список всех тем лекций
Лекция 1. Многоклассовая классификация эмоций. Часть 1.
Лекция 2. Многоклассовая классификация эмоций. Часть 2.
Лекция 3. Многометочная классификация эмоций. Часть 1.
Лекция 4. Многометочная классификация эмоций. Часть 2.
Лекция 5. Дообучение энкодерных моделей для распознавания эмоций. Часть 1.