Проектные задачи компьютерной лингвистики
https://intellect-foundation.r...
Цель курса — это интеграция знаний, полученных студентами в ходе изучения теоретических и компьютерных дисциплин в единую систему, развитие практических навыков работы с современными инструментами компьютерной лингвистики, формирование опыта научно-исследовательской работы.
Планируемые результаты обучения:
1. Студенты научатся выявлять актуальные проблемы в области компьютерной лингвистики и формулировать проектные задачи.
2. Пройдут полный цикл реализации проектов: от первоначальной предобработки данных до анализа результатов и их интерпретации.
3. Получат опыт работы с большими наборами данных и анализу текстовой информации с использованием современных инструментов.
4. Сформируют навыки критической оценки как собственных проектов, так и результатов других исследователей, проводить тестирование, оценивать качество и точность разработанных систем.
5. Разовьют навыки публичного выступления и научной коммуникации в процессе презентации и защиты собственных проектов.
Курс разделен на три модуля:
- Первый модуль сфокусирован на описании задач, с которыми предстоит работать студентам.
- Целью второго модуля является создание базовой модели для решаемой задачи.
- Третий модуль направлен на улучшение базовой модели.
Для успешного прохождения курса, требуются знания:
- автоматической обработки текста
- линейной алгебры и математического анализа
- теории вероятности и математической статистики
- методов классического машинного обучения
- основ глубокого обучения
От слушателей также ожидается умение программировать на Python.
- 59:08Лекция 1. Анализ тональности к именованным сущностям в новостных текстах
- 55:47Лекция 2. Извлечение мнений из новостных текстов
- 52:12Лекция 3. Анализ аргументации
- 55:12Лекция 4. Обучение больших языковых моделей. Часть 1
- 57:35Лекция 5. Обучение больших языковых моделей. Часть 2
- 36:04Лекция 6. Тонкая настройка с учителем (Supervised fine-tuning (SFT))
- 01:07:06Лекция 7. Использование больших языковых моделей (LLM)
- 36:47Лекция 8. Эффективные методы тонкой настройки больших языковых моделей
- 27:19Лекция 9. Проект «Сравнение эффективности базовых моделей и моделей, предобученных для решения задач анализа тональности текста, при дообучении для анализа тональности именованных сущностей»
- 45:36Лекция 10. Проект «Анализ аргументации в отзывах на кинофильмы»
- 29:27Лекция 11. Проект «RAG-система с LLMs»
