Курс знакомит студентов с широким кругом современных методов машинного обучения, основными типами решаемых с их помощью задач, методами подготовки и обработки данных, используемым для работы с машинным обучением современным инструментарием. Курс состоит из лекций и практических занятий и обеспечивает студентам не только усвоение теоретических знаний, но и приобретение практических навыков решения задач обработки данных. Акцент в курсе сделан на решение типов задач, возникающих при работе с данными в физике, с учётом их характерных свойств и особенностей.
В результате усвоения курса слушатель приобретет общие знания о работе с данными, а также о рассматриваемых методах машинного обучения, их теоретических основах, областях применения и особенностях практического использования. Он также получит практические навыки работы с данными с использованием некоторых компьютерных программ и программных сред, в которых реализованы рассматриваемые методы.
Страница курса: https://intellect-foundation.r...
МАТЕРИАЛЫ К КУРСУ: https://drive.google.com/drive...
Список всех тем лекций
Занятие 1 (лекция). Введение в машинное обучение. Специфика задач обработки данных в физике.
Вводное слово к курсу лекций
План лекции
Предмет курса: что такое машинное обучение
Методы описания состояния объекта в физике
Аппроксимационное моделирование - построение функционального отображения
Место аппроксимационных методов
Типология задач, решаемых методами МО
Виды задач классификации
Уровни взаимодействия интеллекта с окружающим миром
Добыча данных, машинное обучение и искусственный интеллект
Три волны интереса к нейронным сетям
Ответ на вопрос студента
Некоторые успехи третьей волны
Специфика данных в физике
Стандартная структура данных для МО
Занятие 2 (практикум). Основные понятия языка Python и приёмы работы с ним.
Содержание лекции
Особенности Jupyter Notebook
Интерфейс Jupyter Notebook
Язык разметки Markdown
Система "магических" команд
о системе написания кода на языке Python
Особенности языка Python
Базовые понятия языка Python
Библиотеки Python
Модельная задача: задача классификации
Занятие 3 (лекция). Подготовка данных. Оценка качества моделей.
Общая схема машинного обучения
Подготовка данных
Анализ результатов
Ответы на вопросы по материалу лекции
Занятие 4 (лекция). Отбор и преобразование входных признаков. Оценка значимости входов.
Общая схема машинного обучения
Высокая размерность данных
Способы понижения размерности данных
Методы отбора типа "Фильтр"
Классификация методов отбора
Встроенные методы отбора
Методы отбора типа "Обертки"
Комплексные алгоритмы отбора признаков
Методы преобразования признаков
Оценка размерности задач
Занятие 5 (лекция). Анализ главных компонент и методы на его основе. Кластер-анализ. Нейронные сети и самоорганизующиеся карты Кохонена.
Содержание лекции
Линейный анализ главных компонент
Линейный анализ главных компонент: матричный подход
Метод проекции на латентные структуры
Многомерное разрешение кривых
Решение задач кластеризации
Алгоритм кластеризации К средних
Алгоритм кластеризации DBSCAN
Сравнение алгоритмов кластеризации модельных данных
Проблемы алгоритмов кластеризации
Метрики оценки качества кластеризации
Нейронная сеть Кохонена
Занятие 6 (лекция). Базовые методы машинного обучения.
Общая схема машинного обучения
Общая схема обучения моделей машинного обучения
Линейная регрессия
Логистическая регрессия
Регуляризация
Метод К ближайших соседей
Дерево решений
Бутстрэпп и бэггинг
Градиентный бустинг
Преподаватель отвечает на вопросы присутствующих
Занятие 7 (лекция). Многослойные персептроны. Алгоритм обратного распространения ошибки.
Содержание лекции
Общая схема
Персептрон - универсальный аппроксиматор
Функция потерь и её минимизация
Стохастический градиентный спуск
Алгоритм обратного распространения ошибки
Занятие 8 (практикум). Практические основы предобработки данных.
Содержание лекции
Исследование данных
Основы предобработки данных
Работа с табличными данными и изображениями
Занятие 9 (практикум). Обработка данных спектров и решение задач машинного обучения с их использованием.
Загрузка и первичный анализ данных
Решение обратной задачи спектроскопии
Кластеризация и обучение моделей слабых регрессоров
Занятие 1. (лекция). Глубокие и свёрточные нейронные сети.
Глубокие нейронные сети
Свёрточные нейронные сети
Операция свёртки
Свёрточный нейрон
Свёрточный слой
Биологическая интуиция
Пулинг (агрегация)
Архитектура свёрточной нейронной сети
Нормировка пакета
Depthways separable convolution
Обходные соединения
Эталонный набор
Нейросетевые архитектуры
Перенос обучения
Задача сегментирования
Демонстрация возможностей нейросети YOLO v 3
Ответ на вопрос
Занятие 1. (лекция). Некоторые технологии работы с глубокими нейронными сетями.
Вводное слово к лекции
Обучение нейронных сетей
Функция правдоподобия
Обучение полиномиальной модели
Функция потерь
Максимизация апостериорной вероятности
Кросс-энтропия
Относительная энтропия (расстояние Кульбака– Лейблера)
Другие методы регуляризации
Интерпретация решений нейронных сетей
"Сжатие" нейронных сетей
Занятие 1. (лекция). Рекуррентные нейронные сети.
Рекуррентная нейронная сеть
Распространение градиента в РНС
Градиент сквозь время
Усечённое распространение градиента
Long short-term memory (LSTM)
Механизм внимания
Блок внимания в общем виде
Self-Attention block
Маскированный слой внимания
Трансформер
От рекуррентных сетей к трансформерам
Зоопарк трансформеров
Модели GPT-генерация текстов
Занятие 1. (практикум). Машинное обучение и генерация данных.
Считывание и загрузка данных в py Torch
Простейшая свёрточная нейронная сеть
Перенос обучения
Обучение кондиционной генеративной состязательной сети
Занятие 1. (лекция). Генеративные состязательные сети. Вариационные автоэнкодеры. Генерация данных.
Вводное слово к лекции
Если данных недостаточно: генерация дополнительных примеров
Генеративное моделирование
Таксономия генеративных моделей
Автоэнкодэры: обучение
Автоэнкодэры: перенос обучения
Вариационные автоэнкодеры
Генерация данных с помощью ВАЭ
Генеративные состязательные сети
Обучение ГСС
Обусловленная генерация примеров
Аугментация для задачи генерации
Занятие 1. (лекция). Анализ временных рядов. Комбинированные алгоритмы.
Содержание лекции
Временные ряды
Алгоритмы анализа временных рядов
Прогнозирование временного ряда
Комбинированные алгоритмы
Занятие 1. (практикум). Решение задачи прогнозирования в космической физике.
Чтение исходных данных
Обработка исходных данных
Анализ данных
Классические методы моделирования временных рядов
Использование глубокого обучения для прогнозирования временных рядов
Проверка качества работы моделей