Rating 3.95 out of 5 (16 ratings in Udemy)
What you'll learn- Процесс ETL: загрузка, очистка, объединение данных
- Построение и оценка качества модели линейной регрессии
- EDA: исследовательский анализ данных
- Обогащение данных для извлечения смысла
- Оптимизация потребления памяти набором данных
- Иерархия моделей линейной регрессии
- Ансамбль моделей линейной регрессии
- Экспорт и импорт данных в CSV и HDF5
- Участие в соревнование Kaggle
DescriptionМы рассмотрим все теоретические и …
Rating 3.95 out of 5 (16 ratings in Udemy)
What you'll learn- Процесс ETL: загрузка, очистка, объединение данных
- Построение и оценка качества модели линейной регрессии
- EDA: исследовательский анализ данных
- Обогащение данных для извлечения смысла
- Оптимизация потребления памяти набором данных
- Иерархия моделей линейной регрессии
- Ансамбль моделей линейной регрессии
- Экспорт и импорт данных в CSV и HDF5
- Участие в соревнование Kaggle
DescriptionМы рассмотрим все теоретические и практические аспекты применения линейной регрессии для предсказания числовых показателей энергопотребления ASHRAEв соревновании на Kaggle вплоть до формирования конечного результата.
Курс разбит на 2 части. Впервой части мы последовательно пройдем все этапы работы с данными:от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения,базовые метрики и наиболее простые модели - линейную,полиномиальную и линеаризуемую регрессии.
Во второй части разберем на практикуме:
Особенности процесса анализа данных (ETL):загрузка,очистка,объединение наборов данных с pandas.
Проведение исследовательского анализа данных для поиска зависимостей:EDA.
Использование sklearn для линейной регрессии.
Интерполяция и экстраполяция данных.
Расчет метрики качества RMSLE для моделей линейной регрессии.
Оптимизация линейной регрессии:выбор наилучших параметров и гиперпараметров.
Оптимизация потребления памяти при работе с большими данными.
Запасные модели линейной регрессии.
Ансамбли линейной регрессии для уточнения предсказания.
Экспорт и импорт данных,включая промежуточные.
Выгрузка результата для соревнования на Kaggle.