VIP: Визуализация данных на языке Python

Практический курс Визуализация данных на языке Python

Код курса Даты начала курса Стоимость обучения Длительность обучения Формат обучения
VIP
13 января 2025
14 апреля 2025
28 июля 2025
72 000 руб. 32 ак.часов Дистанционный
Регистрация

О курсе: Данный курс является введением в тематику визуализации данных. В курсе будут описаны основные подходы к визуализации данных, позволяющие наглядно подчеркнуть имеющиеся в них закономерности и особенности. Вы познакомитесь с возможностями библиотек визуализации на языке Python (matplotlib, seaborn, plotly, pandas, bokeh) для решения таких задач, как построение графиков функций распределения, отображение статистических закономерностей, визуализация изменяющихся во времени данных, демонстрация взаимосвязи отдельных компонент данных и многих других. Также вы узнаете, как можно использовать полученные визуальные представления данных для их дальнейшей подготовки и обработки. В курсе делается уклон в сторону развития практических навыков по визуализации данных и даются только самые необходимые теоретические сведения. Самостоятельный итоговый проект, который будет затрагивать все пройденные в рамках курса тематики, продемонстрирует приобретенные навыки и послужит хорошим сборником рецептов для вашей дальнейшей работы.

Аудитория: Специалисты по работе с большими данными, разработчики, руководители, желающие понять подходы к визуализации данных как при построении стратегий развития бизнеса с использованием больших данных, так и решения бизнес задач на основе алгоритмов машинного обучения, а также получить практический навык в данной области.

Предварительная подготовка:

  • опыт программирования на языке Python
  • знание основ математического анализа и математической статистики

Почасовое расписание:

Часы Описание Метка
1,2 Знакомство с аудиторией. Краткий обзор курса. Теоретическая часть. Теория
3,4 Статистические приемы работы с данными Теория
Перерыв на кофе
5,6 Одномерные и многомерные функции распределения Практика
7,8 Зависимости компонент данных Практика

1. Основные статистические характеристики данных. Графики функций распределения и визуализация зависимости компонент данных

Цель: познакомить участников с основными статистическими характеристиками данных, их визуализацией, анализом и подходами к обработке данных, использующими данные характеристики

Теоретическая часть:

  • обзор библиотек языка Python для обработки данных (pandas) и визуализации (matplotlib, seaborn, plotly, pandas, bokeh)
  • краткий обзор основных статистических приемов работы с данными:
    • первичный анализ данных
    • получение описательных статистик
    • изменение типа данных
    • построение сводных таблиц
  • визуализация статистических характеристик данных
    • гистограммы
    • графики плотностей распределений
    • «ящики с усами»
    • «виолончели»
  • визуализация зависимости компонент данных, отбор значимых компонент и понижение размерности данных
    • классические и пузырьковые диаграммы рассеяния
    • тепловые карты
    • таблица со встроенными диаграммами

Практическая часть: решение практических задач по построению графиков одномерных и многомерных функций распределения, точечных диаграмм, тепловых карт.

2. Сравнительный анализ компонент данных

Цель: познакомить участников с подходами к анализу компонент данных относительно временных изменений и сравнению компонент данных с использованием группировки и агрегирования

Теоретическая часть:

  • сравнительные графики вдоль временной оси
    • линейные диаграммы
    • вертикальные столбиковые диаграммы
    • круговые диаграммы площади
  • сравнительные графики с использованием группировки и агрегирования
    • группировка и агрегирование данных в библиотеке pandas
    • вертикальные столбиковые диаграммы переменной ширины
    • таблица со встроенными диаграммами

Практическая часть: решение задач анализа изменяющихся во времени данных, а также подходам к анализу данных с использованием группировки и агрегирования.

3. Композиционные методы визуализации данных

Цель: познакомить участников с основными подходами к композиционным представлениям данных при работе со статичными и изменяющимися во времени данными

Теоретическая часть:

  • композиционные графики изменяющихся во времени компонент данных
    • столбиковые диаграммы со стыковкой компонент данных
    • площадные диаграммы со стыковкой компонент данных
  • композиционные графики статичных данных
    • круговая диаграмма
    • древовидная карта
    • столбиковые диаграммы со стыковкой компонент данных

Практическая часть: анализ данных с использованием композиционных представлений компонент данных.

4. Проектная работа

Цель: закрепить полученные слушателями курса знаний по визуализации данных

Теоретическая часть: краткий обзор пройденного материала с отсылками на рабочие блокноты, в которых решалась та или иная задача визуализации данных

Практическая часть: самостоятельное решение задачи анализа данных с использованием всех изученных подходов визуализации данных на собственной базе данных или же на лабораторном наборе, предоставляемом организаторами курса. Итоговый разбор работ слушателей курса.

Кто проводит курс

prepod-ermilov-dmitrij-mihajlovich.jpg
Преподаватель Школы Больших Данных

Ермилов Дмитрий

Академия Федеральной службы безопасности Российской Федерации (Москва, 2012)
Профессиональные компетенции:
  • Ведущий Data Scientist в ФГУП “Центр информационных технологий”, Москва
  • Руководитель программ в Университете искусственного интеллекта, Москва.
  • Кандидат наук (2017 год, Московский государственный университет им. М.В. Ломоносова, Москва)
prepod-oleg-konorev.jpg
Преподаватель Школы Больших Данных

Конорев Олег

Академия Федеральной службы безопасности Российской Федерации (Москва, 2012)
Профессиональные компетенции:
  • Руководитель группы Data Science в НИИ “Квант”, Москва
  • Computer vision (CV) – решение задач по классификации и детектировании объектов на фото и видео, идентификации человека,  сегментации изображений и распознаванию текста с библиотеками OpenCV, Tensorflow API и архитектурами нейронных сетей  Yolo, SSD, fRCNN, U-net и пр.
  • Natural language processing (NLP– решение задач по классификации текстов, извлечению именованных сущностей (NER) и ключевых слов с библиотеками gensim, nltk, fasttext, spacy и др. Построение различных архитектур на основе искусственных нейронных сетей с использованием различных представлений слов (Embedding, Word2Vec) и готовых нейросетевых решений (Bert, fastai)
  • Time series analysis – решение задач обработки, анализа и классификации аудио сигналов с библиотеками librosa, ffmpeg и различных архитектур нейронных сетей, а также предсказание значений временных рядов (time series forecasting) в приложении к котировкам активов с использованием классических решений (ARMA, ARIMA) и моделей на базе сверточных нейронных сетей (CNN), рекуррентных нейронных сетей (LSTM,GRU) и их комбинаций.
  • Проекты сегментации сигналов с различных датчиков и приборов и распознавания речи (speech-to-text) с облачными сервисами Yandex и Google.
Если у Вас остались вопросы Вы можете позвонить к нам по телефону +7 (495) 414-11-21  или заполнить форму обратной связи на сайте.
Я даю свое согласие на обработку персональных данных и соглашаюсь с политикой конфиденциальности.

Поиск по сайту