VIP: Визуализация данных на языке Python

Практический курс Визуализация данных на языке Python

Ближайшая дата курса 14 – 17 декабря
12 – 5 марта
Стоимость обучения 48.000 руб. Купить
Код курса VIP

4-х дневный практический курс для Data Scientist’ов, специалистов по машинному обучению и работе с большими данными, Python-разработчиков и руководителей, которые хотят понять подходы к визуализации данных при построении стратегий развития бизнеса с использованием технологий Big Data, решать бизнес-задачи с помощью методов Machine Learning  и получить практический навык в данной области.

КАК ПОСТРОЕН ОБРАЗОВАТЕЛЬНЫЙ КУРС
по визуализации данных на языке PYTHON

Продолжительность: 4 дня, 32 академических часа.

Соотношение теории к практике 50/50

Курс “Визуализация данных на языке Python” представляет собой введение в разведочный анализ больших данных с уклоном в графическое представление результатов. В курсе описаны основные подходы к визуализации данных, которые позволяют наглядно подчеркнуть имеющиеся в них закономерности и особенности. Вы познакомитесь с возможностями библиотек визуализации на языке Python (matplotlib, seaborn, plotly, pandas, bokeh) для решения следующих прикладных задач:

  • построение графиков функций распределения;
  • отображение статистических закономерностей;
  • визуализация изменяющихся во времени данных№
  • демонстрация взаимосвязи отдельных компонент данных.

Также вы узнаете, как можно использовать полученные визуальные представления данных для их дальнейшей подготовки и обработки. Особое внимание в курсе уделено развитию практических навыков по визуализации данных: из теории даются только самые необходимые сведения.

На практике вы самостоятельно выполните итоговый проект, который будет затрагивать все пройденные в рамках курса темы, объединит все приобретенные вами навыки, войдет в ваше портфолио и послужит отличным сборником рецептов для дальнейшей практической работы.

Предварительная подготовка:

  • опыт программирования на языке Python;
  • знание основ математического анализа и математической статистики.

Успешно окончив курс “Визуализация данных на языке Python” в нашем лицензированном учебном центревы получите сертификат о повышении квалификации установленного образца.

 

Программа курса “Визуализация данных на языке Python”

1. Основные статистические характеристики данных. Графики функций распределения и визуализация зависимости компонент данных

Цель: познакомить участников с основными статистическими характеристиками данных, их визуализацией, анализом и подходами к обработке данных, использующими данные характеристики

Теоретическая часть:

Визуализация данных на языке Python
Графики функций распределения и визуализация зависимости компонент данных
  • обзор библиотек языка Python для обработки данных (pandas) и визуализации (matplotlib, seaborn, plotly, pandas, bokeh)
  • краткий обзор основных статистических приемов работы с данными:
    • первичный анализ данных
    • получение описательных статистик
    • изменение типа данных
    • построение сводных таблиц
  • визуализация статистических характеристик данных
    • гистограммы
    • графики плотностей распределений
    • «ящики с усами»
    • «виолончели»
  • визуализация зависимости компонент данных, отбор значимых компонент и понижение размерности данных
    • классические и пузырьковые диаграммы рассеяния
    • тепловые карты
    • таблица со встроенными диаграммами

Практическая часть: решение практических задач по построению графиков одномерных и многомерных функций распределения, точечных диаграмм, тепловых карт

Почасовое расписание:

Часы Описание Метка
1,2 Знакомство с аудиторией. Краткий обзор курса. Теоретическая часть. Теория
3,4 Статистические приемы работы с данными Теория
Перерыв на кофе
5,6 Одномерные и многомерные функции распределения Практика
7,8 Зависимости компонент данных Практика

2. Сравнительный анализ компонент данных

Цель: познакомить участников с подходами к анализу компонент данных относительно временных изменений и сравнению компонент данных с использованием группировки и агрегирования

Теоретическая часть:

Визуализация данных на языке Python
Сравнительный анализ компонент данных
  • сравнительные графики вдоль временной оси
    • линейные диаграммы
    • вертикальные столбиковые диаграммы
    • круговые диаграммы площади
  • сравнительные графики с использованием группировки и агрегирования
    • группировка и агрегирование данных в библиотеке pandas
    • вертикальные столбиковые диаграммы переменной ширины
    • таблица со встроенными диаграммами

Практическая часть: решение задач анализа изменяющихся во времени данных, а также подходам к анализу данных с использованием группировки и агрегирования

Почасовое расписание:

Часы Описание Метка
1,2 Знакомство с аудиторией. Краткий обзор курса. Теоретическая часть. Теория
3,4 Статистические приемы работы с данными Теория
Перерыв на кофе
5,6 Одномерные и многомерные функции распределения Практика
7,8 Зависимости компонент данных Практика

 

3. Композиционные методы визуализации данных

Цель: познакомить участников с основными подходами к композиционным представлениям данных при работе со статичными и изменяющимися во времени данными

Теоретическая часть:

Визуализация данных на языке Python
Композиционные методы визуализации данных
  • композиционные графики изменяющихся во времени компонент данных
    • столбиковые диаграммы со стыковкой компонент данных
    • площадные диаграммы со стыковкой компонент данных
  • композиционные графики статичных данных
    • круговая диаграмма
    • древовидная карта
    • столбиковые диаграммы со стыковкой компонент данных

Практическая часть: анализ данных с использованием композиционных представлений компонент данных

Почасовое расписание:

Часы Описание Метка
1,2 Знакомство с аудиторией. Краткий обзор курса. Теоретическая часть. Теория
3,4 Статистические приемы работы с данными Теория
Перерыв на кофе
5,6 Одномерные и многомерные функции распределения Практика
7,8 Зависимости компонент данных Практика

 

4. Проектная работа

Цель: закрепить полученные слушателями курса знаний по визуализации данных

Теоретическая часть: краткий обзор пройденного материала с отсылками на рабочие блокноты, в которых решалась та или иная задача визуализации данных

Практическая часть: самостоятельное решение задачи анализа данных с использованием всех изученных подходов визуализации данных на собственной базе данных или же на лабораторном наборе, предоставляемом организаторами курса. Итоговый разбор работ слушателей курса

Почасовое расписание:

Часы Описание Метка
1,2 Знакомство с аудиторией. Краткий обзор курса. Теоретическая часть. Теория
3,4 Статистические приемы работы с данными Теория
Перерыв на кофе
5,6 Одномерные и многомерные функции распределения Практика
7,8 Зависимости компонент данных Практика