Все курсы
Открытый курс машинного обучения на Python в формате видеопубликаций и практических занятий на Google Colab
Открытый курс «Основы языка Python для анализа данных и решения задач машинного обучения» представляет собой видеокурс от проекта Python School и «Школы Больших Данных» для изучения основ программирования на языке Python и получения практических навыков работы со специализированными библиотеками Python по методам машинного обучения (Machine Learning), подготовке и анализу больших данных (Data Science). Курс предназначен для аналитиков и инженеров данных, руководителей и специалистов по работе с большими данными, которые не имеют соответствующей подготовки по программированию.
Роль Python в мире Big Data
Для успешного освоения современных фреймворков для работы с большими данными и методами машинного обучения необходимо умение программировать на одном из языков программирования: таких как Java, Scala, Python. Подготовка программиста длительный и сложный процесс, требующий времени на освоение теории и многих месяцев практики. Наша задача — не ускорить процесс подготовки, а сфокусироваться на изучении конкретных библиотек Python, которые традиционно используются для обработки и визуализации больших данных.
В рамках этих направлений наибольшую популярность получили библиотеки NumPy и Scipy, Pandas, Matplotlib и Seaborn. Они позволяют подготовить данные к анализу, а также визуализировать и интерпретировать результаты моделирования с помощью специализированных методов.
Благодаря этому Data Scientist и аналитик данных могут быстро проанализировать большие объемы «необработанной» информации, например, исключить повторяющиеся значения в массиве или выявить тренды. Также знание этих библиотек пригодится инженеру данных и разработчику Big Data решений, задействованных в промышленных проектах Data Science.
Кому необходимы курсы по основам Python в Data Science
Курс ориентирован на ИТ-специалистов (администраторы, аналитики и инженеры данных), которые отвечают за администрирование, сопровождение и разработку систем хранения и подготовки больших данных для задач аналитики и решения задач машинного обучения с использованием языка Python.
Курс FUNP «Основы языка Python для анализа данных и решения задач машинного обучения» позволяет в короткие сроки получить необходимую базовую подготовку по теории и практический опыт работы с необходимыми библиотеками. Наша цель — не изучать фундаментальные основы программирования на Python в теории, а подготовить специалистов, использующих большие данные, к работе с библиотеками, которые поддерживают быстрые вычисления и научные расчеты, обработку табличных и текстовых данных, а также визуализацию результатов исследований. Именно поэтому наши преподаватели, в большей степени, не преподаватели Python, а практикующие специалисты по Data Science и инженеры данных, которые используют Python для решения прикладных задач подготовки данных, применения методов машинного обучения и построения нейронных сетей. Они на практике знают все нюансы применения Python и «то, что именно нужно» для успешного усвоения материала.
Курс рассчитан на мотивированных студентов, умеющих пользоваться справочной литературой и материалами, включая видео-лекции и практические материалы по выполнению лабораторных работ в среде Google Colab для самостоятельного обучения.
Для корпоративных слушателей и участников программы обучения «Другие 48 часов» предусмотрен платный вариант прохождения курса в формате вебинара или в классе под руководством преподавателя с полной поддержкой в ходе обучения. Подробнее смотрите наше предложение «Другие 48 часов» FUNP+DPREP
Курс является вводным и обязательным для подготовки специалистов по работе с распределенными MPP-системами, NoSQL СУБД, Apache Hadoop, Kafka, Spark, но не имеющими навыков программирования на Python или любом другом языке (Java, Scala и др.) для прохождения специализированных курсов:
- DPREP: Подготовка данных для Data Mining на Python
- PYML: Введение в машинное обучение на Python
- PYNN: Введение в Нейронные сети на Python
Предварительный уровень подготовки:
- Опыт работы в Unix (от 1 года)
- Знание основ статистики
Как построен образовательный курс «Основы языка Python для анализа данных и решения задач машинного обучения»
Формат обучения:
- БЕСПЛАТНЫЙ: видеокурс с методическими материалами и практическими лабораторными работами без поддержки преподавателя, доступ к видео через подписку на Youtube-канале
- ПЛАТНЫЙ (доступно только в рамках корпоративного обучения): очное обучение в классе или онлайн-курс с методическими материалами и практическими лабораторными работами под руководством преподавателя
Методические материалы: учебное пособие на русском языке с практическими лабораторными работами
Целью курса является изучения основ программирования Python для получения достаточных практических навыков для работы с инструментарием библиотек NumPy, Scipy, Pandas, Matplotlib и Seaborn, применяемых для задач подготовки и анализа данных. Успешно освоив материалы курса, вы сможете глубже погрузиться в тематику обработки и анализа данных на профессиональном уровне. В итоге вы приобретете базовые знания и навыки применения инструментария Python в прикладных задачах Data Science.
Особенности курса:
- Основное внимание направлено не на теорию, а на практику и применимость решений в прикладных задачах.
- Вся теория подкреплена реальными данными из практики.
- В конце каждой темы вы получите задание на проверку усвоенного материала.
Успешно окончив курс «Основы языка Python для анализа данных и решения задач машинного обучения» в нашем лицензированном учебном центре, вы получите сертификат о повышении квалификации установленного образца.
Программа курса «Основы языка Python для анализа данных и решения задач машинного обучения»
1. Введение в анализ данных и разработку на языке Python
- Python как инструмент для анализа данных и решения задач машинного обучения. Установка и настройка среды разработки. Обзор и сравнение имеющихся IDE.
- Основы работы в Jupyter Notebook. Интерпретирование строковых и текстовых полей. Удаленная разработка с использованием сервиса Google colaboratory.
2. Библиотеки NumPy и SciPy для решения задач анализа данных и машинного обучения
- Математические дисциплины в анализе данных и машинном обучении
- Основной объект NumPy ndarray
- Библиотека SciPy
3. Библиотека Pandas для работы с высокоуровневыми структурами данных
- Введение в структуры данных Pandas
- Работа с объектами Series, DataFrame. Переиндексация, доступ по индексу, выборка, фильтрация
- Применение функций и отображений, арифметические операции и выравнивание данных
- Редукция и вычисление описательных статистик. Обработка отсутствующих данных
- Иерархическое индексирование
- Переформатирование данных: очистка, преобразование, слияние, изменение формы
4. Визуализация результатов анализа данных с использованием библиотек Matplotlib, Seaborn, Pandas
- Краткое введение в API библиотеки Matplotlib
- Краткое введение в API библиотеки Seaborn
- Функции построения графиков в Pandas
5. Роль и место библиотек языка Python в построении конвейера для обработки и анализа данных с целью последующего применения методов машинного обучения
- Основы построения конвейера для обработки данных
- Библиотека Pandas для загрузки и первичной обработки исходных данных
- Статистический анализ данных, получение корреляционных значений и отбор значимых признаков
- Итоговый вариант обработчика данных. Встраивание в процесс обучения модели машинного обучения.
- Обзор библиотек классических методов машинного обучения и глубокого обучения на основе искусственных нейронных сетей.
Полный сборник видео-курсов «Основы языка Python для анализа данных и решения задач машинного обучения».