Vaex и Dask: когда Pandas не может обработать большие данные
автор рубрика ,

Vaex и Dask: когда Pandas не может обработать большие данные

День за днем количество данных увеличивается настолько, что прошлые инструменты обработки начинают устаревать. Не секрет, что Pandas не предназначен для работы с Big Data. Тогда на замену придут такие Python-библиотеки,…

4 функции для изменения форм таблиц в Pandas
автор рубрика ,

4 функции для изменения форм таблиц в Pandas

При работе с таблицами Pandas порой приходится их видоизменять, в частности, когда таблица многоуровневая. В этой статье мы расскажем вам об основных функциях Pandas для изменения формы таблицы. К этим…

Визуализация временных рядов
автор рубрика ,

Визуализация временных рядов

Временные ряды — это ключевой вид данных в финансовых, фармацевтических, медицинских и социологических отраслях. Анализ временных рядов не может обойтись без визуализации данных, и один график может заменить многостраничный отчет.…

Чтение таблиц Excel в Pandas
автор рубрика

Чтение таблиц Excel в Pandas

Хотя многие Data Scientist’ы больше привыкли работать с CSV-файлами, на практике очень часто приходится сталкиваться с обычными Excel-таблицами. Поэтому сегодня мы расскажем, как читать Excel-файлы в Pandas, а также рассмотрим…

Читаем таблицы веб-сайтов с помощью Pandas
автор рубрика

Читаем таблицы веб-сайтов с помощью Pandas

Данные для Data Science проектов можно получать ото всюду, в том числе и с веб-сайтов, например, страниц Википедии. Сегодня мы расскажем, как извлечь все таблицы из веб-страницы с помощью функции…

Как ускорить обработку данных в Pandas в 600 раз
автор рубрика

Как ускорить обработку данных в Pandas в 600 раз

Pandas — полезный инструмент Data Science, но некоторые его методы для обработки данных требуют слишком много времени. Поэтому сегодня мы расскажем, как ускорить Pandas в сотни раз с помощью всего…