Vaex и Dask: когда Pandas не может обработать большие данные
автор рубрика ,

Vaex и Dask: когда Pandas не может обработать большие данные

День за днем количество данных увеличивается настолько, что прошлые инструменты обработки начинают устаревать. Не секрет, что Pandas не предназначен для работы с Big Data. Тогда на замену придут такие Python-библиотеки,…

4 функции для изменения форм таблиц в Pandas
автор рубрика ,

4 функции для изменения форм таблиц в Pandas

При работе с таблицами Pandas порой приходится их видоизменять, в частности, когда таблица многоуровневая. В этой статье мы расскажем вам об основных функциях Pandas для изменения формы таблицы. К этим…

Как в 2020 использовали Jupyter Notebook в GitHub
автор рубрика

Как в 2020 использовали Jupyter Notebook в GitHub

В прошлой статье мы говорили о среде IPython. Сегодня мы поговорим о том, как Python-программисты использовали интерактивные ipynb-блокноты в своих репозиториях GitHub в 2020. Читайте в этой статье: статистика и…

Как сериализовать и десериализовать JSON в Python
автор рубрика ,

Как сериализовать и десериализовать JSON в Python

JSON является одним из самых распространённых форматов хранения данных. Сегодня поговорим о работе с JSON в Python. Читайте далее, как соотносятся словари и JSON, сериализация и десериализация, в чем разница…

Регулярные выражения: основы составления правил
автор рубрика ,

Регулярные выражения: основы составления правил

Продолжим говорить о регулярных выражениях в Python в рамках NLP. Регулярные выражения нужны для поиска подстрок, которые удовлетворяют правилам. Например, нужно найти все слова, которые начинаются с заглавной буквы «А»,…

Модуль re: регулярные выражения в Python
автор рубрика ,

Модуль re: регулярные выражения в Python

Регулярные выражения (regular expressions) являются важнейшим инструментом для многих задач NLP в Python. Сегодня мы расскажем об основных функциях Python-модуля re. Читайте в этой статье: как с помощью регулярных выражений…