Советы для тех, кто пишет скрипты для ETL

Ваши скрипты на Python при написании конвейеров данных (data pipeline) должны иметь свойство идемпотентности (idempotent). Это значит, что сколько бы вы раз не запускали скрипт...

Логирование в Python это просто

При росте проекта использовать функции print для сообщения о запуске Python-скрипта или его падение уже становится неудобно. В этом случае используйте логирование (logging). В этой...

Комиксы xkcd или как сделать няшные графики

Приходилось ли вам делать неформальные презентации? Возможно, вы делали смешные рисунки в одном из графических редакторов (тот же Paint). Но что если их можно сделать...

Эффективное хранение строк в Pandas 1.3

Библиотека Pandas незаменима для подготовки данных на Python. При загрузке и хранение строк в Pandas используется много памяти. В таком случае можно воспользоваться категориальным типом...

Выбери своего бойца: PEP8 vs Black vs YAPF

Мы говорили о стилях форматировании кода (code style) на Python в соответствии PEP 8 и Black. В этой статье сравним их, включив ещё один популярный...

Поиск по сайту