автор рубрика ,

Тест на знание регулярных выражениях в Python

Для закрепления материалов по регулярным выражениям и основам NLP в Python предлагаем пройти  интерактивный тест. Он основан на статьях Модуль re: регулярные выражения в Python и Регулярные выражения: основы составления…

Как сериализовать и десериализовать JSON в Python
автор рубрика ,

Как сериализовать и десериализовать JSON в Python

JSON является одним из самых распространённых форматов хранения данных. Сегодня поговорим о работе с JSON в Python. Читайте далее, как соотносятся словари и JSON, сериализация и десериализация, в чем разница…

Регулярные выражения: основы составления правил
автор рубрика ,

Регулярные выражения: основы составления правил

Продолжим говорить о регулярных выражениях в Python в рамках NLP. Регулярные выражения нужны для поиска подстрок, которые удовлетворяют правилам. Например, нужно найти все слова, которые начинаются с заглавной буквы «А»,…

Модуль re: регулярные выражения в Python
автор рубрика ,

Модуль re: регулярные выражения в Python

Регулярные выражения (regular expressions) являются важнейшим инструментом для многих задач NLP в Python. Сегодня мы расскажем об основных функциях Python-модуля re. Читайте в этой статье: как с помощью регулярных выражений…

Чтение таблиц Excel в Pandas
автор рубрика

Чтение таблиц Excel в Pandas

Хотя многие Data Scientist’ы больше привыкли работать с CSV-файлами, на практике очень часто приходится сталкиваться с обычными Excel-таблицами. Поэтому сегодня мы расскажем, как читать Excel-файлы в Pandas, а также рассмотрим…

Читаем таблицы веб-сайтов с помощью Pandas
автор рубрика

Читаем таблицы веб-сайтов с помощью Pandas

Данные для Data Science проектов можно получать ото всюду, в том числе и с веб-сайтов, например, страниц Википедии. Сегодня мы расскажем, как извлечь все таблицы из веб-страницы с помощью функции…