автор рубрика ,

Тест на знание регулярных выражениях в Python

Для закрепления материалов по регулярным выражениям и основам NLP в Python предлагаем пройти  интерактивный тест. Он основан на статьях Модуль re: регулярные выражения в Python и Регулярные выражения: основы составления…

Регулярные выражения: основы составления правил
автор рубрика ,

Регулярные выражения: основы составления правил

Продолжим говорить о регулярных выражениях в Python в рамках NLP. Регулярные выражения нужны для поиска подстрок, которые удовлетворяют правилам. Например, нужно найти все слова, которые начинаются с заглавной буквы «А»,…

Модуль re: регулярные выражения в Python
автор рубрика ,

Модуль re: регулярные выражения в Python

Регулярные выражения (regular expressions) являются важнейшим инструментом для многих задач NLP в Python. Сегодня мы расскажем об основных функциях Python-модуля re. Читайте в этой статье: как с помощью регулярных выражений…

5 библиотек Python, которые сделают жизнь Data Sciеntist'a проще
автор рубрика ,

5 библиотек Python, которые сделают жизнь Data Sciеntist'a проще

Data Science развивается очень быстро, поэтому появляются все больше и больше библиотек Python. Одну задачу можно выполнить с помощью более чем одной библиотеки и более чем одним способом. Среди всего…

Обучение NLP-модели Word2veс на русских текстах с Python
автор рубрика

Обучение NLP-модели Word2veс на русских текстах с Python

Продолжаем решать NLP-задачи на примере корпуса с русскоязычными twitter-постами, на основе которого мы получили датасет [вот здесь]. Сегодня мы расскажем, как построить и обучить свою word2vec-модель Machine Learning, используя Python-библиотеку…

Готовим русские тексты для Machine Learning с Python
автор рубрика

Готовим русские тексты для Machine Learning с Python

В прошлый раз мы разобрали, как обработать текстовые данные с помощью разных Python-библиотек. Сегодня мы расскажем, как с помощью Python подготовить настоящий датасет с разнообразными twitter-постами на русском языке перед созданием модели…