Готовим русские тексты для Machine Learning с Python
автор рубрика

Готовим русские тексты для Machine Learning с Python

В прошлый раз мы разобрали, как обработать текстовые данные с помощью разных Python-библиотек. Сегодня мы расскажем, как с помощью Python подготовить настоящий датасет с разнообразными twitter-постами на русском языке перед созданием модели…

Предобработка текста в NLP
автор рубрика

Предобработка текста в NLP

В предыдущий раз мы говорили о векторизации текстовых данных в NLP. Однако прежде чем преобразовать слова в числа, их следует обработать. Читайте в нашей статье о методах предобработки текста: токенизации,…