Хаос в мире MLOps, или как найти себя

Сфера Machine Learning становится одной из самых высокооплачиваемой в IT. Вместе с ней появился MLOps. Вот вы захотели войти в эту сферу и думаете с чего начать, какие ключевые слова требуются для хорошего резюме. Возможно вы встретили тот стэк технологий, который изображен в заголовке.

А не многовато ли надо знать для профессии MLOps? Половина логотипов и вовсе незнакома людям, которые работают в этой сфере.

Но даже это не конец. Взгляните на инструменты MLOps, о которых упоминает Matt Turck в своей статье. Картинка ещё более ужасающая:

Огромное количество технологий используется в MLOps.Давайте же разберемся, почему существует такой хаос в MLOps.

Текущее состояние

Как мы уже убедились, инструментов в этой сфере изрядное количество. Больше профессионалов согласятся с тем, что отслеживание моделей машинного обучения — очень важная часть работы и требует надежности и производительности. Вот вы захотели выбрать себе провайдеров, которые бы обеспечивали эти возможности. Уже можно назвать 6 различных опций: Fiddler, Arize, Evidently, Whylabs, Gantry, Arthur. Мы даже при этом не упомянули инструменты, которые предназначены только для отслеживания.

Конечно, иметь большой выбор — это хорошо, но не когда время поджимает, и вы должны оценить, какой подойдет лучше под ваши метрики. Но с отслеживанием, в большинстве случаев, понятно, что делать. А вот с другими инструменты оценить сложнее.

Стало популярным среди крупных компаний создавать свой собственный стэк MLOps в виде так называемых магазинов. И вот у нас есть магазин моделей, магазин признаков, магазин метрик.

Как видим сообщество очень креативно, что придумало множество синонимов слову база данных.

Тем не менее, дисциплина молодая, поэтому придет время и её как-нибудь стандартизируют в течении 5–10+ лет.

Всё то множество технологий может не пригодиться для вашей ситуации. Все эти рекламы о мгновенной обработке петабайтах данных работают на крупные компании. Другие же не имеют такой возможности и не обязаны соблюдать такие требования. Вам, как MLOps-специалисту, нужно самому определить стратегию развития на основании масштаба компании.

В этой ситуации новичкам в MLOps можно порекомендовать следующее:

  1. Найти специалиста, который чувствует себя как рыба в воде, и позадавать ему вопросы.
  2. Хорошо обдумать проблему и попытаться решить её уже на основании знакомых технологий, не отвлекаясь на тот зоопарк инструментов и платформ.
  3. Провести много времени за построением реальных систем и “набить шишки”.

Машинное обучение в Apache Spark

Код курса
MLSP
Ближайшая дата курса
16 мая, 2024
Продолжительность
16 ак.часов
Стоимость обучения
48 000 руб.

Эти три рекомендации покрывает наш курс «Разработка и внедрение ML-решений», который проходит в лицензированном учебном центре обучения и повышения квалификации разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.

Добавить комментарий

Поиск по сайту