Сфера Machine Learning становится одной из самых высокооплачиваемой в IT. Вместе с ней появился MLOps. Вот вы захотели войти в эту сферу и думаете с чего начать, какие ключевые слова требуются для хорошего резюме. Возможно вы встретили тот стэк технологий, который изображен в заголовке.
А не многовато ли надо знать для профессии MLOps? Половина логотипов и вовсе незнакома людям, которые работают в этой сфере.
Но даже это не конец. Взгляните на инструменты MLOps, о которых упоминает Matt Turck в своей статье. Картинка ещё более ужасающая:
Давайте же разберемся, почему существует такой хаос в MLOps.
Текущее состояние
Как мы уже убедились, инструментов в этой сфере изрядное количество. Больше профессионалов согласятся с тем, что отслеживание моделей машинного обучения — очень важная часть работы и требует надежности и производительности. Вот вы захотели выбрать себе провайдеров, которые бы обеспечивали эти возможности. Уже можно назвать 6 различных опций: Fiddler, Arize, Evidently, Whylabs, Gantry, Arthur. Мы даже при этом не упомянули инструменты, которые предназначены только для отслеживания.
Конечно, иметь большой выбор — это хорошо, но не когда время поджимает, и вы должны оценить, какой подойдет лучше под ваши метрики. Но с отслеживанием, в большинстве случаев, понятно, что делать. А вот с другими инструменты оценить сложнее.
Стало популярным среди крупных компаний создавать свой собственный стэк MLOps в виде так называемых магазинов. И вот у нас есть магазин моделей, магазин признаков, магазин метрик.
Как видим сообщество очень креативно, что придумало множество синонимов слову база данных.
Тем не менее, дисциплина молодая, поэтому придет время и её как-нибудь стандартизируют в течении 5–10+ лет.
Всё то множество технологий может не пригодиться для вашей ситуации. Все эти рекламы о мгновенной обработке петабайтах данных работают на крупные компании. Другие же не имеют такой возможности и не обязаны соблюдать такие требования. Вам, как MLOps-специалисту, нужно самому определить стратегию развития на основании масштаба компании.
В этой ситуации новичкам в MLOps можно порекомендовать следующее:
- Найти специалиста, который чувствует себя как рыба в воде, и позадавать ему вопросы.
- Хорошо обдумать проблему и попытаться решить её уже на основании знакомых технологий, не отвлекаясь на тот зоопарк инструментов и платформ.
- Провести много времени за построением реальных систем и “набить шишки”.
Машинное обучение в Apache Spark
Код курса
MLSP
Ближайшая дата курса
по запросу
Продолжительность
16 ак.часов
Стоимость обучения
48 000 руб.
Эти три рекомендации покрывает наш курс «Разработка и внедрение ML-решений», который проходит в лицензированном учебном центре обучения и повышения квалификации разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.