SEER 10B: самая большая модель компьютерного зрения

Команда Meta AI анонсировала выход новой открытой модели компьютерного зрения под названием SEER (SElf-SupERvised) 10B. Особенность этой модели в том, что в ней задействовано самообучения (self-supervised), т.е. она обучаете на случайных изображениях из Интернета без помощи со стороны людей и без каких-либо меток. Изображение поступает на обычные алгоритмы Computer Vision, которые генерирует выходное изображение.

Первый анонс SEER состоялся прошлой весной [1]. Количество параметров с тех пор увеличилось с 1 до 10 млрд. Теперь это самая крупная модель в области компьютерного зрения.

График, который показывает, как за год выросло количество парметров с 1 миллиарда до 10 — Как выросло количество параметров в SEER

Из-за такого размера SEER может извлекать признаки более высокого качества и находить связи между объектами в датасетах с триллионами случайных изображений. Такая модель справляется с проблемами, с которыми встречаются модели без учителя (unsupervised). SEER обходит по производительности другие модели на основании разработанных оценках Meta AI research [2]. Традиционные системы компьютерного зрения обучаются на изображениях, собранных в США и богатых странах Европы, поэтому они плохо работают с изображениями из других мест. Модель SEER же в этом плане собирает данные ото всюду, также она показывает лучшие характеристика с учетом пола, цвета кожи и возраста. Она даже может определить геоположение с высокой точностью. Ей под силу справиться с определением животных на художественной иллюстрации, разобраться с дефектами: камуфляжем, размытием, движением, необычной перспективой.

Больше скорости и производительности

Разработчики изучали и проводили валидацию на более чем 50 оценках производительности, включая точность, робастность, мелкозернистое распознавание, разные датасеты для классификации с медицинскими, спутниковыми, отсканированными изображениями. SEER 10B превзошла все модели с учителем и с самообучением в тесте ImageNet с 70% точностью. А также 90.6% в тесте CopyDays.

SEER умеет находить скрытые детали. Так, например, несмотря на то, что модель обучена только на изображениях без информации о месторасположении или других метаданных, она может группировать схожие характеристики различных культур. Например, тематика “свадьбы” со всего мира сгруппирована вместе в пространстве признаков.

Защита конфиденциальности

Последние [3] показывают, что некоторые модели уязвимы для извлечения ценной информации. В некоторых случаях злоумышленники могут выполнить запрос модели и реконструировать некоторые образцы из тренировочного датасета. Поэтому разработчики занимаются и безопасностью модели.

Computer vision на Python

Код курса

VISI

Ближайшая дата курса

по запросу

Продолжительность

40 ак.часов

Стоимость обучения

90 000 руб.

Если же вы хотите больше узнать о методах компьютерного зрения, то посетите наш курс «VISI: Computer vision на Python» в лицензированном учебном центре обучения и повышения квалификации разработчиков, менеджеров, архитекторов, инженеров, администраторов, Data Scientist’ов и аналитиков Big Data в Москве.

Смотреть расписание

Записаться на курс

Источники

Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

SEER 10B: самая большая модель компьютерного зрения

Больше скорости и производительности

Защита конфиденциальности

Computer vision на Python

Код курса

VISI

Ближайшая дата курса

по запросу

Продолжительность

40 ак.часов

Стоимость обучения

90 000 руб.

Добавить комментарий Отменить ответ

ООО “УЦ Коммерсант”

О компании

Документы

Проекты

Больше скорости и производительности

Защита конфиденциальности

Похожие публикации

Добавить комментарий Отменить ответ