Возможности и выгоды Визуального поиска (Visual Search) для бизнеса

Как мы уже писали ранее, системы визуального поиска сейчас привлекают внимание всех больших игроков рынка e-commerce. И уже через 3 года интернет-площадки, внедрившие данную опцию, увеличат прибыль минимум на 30%, а те, кто не пойдет в ногу со временем, останутся далеко позади.

Если вы пока не понимаете каким именно образом Visual Search может быть полезен для вашего бизнеса, мы собрали примеры кейсов использования систем визуального поиска и их возможностей.

Кастомное приложение от Slyce для модного шоу Tommyland

Кастомное приложение создавалось компанией Slyce специально под большое модное шоу Tommyland от Tommy Hilfiger с хорошо продуманной маркетинговой стратегией. Шоу прошло в Лос-Анжелесе 9 февраля 2017 года под девизом «Видишь – покупай» и было вторым по счету опытом прямого соприкосновения бренда и покупателей. На большой огражденной территории провели модный фестиваль, где на каждом шагу происходили интересные активности, сталкивая людей с брендом во всех его проявлениях. Скачав приложение Tommyland, каждый посетитель фестиваля становился участником масштабного действия.

Механика работы приложения внешне проста: оно позволяет находить товары, просто сделав фото с билборда, в магазине или даже включив камеру в режиме реального времени пока модели проходят по подиуму. Благодаря тому, что приложение соединено с e-commerce платформой Tommy Hilfiger, оно быстро распознает одежду на фото и переводит покупателя на ссылку для покупки.

Приложение распознает изображения в 2D (точность распознавания 100%) и 3D (точность распознавания 93%) форматах, при любом освещении (что важно для модельных шоу, где много визуальных эффектов), с маленького или большого расстояния и с любого угла съемки. «Разбирает» общий look модели на составляющие и позволяет приобрести каждый предмет одежды по отдельности. Также оно дает пользователям возможность сохранить образы, которые нравятся, а затем перейти к покупке в удобное время.

Польза для бизнеса:

Этот подход позволяет превратить любую офлайн-активность и офлайн-площадку (витрину магазина, подиум, сцену и т.д.) в шоу-рум, использовав привычку современных пользователей покупать товары онлайн. А поскольку большинство покупок совершается на эмоциях, есть возможность запускать «временные акции» на скидки: ровно столько, сколько длится шоу, фестиваль и т.д.

Визуальный поиск от Deepomatic

Deepomatic – один из проектов Microsoft, а именно подразделения, занимающегося искусственным интеллектом. Они создали несколько приложений для различных целей, связанных с обработкой видео и фотоизображений, работающих на интерфейсе Deepomatic API.

Уже на сегодня визуальный поиск Deepomatic API может распознать множество специализированных объектов: одежда, обувь, мебель, составляющие урбанистических пейзажей (машины, перехожие, дорожные знаки). Система позволяет находить и распознавать конкретные, заданные заранее объекты. Кроме того, она способна находить изображения по их текстовому описанию, которое сама же и делает, а не по метках, заданных при его загрузке в интернет. Например, достаточно ввести в поиск «Собака, которая сидит на пляже возле другой собаки», и получите именно такое изображение.

Визуальный поиск

https://www.slideshare.net/

Также система способна придавать изображениям заданный стиль. Например, если взять изображение конкретного городского пейзажа и задать ему стиль картины Ван Гога – на выходе получите следующий результат.

Передача стиля

https://www.slideshare.net/

Практическое применение для бизнеса и не только:

Deepomatic API позволяет интегрировать возможности глубокого обучения и компьютерного зрения в любой проект. По сути, это предопределенная модель с использованием искусственного интеллекта, которую можно доучить под ваши потребности. Это значит, что не нужно создавать собственный алгоритм для распознавания образов, достаточно «скормить» уже созданному алгоритму сотни готовых изображений, и он быстро научится.

Визуальный поиск от Deepomatic API можно использовать для различных сфер:

создания кино, компьютерных игр
автоматической сортировки отходов или определения брака на заводской линии сборки без человеческого участия
в военной сфере, чтобы распознать оружие врага, зафиксированное на фото со спутника и пр.
и, как бонус, для автоматического создания фотоальбома из лучших фотографий вашего отпуска

Также можно создать любую систему, настроенную на распознавание объектов, полезных для вашего бизнеса. Как мы сделали с заказчиком «Ваш Пульт».

Amazon Rekognition Video: распознавание объектов видео

От распознавания изображений перейдем к ещё более сложной технологии, которая уже в полной мере реализована при помощи искусственного интеллекта. Распознавание видео – новый шаг в визуальном поиске и большой прорыв, ведь он включает в себя не только решение всех сложностей, связанных с распознаванием фото, но и необходимость учитывать весь контекст: что было до и что случилось после конкретного снятого на видео момента. Amazon Rekognition Video – API, быстро анализирующий любые изображения и видео, хранящиеся в Amazon S3.

Amazon Rekognition Video создан специально для работы с изображениями физических объектов, умеет обнаруживать и распознавать текст на изображениях, например, названия улиц, надписи, названия продуктов и номерные знаки автомобилей. Сервис также умеет распознавать объекты, людей, текст, сцены и действия.

Одна из интересных возможностей сервиса – отслеживание перемещений на видео. Её применение мы опишем чуть ниже. Также есть возможность распознавания лиц для идентификации пользователей, что позволит предлагать каждому клиенту наиболее релевантный контент. Важный бонус: при помощи подробных меток, проставленных во время распознавания видео, система может распознавать подозрительный или неподходящий контент и блокировать его.

Практическое применение для бизнеса и не только:

Безопасность. Внедренная в систему «умный дом» Amazon Rekognition Video может распознавать личность того, кто приблизился к входным дверям и либо пропустить его, либо нет;

Честные результаты спортивных соревнований. Система способна отслеживать все перемещения каждого из спортсменов во время матча, боя или другой спортивной активности;
Полицейские расследования. Система может опознать личность преступника, если его данные хотя бы один раз «засветились» в базе;
Опознание знаменитостей и других публичных личностей. Для мгновенной реакции СМИ в случае интересных и политически важных событий.

Также сервис даёт возможность встраивать в приложения аналитику изображений и видео. Это возможно благодаря глубокому обучению нейронных сетей (которые, к тому же, продолжают непрерывно обучаться и постоянно улучшают результаты).

Cloudsight – текстовое описание изображений

Ещё один продукт, осуществляющий визуальный поиск и распознающий изображения – Cloudsight. Уникальность системы в том, что она способна описывать изображение на картинке таким образом, как бы это мог сделать живой человек. Во всяком случае так утверждают разработчики.

Выглядеть это должно следующим образом: вы загружаете в систему изображение, она его распознает и категоризирует объекты на нем, автоматически определяет содержимое и теги. Исходя из категории объекта и его свойств, система понимает контекст и происходящее и даёт его описание.

Применение для бизнеса и не только

Такая система, при её корректной работе, позволит значительно экономить на копирайтерах, задача которых – наполнять сайты описанием продукта. Также для маркетплейсов и мерчантов больше не будет необходимости описывать каждый продукт, создавать его описание и продумывать SEO-заголовки. Достаточно будет загрузить фото, а дальше система справится сама.

Также, при дальнейшем развитии, её можно использовать на замену журналистам, например, при создании репортажей, где важно четко и подробно описывать события, не искажая их призмой собственного восприятия журналиста и придерживаясь полной объективности. Также система позволит не рисковать жизнями реальных людей, делая репортажи из горячих точек на основании спутниковых снимков и видео, снятых дронами.

Пока что разработка доступна на английском языке. Для украинского бизнеса и стран СНГ нужно разрабатывать отдельные алгоритмы, что мы в Evergreen с удовольствием сделаем для вас.

Модерация контента на основании искусственного интеллекта от Clarifai

Clarifai – платформа на базе искусственного интеллекта, способная распознавать более 11 тысяч различных объектов на фото и видео. Позиционируется как система для модерации и удаления нежелательного текстового или видеоконтента с вашей платформы. Поможет пользователям легче находить ваши видео и изображения, а также предложит клиентам продукты, похожие на те, которыми они уже интересовались. Собственникам бизнеса поможет сохранить нервы, время и репутацию бренда, вовремя удаляя всю нежелательную информацию

Clarifai можно использовать в двух форматах: только машинная модерация или машинная модерация с человеческой проверкой. Легко интегрируется в вашу систему, не требуя при этом ручной настройки опытным программистом.

Практическое применение для бизнеса

Clarifai может всё то что и другая система распознавания, но основная фишка в том, что она способна автоматически находить нецензурщину и спам-фото, которые могут забросить на ваш интернет-магазин конкуренты или боты. Также бывает, что на сайте, продающем один продукт, пользователи загружают в комментариях фотографии товаров конкурентов или ссылки на них. С этим продуктом подобное становится невозможным.

Распознавание образов и модерация визуального контента от Imagga

Как утверждают её создатели, Imagga – платформа, помогающая бизнесам понимать и монетизировать визуальный контент. Что распознает Imagga? Например, является ли загруженная картинка макрофото, фотографией автомобиля или интерьера, улицы, архитектурного сооружения или пейзажа.

Imagga API можно использовать для сортировки ваших фотографий или для тренировки модели «с нуля». Например, вы продаете автомобили. Система уже умеет распознавать авто, но вы можете «доучить» её понимать, изображена ли машина фронтально, задней или боковой стороной. Если вы продаете, например, ткани, её можно научить распознавать цвета и принты.

Интересная особенность: приложение делает упор, скорее, на цвет, чем на само изображение (изображение вторично). Например, загрузив в систему фото яркого заката, вы получите десятки вариантов фотографий в той же цветовой гамме, где будет не только закат, но и самолёт на фоне заката, стройка на фоне заката, дети, играющие на фоне заката и т.д. Главный принцип – выдержанная цветовая гамма.

Соответственно, загрузив фото желтого платья, вы получите не только другие варианты платьев, но и остальной одежды такого же цвета.

В Imagga также есть возможность поиска по схематическом изображении того, что вам нужно. Например, вместо того, чтобы загрузить фото с изображением заката, можно загрузить обычный рисунок из Paint, где фон залит оранжевым и нарисован желтый круг, символизирующий солнце. По ряду признаков система воспримет это как фотографию яркого заката.

Приложение можно использовать для креативных решений всего, что связано со цветом. Например, советовать музыку, исходя из любимого цвета, определять настроение, исходя из выбранного цвета и т.д. Продукт был готов ещё в 2014 году, но его бизнес-применение длительное время не было до конца непонятно. Настолько, что создатели тогда же учредили премию в $2300 за наиболее креативное предложение использования их продукта.

Польза для бизнеса:

Imagga способна автоматически создавать превью товаров на основании загруженных видео. Платформа автоматически извлекает из фото информацию о цвете, композиции, определяет категорию продукта. Также с её помощью можно автоматически создавать описание товара (как и с Cloudsight) и модерировать отзывы.

Разработка с использованием визуального поиска от Evergreen

На сегодняшний день разработка систем визуального поиска находится на острие технологий AI. У нашей команды уже есть опыт работы с такими системами, мы использовали их для создания сервиса для клиента «Ваш пульт». Однако создание платформ с возможностью визуального поиска – огромная и пока ещё мало заполненная ниша.

Хотите быть одним из первых, кто использует её преимущества, чтобы обогнать конкурентов? Обращайтесь. Создадим систему, которая принесет максимальную пользу для вашего бизнеса.

#Машинное обучение #Нейронные сети #Распознавание образов

11.02.2019

Используемые в статье картинки взяты из открытых источников и используются как иллюстрации.

Возможности систем визуального поиска

Кастомное приложение от Slyce для модного шоу Tommyland

Польза для бизнеса:

Визуальный поиск от Deepomatic

Практическое применение для бизнеса и не только:

Amazon Rekognition Video: распознавание объектов видео

Практическое применение для бизнеса и не только:

Cloudsight – текстовое описание изображений

Применение для бизнеса и не только

Модерация контента на основании искусственного интеллекта от Clarifai

Практическое применение для бизнеса

Распознавание образов и модерация визуального контента от Imagga

Польза для бизнеса:

Разработка с использованием визуального поиска от Evergreen