Можливості та вигоди Візуального пошуку (Visual Search) для бізнесу

Як ми вже писали раніше, системи візуального пошуку зараз привертають увагу всіх великих гравців ринку e-commerce. І вже через 3 роки інтернет-майданчики, впровадили цю опцію, збільшать прибуток мінімум на 30%, а ті, хто не піде в ногу з часом, залишаться далеко позаду.

Якщо ви поки не розумієте яким саме чином Visual Search може бути корисний для вашого бізнесу, ми зібрали приклади кейсів використання систем візуального пошуку і їх можливостей.

Кастомний додаток від Slyce для модного шоу Tommyland

Кастомний додаток створювався компанією Slyce спеціально під велике модне шоу Tommyland від Tommy Hilfiger з добре продуманою маркетинговою стратегією. Шоу пройшло в Лос-Анжелесі 9 лютого 2017 року за девізом «Бачиш - купуй» і було другим за рахунком досвідом прямого зіткнення бренду і покупців. На великий огородженій території провели модний фестиваль, де на кожному кроці відбувалися цікаві активності, зіштовхуючи людей з брендом у всіх його проявах. Завантаживши додаток Tommyland, кожен відвідувач фестивалю ставав учасником масштабного дійства.

Механіка роботи програми зовні проста: він дозволяє знаходити товари, просто зробивши фото з білборда, в магазині або навіть включивши камеру в режимі реального часу поки моделі проходять по подіуму. Завдяки тому, що додаток пов'язаний з e-commerce платформою Tommy Hilfiger, він швидко розпізнає одяг на фото і переводить покупця на посилання для покупки.

Додаток розпізнає зображення в 2D (точність розпізнавання 100%) і 3D (точність розпізнавання 93%) форматах, при будь-якому освітленні (що важливо для модельних шоу, де багато візуальних ефектів), з маленької чи великого відстані та будь-якого кута зйомки. «Розбирає» загальний look моделі на складові, і дозволяє придбати кожен предмет одягу окремо. Також воно дає користувачам можливість зберегти образи, які подобаються, а потім перейти до покупки в зручний час.

Користь для бізнесу:

Цей підхід дозволяє перетворити будь-яку офлайн-активність і офлайн-майданчик (вітрину магазину, подіум, сцену і т.д.) в шоу-рум, використавши звичку сучасних користувачів купувати товари онлайн. А оскільки більшість покупок здійснюється на емоціях, є можливість запускати «тимчасові акції» на знижки: рівно стільки, скільки триває шоу, фестиваль і т.д.

Візуальний пошук від Deepomatic

Deepomatic – один із проектів Microsoft, а саме підрозділу, що займається штучним інтелектом. Вони створили кілька додатків для різних цілей, пов'язаних з обробкою відео і фотозображень, що працюють на інтерфейсі Deepomatic API.

Вже на сьогодні візуальний пошук Deepomatic API може розпізнати безліч спеціалізованих об'єктів: одяг, взуття, меблі, складові урбаністичних пейзажів (машини, перехожі, дорожні знаки). Система дозволяє знаходити і розпізнавати конкретні, задані заздалегідь об'єкти. Крім того, вона здатна знаходити зображення по їх текстовому опису, який сама ж і робить, а не по мітках, заданих при його завантаженні в інтернет. Наприклад, досить ввести в пошук «Собака, яка сидить на пляжі біля одної собаки», і отримаєте саме таке зображення.

Визуальный поиск

https://www.slideshare.net/

Також система здатна надавати зображенням заданий стиль. Наприклад, якщо взяти зображення конкретного міського пейзажу і задати йому стиль картини Ван Гога - на виході отримаєте наступний результат.

Передача стиля

https://www.slideshare.net/

Практичне застосування для бізнесу і не тільки:

Deepomatic API дозволяє інтегрувати можливості глибокого навчання і комп'ютерного зору в будь-який проект. По суті, це зумовлена модель з використанням штучного інтелекту, яку можна довчитися під ваші потреби. Це означає, що не потрібно створювати власний алгоритм для розпізнавання образів, досить «згодувати» вже створеного алгоритму сотні готових зображень, і він швидко навчиться.

Візуальний пошук від Deepomatic API можна використовувати для різних сфер:

створення кіно, комп'ютерних ігор
автоматичного сортування відходів або визначення шлюбу на заводський лінії складання без людської участі
у військовій сфері, щоб розпізнати зброю ворога, зафіксоване на фото з супутника тощо
і, як бонус, для автоматичного створити сприятливі фотоальбому з кращих фотографій вашого відпустки

Також можна створити будь-яку систему, налаштовану на розпізнавання об'єктів, корисних для вашого бізнесу. Як ми зробили з замовником «Ваш Пульт».

Amazon Rekognition Video: розпізнавання об'єктів відео

Від розпізнавання зображень перейдемо до ще більш складної технології, яка вже в повній мірі реалізована за допомогою штучного інтелекту. Розпізнавання відео - новий крок у візуальному пошуку і великий прорив, адже він включає в себе не тільки рішення всіх складнощів, пов'язаних з розпізнаванням фото, але і необхідність враховувати весь контекст: що було до і що сталося після конкретного знятого на відео моменту. Amazon Rekognition Video – API, швидко аналізує будь-які зображення і відео, що зберігаються в Amazon S3.

Amazon Rekognition Video створений спеціально для роботи з зображеннями фізичних об'єктів, вміє виявляти і розпізнавати текст на зображеннях, наприклад, назви вулиць, написи, назви продуктів і номерні знаки автомобілів. Сервіс також вміє розпізнавати об'єкти, людей, текст, сцени і дії.

Одна з цікавих можливостей сервісу - відстеження переміщень на відео. Її застосування ми опишемо трохи нижче. Також є можливість розпізнавання осіб для ідентифікації користувачів, що дозволить пропонувати кожному клієнту найбільш релевантний контент. Важливий бонус: за допомогою докладних міток, проставлених під час розпізнавання відео, система може розпізнавати підозрілий або невідповідний контент і блокувати його.

Практичне застосування для бізнесу і не тільки:

Безпека. Впроваджена в систему «розумний будинок» Amazon Rekognition Video може розпізнавати особистість того, хто наблизився до вхідних дверей і або пропустити його, чи ні;

Чесні результати спортивних змагань. Система здатна відстежувати всі переміщення кожного зі спортсменів під час матчу, бою або інший спортивної активності;
Поліцейські розслідування. Система може впізнати особу злочинця, якщо його дані хоча б один раз «засвітилися» в базі;
Впізнання знаменитостей та інших публічних особистостей. Для миттєвої реакції ЗМІ в разі цікавих і політично важливих подій.

Також сервіс дає можливість вбудовувати в додатки аналітику зображень і відео. Це можливо завдяки глибокому навчання нейронних мереж (які, до того ж, продовжують безперервно навчатися і постійно покращують результати).

Cloudsight – текстовий опис зображень

Ще один продукт, який здійснює візуальний пошук і розпізнає зображення – Cloudsight. Унікальність системи в тому, що вона здатна описувати те, що зображено на картинці таким чином, як би це могла зробити жива людина. У будь якому разі, так стверджують розробники.

Виглядати це повинно так: ви завантажуєте в систему зображення, вона його розпізнає і категоризує об'єкти на ньому, автоматично визначає вміст і теги. Виходячи з категорії об'єкта і його властивостей, система розуміє контекст і те, що відбувається і дає його опис.

Застосування для бізнесу і не тільки

Така система, при її коректній роботі, дозволить значно економити на копірайтерах, завдання яких - наповнювати сайти описом продукту. Також для маркетплейсов і мерчантів більше не буде необхідності описувати кожен продукт, створювати його опис та продумувати SEO-заголовки. Досить буде завантажити фото, а далі система впорається сама.

Також, при подальшому розвитку, її можна використовувати на заміну журналістам, наприклад, при створенні репортажів, де важливо чітко і детально описувати події, не спотворюючи їх призмою власного сприйняття журналіста і дотримуючись повної об'єктивності. Також система дозволить не ризикувати життями реальних людей, роблячи репортажі з гарячих точок на підставі супутникових знімків і відео, знятих дронами.

Поки що розробка доступна англійською мовою. Для українського бізнесу і країн СНД потрібно розробляти окремі алгоритми, що ми в Evergreen із задоволенням зробимо для вас.

Модерація контенту на підставі штучного інтелекту від Clarifai

Clarifai – платформа на базі штучного інтелекту, здатна розпізнавати понад 11 тисяч різних об'єктів на фото і відео. Позиціонується як система для модерації та видалення небажаного текстового або відеоконтенту з вашої платформи. Допоможе користувачам легше знаходити ваші відео і зображення, а також запропонує клієнтам продукти, схожі на ті, якими вони вже цікавилися. Власникам бізнесу допоможе зберегти нерви, час і репутацію бренду, вчасно видаляючи всю небажану інформацію

Clarifai можна використовувати в двох форматах: тільки машинна модерація або машинна модерація з людською перевіркою. Легко інтегрується в вашу систему, не вимагаючи при цьому ручного налаштування досвідченим програмістом.

Практичне застосування для бізнесу

Clarifai може все те, що і інша система розпізнавання, але основна фішка в тому, що вона здатна автоматично знаходити нецензурщину і спам-фото, які можуть закинути на ваш інтернет-магазин конкуренти або боти. Також буває, що на сайті, що продає один продукт, користувачі завантажують в коментарях фотографії товарів конкурентів або посилання на них. З цим продуктом подібне стає неможливим.

Розпізнавання образів та модерація візуального контенту від Imagga

Як стверджують її творці, Imagga - платформа, яка допомагає бізнесам розуміти і монетизувати візуальний контент. Що розпізнає Imagga? Наприклад, чи є завантажена картинка макрофото, фотографією автомобіля або інтер'єру, вулиці, архітектурної споруди або пейзажу.

Imagga API можна використовувати для сортування ваших фотографій або для тренування моделі «з нуля». Наприклад, ви продаєте автомобілі. Система вже вміє розпізнавати авто, але ви можете «довчити» її розуміти, зображена машина фронтально, задньою або бічною стороною. Якщо ви продаєте, наприклад, тканини, її можна навчити розпізнавати кольори і принти.

Цікава особливість: додаток робить упор, скоріше, на колір, ніж на саме зображення (зображення в другу чергу). Наприклад, завантаживши в систему фото яскравого заходу, ви отримаєте десятки варіантів фотографій в тій же кольоровій гамі, де буде не тільки захід, але і літак на тлі заходу, будівництво на тлі заходу, діти, що грають на тлі заходу і т.д. Головний принцип - витримана колірна гамма.

Відповідно, завантаживши фото жовтої сукні, ви отримаєте не тільки інші варіанти суконь, а й решти одягу такого ж кольору.

У Imagga також є можливість пошуку по схематичному зображенні того, що вам потрібно. Наприклад, замість того, щоб завантажити фото із зображенням заходу, можна завантажити звичайний малюнок з Paint, де фон залитий помаранчевим і намальовано жовте коло, що символізує сонце. По ряду ознак система сприйме це як фотографію яскравого заходу.

Цю програму можна використовувати для креативних рішень за все, що пов'язано зі кольором. Наприклад, радити музику, виходячи з улюбленого кольору, визначати настрій, виходячи з обраного кольору і т.д. Продукт був готовий ще в 2014 році, але його бізнес-застосування тривалий час не було до кінця незрозуміло. Настільки, що творці тоді ж заснували премію в $2300 за найбільш креативну пропозицію використання їхнього продукту.

Користь для бізнесу

Imagga здатна автоматично створювати прев`ю товарів на підставі завантажених відео. Платформа автоматично витягує з фото інформацію про колір, композицію, визначає категорію продукту. Також з її допомогою можна автоматично створювати опис товару (як і з Cloudsight) і модерувати відгуки.

Розробка з використанням візуального пошуку від Evergreen

На сьогоднішній день розробка систем візуального пошуку знаходиться на вістрі технологій AI. У нашої команди вже є досвід роботи з такими системами, ми використовували їх для створення сервісу для клієнта «Ваш пульт». Однак створення платформ з можливістю візуального пошуку - величезна і поки ще мало заповнена ніша.

Хочете бути одним з перших, хто використовує її переваги, щоб обігнати конкурентів? Звертайтесь до нас. Ми створимо систему, яка принесе максимальну користь для вашого бізнесу.

#Машинне навчання #Нейронні мережі #Розпізнавання образів

11.02.2019

Зображення, використані в статті, були взяті з відкритих джерел і використовуються як ілюстрації.

Можливості систем візуального пошуку

Кастомний додаток від Slyce для модного шоу Tommyland

Користь для бізнесу:

Візуальний пошук від Deepomatic

Практичне застосування для бізнесу і не тільки:

Amazon Rekognition Video: розпізнавання об'єктів відео

Практичне застосування для бізнесу і не тільки:

Cloudsight – текстовий опис зображень

Застосування для бізнесу і не тільки

Модерація контенту на підставі штучного інтелекту від Clarifai

Практичне застосування для бізнесу

Розпізнавання образів та модерація візуального контенту від Imagga

Користь для бізнесу

Розробка з використанням візуального пошуку від Evergreen