Як ми вже писали раніше, системи візуального пошуку зараз привертають увагу всіх великих гравців ринку e-commerce. І вже через 3 роки інтернет-майданчики, впровадили цю опцію, збільшать прибуток мінімум на 30%, а ті, хто не піде в ногу з часом, залишаться далеко позаду.
Якщо ви поки не розумієте яким саме чином Visual Search може бути корисний для вашого бізнесу, ми зібрали приклади кейсів використання систем візуального пошуку і їх можливостей.
Кастомний додаток створювався компанією Slyce спеціально під велике модне шоу Tommyland від Tommy Hilfiger з добре продуманою маркетинговою стратегією. Шоу пройшло в Лос-Анжелесі 9 лютого 2017 року за девізом «Бачиш - купуй» і було другим за рахунком досвідом прямого зіткнення бренду і покупців. На великий огородженій території провели модний фестиваль, де на кожному кроці відбувалися цікаві активності, зіштовхуючи людей з брендом у всіх його проявах. Завантаживши додаток Tommyland, кожен відвідувач фестивалю ставав учасником масштабного дійства.
Цей підхід дозволяє перетворити будь-яку офлайн-активність і офлайн-майданчик (вітрину магазину, подіум, сцену і т.д.) в шоу-рум, використавши звичку сучасних користувачів купувати товари онлайн. А оскільки більшість покупок здійснюється на емоціях, є можливість запускати «тимчасові акції» на знижки: рівно стільки, скільки триває шоу, фестиваль і т.д.
Deepomatic – один із проектів Microsoft, а саме підрозділу, що займається штучним інтелектом. Вони створили кілька додатків для різних цілей, пов'язаних з обробкою відео і фотозображень, що працюють на інтерфейсі Deepomatic API.
https://www.slideshare.net/
Також система здатна надавати зображенням заданий стиль. Наприклад, якщо взяти зображення конкретного міського пейзажу і задати йому стиль картини Ван Гога - на виході отримаєте наступний результат.
https://www.slideshare.net/
Deepomatic API дозволяє інтегрувати можливості глибокого навчання і комп'ютерного зору в будь-який проект. По суті, це зумовлена модель з використанням штучного інтелекту, яку можна довчитися під ваші потреби. Це означає, що не потрібно створювати власний алгоритм для розпізнавання образів, досить «згодувати» вже створеного алгоритму сотні готових зображень, і він швидко навчиться.
Візуальний пошук від Deepomatic API можна використовувати для різних сфер:
Також можна створити будь-яку систему, налаштовану на розпізнавання об'єктів, корисних для вашого бізнесу. Як ми зробили з замовником «Ваш Пульт».
Від розпізнавання зображень перейдемо до ще більш складної технології, яка вже в повній мірі реалізована за допомогою штучного інтелекту. Розпізнавання відео - новий крок у візуальному пошуку і великий прорив, адже він включає в себе не тільки рішення всіх складнощів, пов'язаних з розпізнаванням фото, але і необхідність враховувати весь контекст: що було до і що сталося після конкретного знятого на відео моменту. Amazon Rekognition Video – API, швидко аналізує будь-які зображення і відео, що зберігаються в Amazon S3.
Amazon Rekognition Video створений спеціально для роботи з зображеннями фізичних об'єктів, вміє виявляти і розпізнавати текст на зображеннях, наприклад, назви вулиць, написи, назви продуктів і номерні знаки автомобілів. Сервіс також вміє розпізнавати об'єкти, людей, текст, сцени і дії.
Одна з цікавих можливостей сервісу - відстеження переміщень на відео. Її застосування ми опишемо трохи нижче. Також є можливість розпізнавання осіб для ідентифікації користувачів, що дозволить пропонувати кожному клієнту найбільш релевантний контент. Важливий бонус: за допомогою докладних міток, проставлених під час розпізнавання відео, система може розпізнавати підозрілий або невідповідний контент і блокувати його.
Також сервіс дає можливість вбудовувати в додатки аналітику зображень і відео. Це можливо завдяки глибокому навчання нейронних мереж (які, до того ж, продовжують безперервно навчатися і постійно покращують результати).
Ще один продукт, який здійснює візуальний пошук і розпізнає зображення – Cloudsight. Унікальність системи в тому, що вона здатна описувати те, що зображено на картинці таким чином, як би це могла зробити жива людина. У будь якому разі, так стверджують розробники.
Виглядати це повинно так: ви завантажуєте в систему зображення, вона його розпізнає і категоризує об'єкти на ньому, автоматично визначає вміст і теги. Виходячи з категорії об'єкта і його властивостей, система розуміє контекст і те, що відбувається і дає його опис.
Така система, при її коректній роботі, дозволить значно економити на копірайтерах, завдання яких - наповнювати сайти описом продукту. Також для маркетплейсов і мерчантів більше не буде необхідності описувати кожен продукт, створювати його опис та продумувати SEO-заголовки. Досить буде завантажити фото, а далі система впорається сама.
Також, при подальшому розвитку, її можна використовувати на заміну журналістам, наприклад, при створенні репортажів, де важливо чітко і детально описувати події, не спотворюючи їх призмою власного сприйняття журналіста і дотримуючись повної об'єктивності. Також система дозволить не ризикувати життями реальних людей, роблячи репортажі з гарячих точок на підставі супутникових знімків і відео, знятих дронами.
Поки що розробка доступна англійською мовою. Для українського бізнесу і країн СНД потрібно розробляти окремі алгоритми, що ми в Evergreen із задоволенням зробимо для вас.
Clarifai – платформа на базі штучного інтелекту, здатна розпізнавати понад 11 тисяч різних об'єктів на фото і відео. Позиціонується як система для модерації та видалення небажаного текстового або відеоконтенту з вашої платформи. Допоможе користувачам легше знаходити ваші відео і зображення, а також запропонує клієнтам продукти, схожі на ті, якими вони вже цікавилися. Власникам бізнесу допоможе зберегти нерви, час і репутацію бренду, вчасно видаляючи всю небажану інформацію
Clarifai можна використовувати в двох форматах: тільки машинна модерація або машинна модерація з людською перевіркою. Легко інтегрується в вашу систему, не вимагаючи при цьому ручного налаштування досвідченим програмістом.
Clarifai може все те, що і інша система розпізнавання, але основна фішка в тому, що вона здатна автоматично знаходити нецензурщину і спам-фото, які можуть закинути на ваш інтернет-магазин конкуренти або боти. Також буває, що на сайті, що продає один продукт, користувачі завантажують в коментарях фотографії товарів конкурентів або посилання на них. З цим продуктом подібне стає неможливим.
Як стверджують її творці, Imagga - платформа, яка допомагає бізнесам розуміти і монетизувати візуальний контент. Що розпізнає Imagga? Наприклад, чи є завантажена картинка макрофото, фотографією автомобіля або інтер'єру, вулиці, архітектурної споруди або пейзажу.
Imagga API можна використовувати для сортування ваших фотографій або для тренування моделі «з нуля». Наприклад, ви продаєте автомобілі. Система вже вміє розпізнавати авто, але ви можете «довчити» її розуміти, зображена машина фронтально, задньою або бічною стороною. Якщо ви продаєте, наприклад, тканини, її можна навчити розпізнавати кольори і принти.
Цікава особливість: додаток робить упор, скоріше, на колір, ніж на саме зображення (зображення в другу чергу). Наприклад, завантаживши в систему фото яскравого заходу, ви отримаєте десятки варіантів фотографій в тій же кольоровій гамі, де буде не тільки захід, але і літак на тлі заходу, будівництво на тлі заходу, діти, що грають на тлі заходу і т.д. Головний принцип - витримана колірна гамма.
Відповідно, завантаживши фото жовтої сукні, ви отримаєте не тільки інші варіанти суконь, а й решти одягу такого ж кольору.
У Imagga також є можливість пошуку по схематичному зображенні того, що вам потрібно. Наприклад, замість того, щоб завантажити фото із зображенням заходу, можна завантажити звичайний малюнок з Paint, де фон залитий помаранчевим і намальовано жовте коло, що символізує сонце. По ряду ознак система сприйме це як фотографію яскравого заходу.
Цю програму можна використовувати для креативних рішень за все, що пов'язано зі кольором. Наприклад, радити музику, виходячи з улюбленого кольору, визначати настрій, виходячи з обраного кольору і т.д. Продукт був готовий ще в 2014 році, але його бізнес-застосування тривалий час не було до кінця незрозуміло. Настільки, що творці тоді ж заснували премію в $2300 за найбільш креативну пропозицію використання їхнього продукту.
Imagga здатна автоматично створювати прев`ю товарів на підставі завантажених відео. Платформа автоматично витягує з фото інформацію про колір, композицію, визначає категорію продукту. Також з її допомогою можна автоматично створювати опис товару (як і з Cloudsight) і модерувати відгуки.
На сьогоднішній день розробка систем візуального пошуку знаходиться на вістрі технологій AI. У нашої команди вже є досвід роботи з такими системами, ми використовували їх для створення сервісу для клієнта «Ваш пульт». Однак створення платформ з можливістю візуального пошуку - величезна і поки ще мало заповнена ніша.
Хочете бути одним з перших, хто використовує її переваги, щоб обігнати конкурентів? Звертайтесь до нас. Ми створимо систему, яка принесе максимальну користь для вашого бізнесу.