Візуальний пошук як невід'ємна частина пошуку в майбутньому
#Машинне навчання #Нейронні мережі #Розпізнавання образів #e-Commerce
#Машинне навчання #Нейронні мережі #Розпізнавання образів #e-Commerce
Сучасне суспільство дедалі більше схильне передавати інформацію образами. Замість лонгрідов – відео, замість словесного опису емоцій – смайли, емоджі і гіфки. 62% тих, кого називають мілленіалами, віддають перевагу візуальному пошуку перед будь-якою іншою технологією. Це не дивно, адже 90% інформації в людському мозку і так зосереджено в візуальному вигляді, і ми завжди шукаємо найбільш зручний спосіб передачі образів.
У попередній статті «Візуальний пошук – революція в e-commerce» ми говорили про те, яким чином візуальний пошук кардинально змінює взаємодію покупців із брендами і світ e-commerce в принципі. У цій статті розглянемо несподівані області й системи, в яких уже зараз активно застосовують Visual Search.
Візуальний пошук активно використовують такі ритейлери: ASOS, eBay, Neimann Marcus, Ted Baker, Blippar, EasyJet, Levi’s, Disney, Walmart, Salesforce, Syte, Houseology CarStory, Snapchat’s, Farfetch, Marks, Pinterest, Amazon и др.
Концепт GrokStyle дуже простий: наводиш камеру на будь-який предмет меблів у будинку, в кафе, магазині або навіть у друкованому каталозі, і відразу ж отримуєш кілька посилань на його покупку. По суті система ідентифікує предмет меблів – диван, стілець, килим, лампу – знаходить цей об'єкт серед представлених у її внутрішньому каталозі варіантів, і відразу ж пропонує його купити.
Новизна програми в тому, що вона дозволяє користувачу відразу ж «приміряти» як цей предмет інтер'єру виглядатиме у нього вдома. І на додачу до нього пропонує схожі варіанти з різних цінових категорій, що розширює можливості покупки. Цей підхід, в який спершу мало хто вірив, виявився настільки цікавим для ринку меблів, що GrokStyle відразу ж зацікавилися в IKEA.
Для тих, хто хоче купити старий автомобіль, пошук чотириколісного друга спростили за допомогою візуального пошуку на ресурсі CarStory. Виглядає все так: ви можете просто сфотографувати будь-який вподобаний автомобіль, навіть не знаючи його марки й моделі, а система знайде на сайті таку ж модель, представлену до продажу. А також запропонує інші варіанти, схожі за кольором, зовнішнім виглядом, ціною позиції.
Таким чином будь-яка парковка в місті або навіть країні стає віртуальним автосалоном, який за секунду переводить людину в онлайн-магазин автомобілів. При цьому на сервісі також присутня інформація про стан кожного автомобіля, його вік, загальний пробіг, середній пробіг за рік. А використання пошуку за локацією дозволяє знайти автомобілі поблизу від себе.
Ще кілька років тому компанія Salesforce, яка виробляє CRM-системи для зручного ведення бізнесу, представила продукт Einstein AI – розумний CRM-асистент. Його суть у тому, щоб об'єднувати інформацію з усіх відділів компанії, а потім на їх підставі аналізувати портрет клієнта, всі точки його взаємодії з бізнесом і передбачати що саме буде йому цікаво в подальшому. Таким чином бізнеси можуть отримати максимально точну інформацію про своїх клієнтів і можливість поліпшити користувальницький досвід.
У березні 2017 року Salesforce запустили Einstein Vision – візуальний пошук, впроваджений у систему CRM. Його завдання – допомагати користувачам знайти продукти, які найбільше підходять їхнім побажанням, і легко здійснювати їх покупку. Цікаво, що використовувати такий сервіс можна навіть у таких складних областях як покупка/продаж нерухомості.
Однак за допомогою Einstein Vision процес стає набагато швидшим і простішим для покупців, а також зручнішим у контролі для брокерів. Наприклад, система класифікує всі будинки, виставлені на продаж, по конкретним ознаками: "Вдома в стилі хай-тек", "Дуплекси", "Будинки на 3 спальні", "Будинки на два поверхи" і ін. Виходячи із запиту користувача, система пропонує йому будинку, відповідні його запитом, виставлені на продаж. А також інформацію про них: місцезнаходження, вартість, кількість спалень і ванних кімнат. Аналітики при цьому отримали можливість аналізувати який тип будинків користується попитом в якому регіоні, а це дозволяє формувати актуальну ціну і швидко реагувати на зміни в поведінці покупців.
Завдяки можливостям ШІ сервіс передбачає яка пропозиція сподобається клієнту на підставі його попередніх запитів і пропонує розглянути потенційно придатні будинки в рекомендаціях. У той же час брокери, що працюють із даною нерухомістю, можуть бачити зацікавленість конкретного клієнта в конкретному будинку, і на підставі цього пропонувати знижки. Для клієнта це виглядає наступним чином: якщо ціна на будинок змінюється, система надсилає йому повідомлення і мотивує до покупки.
Google Lens позиціонується як система, що дає відповіді на всі питання про світ навколо нас. Її головне призначення – відповідати на питання «Що я зараз бачу перед собою». Це відповіді, за якими не потрібно звертатися до Вікіпедії або на будь-які сторонні ресурси – вони просто з'являються на екрані вашого смартфона коли потрібні.
Google Lens підтримується камерами пристроїв наступних марок: LGE, Motorola, Xiaomi, Sony Mobile, HMD/Nokia, Transsion, TCL, OnePlus, BQ, Asus, Google Pixel.
Власне, система працює в двох пов'язаних між собою напрямках «текст-картинка». Наприклад, ви зустрічаєте в меню ресторану незнайому назву, наводите на назву камеру, клацає в потрібному місці – і отримуєте фото страви. Також працює навпаки: робите фото страви – отримуєте його назва та короткий опис.
Google Lens також працює в режимі реального часу. Це означає, що вам не потрібно робити фото об'єкта і завантажувати його в систему. Результати відображаються відразу ж після того, як ви наведете камеру на об'єкт. Система позначає, що впізнала якийсь об'єкт кружком. Подвійний клік на кружок виводить інформацію на екран. Точно таким же чином Google Lens може переводити будь-який текст у реальному часі: досить лише скопіювати його та натиснути на відповідну кнопку, як система тут же сама зв'язується з онлайн-словниками Google і видає результат.
Пошукова система Bing від Microsoft на даний час займає 2-е місце в списку найбільш популярних пошукових сайтів за обсягом трафіку. Характерною особливістю системи є можливість показувати перегляд результатів пошуку на одній сторінці. А також можливість запрограмувати її на пошук конкретних речей. Наприклад, за фото страви знаходити заклади поблизу, де його готують.
Bing працює на системі Bing Visual Search і дозволяє не лише знайти об'єкти меблів або одяг, як багато інших інструментів візуального пошуку. Він здатен впізнати на фото знаменитостей, відомі споруди, предмети мистецтва або інші схожі об'єкти. Система підтримує розпізнавання не тільки об'єктів, але й тексту.
Система навчена за допомогою ШІ таким чином, щоб видавати найбільш імовірну, відповідно до теми вашого пошуку, відповідь. Наприклад, завантаживши фото собаки, ви, скоріше за все, отримаєте опис її породи; фото пам'ятника або відомого місця призведе до відповіді у вигляді назви й опису цього місця чи пам'ятника; фото предмета одягу – до посилань на покупку цієї речі або схожих на неї. Більш того, Bing також сортує рекомендації, виходячи зі способу застосування об'єкта на фото. Наприклад, якщо завантажити фото фрукта або овоча, система запропонує рецепт приготування. У випадку з квіткою – опише особливості догляду за нею.
Ще одну систему розпізнавання об'єктів представив Google. Система називається Cloud Vision і розпізнає не тільки об'єкти, але і обличчя, а також емоції: радість, злість, здивування та печаль. Також Google навіть запустили власний платний сервіс для навчання систем на базі штучного інтелекту: AutoML Vision Beta
Ми в Evergreen розробили власну систему візуального пошуку і розпізнавання образів на базі нейромереж для клієнта «Ваш Пульт». Детальніше про те, яким чином реалізовувалася задумка читайте тут. Якщо хочете впровадити систему візуального пошуку в ваш бізнес – напишіть нам. І пам'ятайте, вже сьогодні 36% всіх користувачів інтернету використовують для покупки товарів візуальний пошук. І їх кількість буде лише збільшуватися.
І наостанок...
Несподіваний кейс у даній збірці, але однозначно вартий уваги. У серпні 2018 року креативне агентство Redpepper представило робота, навченого за допомогою систем ШІ знаходити конкретну зображену людину в будь-яких запропонованих обставинах. Відбувається це наступним чином: металева рука-робот обладнана системою Vision Camera Kit, здатною проводити розпізнавання облич.
Робот розглядає сторінки з усілякими зображеннями облич і аналізує їх на схожість з обличчям персонажа Вальдо, розпізнавати яке його тренували. Якщо рівень розпізнавання вище 95 відсотків, рука-робот вказує на обличчя, яке, на її думку, належить Вальдо.
Ось як це виглядає:
Важливість цього винаходу в тому, що всього після тижня навчання робот почав безпомилково розпізнавати зображення Вальдо лише за 4,45 секунди і вказувати точно на нього. Поки невідомо яким саме чином візуальний пошук людини буде використаний у бізнесі, але з огляду на швидкість, з якою навчаються машини, легко зрозуміти, що застосування таким можливостям знайдеться дуже швидко.