Ми багато писали про машинне навчання і як застосовувати його у веб сайтах із користю для вашого бізнесу. Однак чим далі, тим більше відвідувачів вважають за краще взаємодіяти з компаніями через додатки на смартфонах і планшетах: для них це швидше і зручніше. А класичні AI-продукти занадто громіздкі для роботи з мобільними та веб додатками.
Тому виникла потреба в напівготових рішеннях, які можна впровадити в функціонал будь-якого продукту і просто використовувати. Одне з таких рішень, Firebase ML Kit недавно з'явилося на ринку на етапі бета-тестування. Давайте подивимося що воно пропонує, для кого може бути корисним і як ми можемо зробити краще.
Якісне машинне навчання для вирішення ваших завдань – справа тривала, трудомістка й затратна. Завдання коробкового рішення – надати вже готовий набір функцій, який можна просто інтегрувати в мобільний або веб додаток, внісши кілька рядків коду і доучувати його в процесі роботи.
Наочно продемонструємо різницю між навчанням AI «з нуля» і використанням готового «коробкового» продукту.
Перша спроба створити готове коробкове рішення вже відбулася. У 2018 році Firebase продемонстрували свою нову розробку: коробкові продукти для спрощення машинного навчання мобільних пристроїв. Згідно із задумом Firebase ML Kit для систем Android і iOS – зручний і простий у використанні пакет, що включає в себе відразу кілька функцій:
Всі функції продукту можуть бути доступні як у додатку, так і в хмарі через API (в іншому випадку обробка запиту вимагатиме більше часу, але дасть більш точний результат). Оскільки продукт іще новий і знаходиться на стадії бета-тестування, він вимагає допрацювань. Але ми вирішили вже сьогодні подивитися на його можливості і де їх можна використовувати.
Цю функцію, а разом із нею і розпізнавання штрихкодів компанія FitNow впровадила у власний додаток Lose It! Це програма, яка рахує калорії. Працює просто: достатньо вбити назву продукту або ж навести камеру на готову магазинну їжу зі штрихкодом, а додаток сам розпізнає що перед ним і проаналізує дані.
Завдяки системі розпізнавання тексту додаток знаходить необхідні дані у величезній текстової базі продуктів із зазначенням калорійності кожного з рецептів, веде постійний облік спожитих калорій, показує скільки ще можна з'їсти за сьогодні. На даний момент додаток добре працює з мовами, написання яких здійснюється латиницею, тому недоступно для нашого ринку.
Як можна поліпшити: ми знаємо як незручно щоразу записувати всі з’їдені продукти. Однак можна скористатися звичкою сучасних людей усе фотографувати. Додавши в коробковий продукт можливість візуального пошуку, можна буде автоматично ввести в додаток інформацію по всіх продуктах, які знаходяться в тарілці. У випадку з їжею в кафе/ресторані можна наводити камеру на відповідний пункт меню, де також розписано докладний склад страви та її вагу.
Turbotax – додаток, що спрощує сплату податків. Додаток використовує можливість API сканування штрихкодів: коли користувач сканує штрихкод свого водійського посвідчення, програма витягує з нього всі необхідні дані. Такий підхід зменшує ризик помилки при введенні даних вручну.
Досвід Evergeeen: подібний підхід ми використовували при створенні системи розпізнавання техпаспортів для оформлення страховки на авто і системи розпізнавання закордонних паспортів.
Системи розпізнавання облич особливо популярні в додатках соціальних мереж: Інстаграм, Снепчат, Фейсбук. Кожен із них в тій чи іншій мірі використовує можливості розпізнавання облич. У тому числі: розпізнавання особи на зображенні, визначення на фото таких елементів як ніс, очі, рот; емоцій: щастя, смуток, гнів і т.д. Також система дозволяє визначити контури і риси обличчя, редагувати фотографії і зображення облич на відео.
Розробку Firebase ML Kit вже використовує в своїй роботі американська компанія VSCO, основним продуктом якої є додаток для обробки фотографій VSCO Cam.
Як іще можна використовувати: з огляду на шалену популярність емоджі серед молоді, поліпшену і довчену систему розпізнавання облич можна використовувати для створення більш яскравих і цікавих емоджі. А при впровадженні цих можливостей в UX вашого сайту, можна проводити яскраві промоакції фестивалів, кінопрем'єр, нових фешн-колекцій та ін.
Знати точне місце розташування того чи іншого об'єкта буває корисно в багатьох випадках. Наприклад, туристам. Або, що більш цікаво через незвичайного і вузькоспрямованого підходу – рибалкам.
Так, компанія Fishbrain створила додаток, що дозволяє рибалкам дізнаватися точні місця для лову того чи іншого виду риби, ділитися враженнями, визначати кращу наживку під кожен вид риби і навіть дивитися погоду перед виходом на риболовлю.
Компанія використовує напрацювання Firebase ML Kit для більш точної роботи програми з визначення точок на місцевості.
Де ще можна використовувати: крім рибалок, подібні додатки стануть в нагоді всім людям і держструктурам, діяльність яких вимагає орієнтування на місцевості: лісничим, військовим, підрозділам по боротьбі з браконьєрами, загонам швидкого реагування, поліцейським.
Визначення міток – процес розпізнавання різних складових елементів на зображенні. Включає в себе безліч видів рослин, тварин, відомих особистостей, персонажів, напоїв, їжі, пам'яток і т.д.
Firebase анонсували, що з система може розпізнати більше 400 міток в форматі інтеграції можливостей Firebase ML Kit в додаток і більше 10 000 при роботі з хмарним сховищем.
Серед перших випробувачів Firebase ML Kit є додаток, якому найбільш підходить їхня функція визначення міток – PicsArt.
Де можна використовувати: сфер застосування маса. У тому числі й підбір образів (одягу), кави, чаю, дизайну інтер'єру за допомогою асоціацій, адже кожна мітка дозволяє розвинути необхідний асоціативний ряд.
Розпізнавання мови сьогодні затребуване як ніколи раніше, оскільки мобільні та веб додатки використовують по всьому світу, а їхні користувачі спілкуються абсолютно різними мовами. Розуміння мови ваших користувачів дозволить вам розуміти їхні потреби і краще персоналізувати додаток під їх запити.
Firebase ML Kit на сьогодні розпізнає понад сто мов, написаних латиницею, кирилицею, в'яззю і іншими видами алфавіту.
Як можна використовувати переваги такого додатка? Наприклад, створюючи чат-бот для спілкування з клієнтами по всьому світу. Особливо стане в нагоді великим виробничим корпораціям, підрядники та заводи яких можуть бути розкидані по всіх континентах.
Зацікавили можливості, описані тут? Напишіть нам. Використовуючи багаторічний досвід у сфері машинного навчання, ми готові запропонувати вам коробкові продукти для вашого бізнесу або розробити необхідну версію "з нуля" під ваші потреби.