Мы много писали о машинном обучении и как применять его в веб сайтах с пользой для вашего бизнеса. Однако чем дальше, тем больше посетителей предпочитают взаимодействовать с компаниями через приложения на смартфонах и планшетах: для них это быстрее и удобнее. А классические AI-продукты слишком громоздкие для работы с мобильными и веб приложениями.

Поэтому возникла потребность в полуготовых решениях, которые можно внедрить в функционал любого продукта и просто использовать. Одно из таких решений, Firebase ML Kit недавно появилось на рынке на этапе бета-тестирования. Давайте посмотрим что оно предлагает, для кого может быть полезно и как мы можем сделать решение получше.

Для чего нужны коробочные решения machine learning

Качественное машинное обучение для решения ваших задач – дело длительное, трудоемкое и затратное. Задача коробочного решения – предоставить уже готовый набор функций, который можно просто интегрировать в мобильное и веб приложение, внеся несколько строчек кода и доучивать его в процессе работы.

Наглядно продемонстрируем разницу между обучением AI «с нуля» и использованием готового «коробочного» продукта.

разница между обучением AI «с нуля» и использованием готового «коробочного» продукта

Первая попытка создать готовое коробочное  решение уже состоялась. В 2018 году Firebase продемонстрировали свою новую разработку: коробочные решения для упрощения машинного обучения мобильных устройств. Согласно задумке Firebase ML Kit для систем Android и iOS – удобный и простой в использовании пакет, включающий в себя сразу несколько функций:

    • Распознавание текста
    • Сканирование штрихкодов (магазины без продавцов)
    • Распознавание лиц
    • Распознавание точек на местности
    • Определение меток
    • Распознавание языка

Все функции продукта могут быть доступны как в приложении, так и в облаке через API (во втором случае обработка запроса потребует больше времени, но дасть более точный результат). Поскольку продукт ещё новый и находится на стадии бета-тестирования, он требует доработок. Но мы решили уже сегодня посмотреть на его возможности и где их можно использовать.

Распознавание текста

Эту функцию, а вместе с ней и распознавание шрихкодів компания FitNow внедрила в собственное приложение Lose It! Это приложение, считающее калории. Работает просто: достаточно вбить название продукта или же навести камеру на готовую магазинную еду со штрихкодом, а приложение само распознает что перед ним и проанализирует данные.

Благодаря системе распознавания текста приложение находит необходимые данные в огромной текстовой базе продуктов с указанием калорийности каждого из рецептов, ведет постоянный учет потребленных калорий, показывает сколько ещё можно съесть за сегодня. На данный момент приложение хорошо работает с языками, написание которых осуществляется латиницей, поэтому недоступно для нашего рынка.

Как можно улучшить: мы знаем как неудобно каждый раз записывать все съеденные продукты. Однако можно воспользоваться привычкой современных людей всё фотографировать. Добавив в коробочное решение возможность визуального поиска, можно будет автоматически ввести в приложение информацию по всем продуктам, которые находятся в тарелке. В случае с едой в кафе/ресторане можно наводить камеру на соответствующий пункт меню, где также расписан подробный состав блюда и его вес.

Сканирование штрихкодов и QR кодов

Turbotax – приложение, упрощающее уплату налогов. Приложение использует возможность API сканирования штрихкодов: когда пользователь сканирует штрихкод своего водительского удостоверения, программа извлекает из него все необходимые данные. Такой подход уменьшает риск ошибки при вводе данных вручную.

Опыт Evergeeen: подобный подход мы использовали при создании системы распознавания техпаспортов для оформления страховки на авто и системы распознавания загранпаспортов.

Распознавание лиц

Системы распознавания лиц особо популярны в приложениях социальных сетей: Инстаграм, Снэпчат, Фейсбук. Каждый из них в той или иной степени использует возможности распознавания лиц. В том числе: распознавание лица на изображении, определение на фото таких элементов как нос, глаза, рот; эмоций: счастье, грусть, гнев и т.д. Также оно позволяет определить контуры и черты лица, редактировать фотографии и изображение лиц на видео.

Разработку Firebase ML kit уже использует в своей работе американская компания VSCO, основным продуктом которой является приложение для обработки фотографий VSCO Cam.

Как ещё можно использовать: учитывая сумасшедшую популярность эмоджи среди молодежи, улучшенную и доученную систему распознавания лиц можно использовать для создания более ярких и интересных эмоджи. А при внедрении этих возможностей в UX вашего сайта можно проводить яркие промоакции фестивалей, кинопремьер, новых фэшн-коллекций и пр.

Распознавание точек на местности

Знать точное место расположения того или иного объекта бывает полезно во многих случаях. Например, туристам. Или, что более интересно из-за необычного и узконаправленного подхода – рыбакам.

Так, компания Fishbrain создала приложение, позволяющее рыбакам узнавать точные места для ловли того или иного вида рыбы, делиться впечатлениями, определять лучшую наживку под каждый вид рыбы и даже смотреть погоду перед выходом на рыбалку.

Компания использует наработки Firebase ML kit для более точной работы приложения по определению точек на местности.

Где ещё можно использовать: помимо рыбаков, подобные приложения пригодятся всем людям и госструктурам, деятельность или хобби которых требует ориентирования на местности: лесничим, военным, подразделениям по борьбе с браконьерами, отрядам быстрого реагирования, полицейским.

Определение меток

Определение меток – процесс распознавания различных составляющих элементов на изображении. Включает в себя множество видов растений, животных, известных личностей, персонажей, напитков, еды, достопримечательностей и т.д.

Firebase анонсировали, что из система может распознать более 400 меток в формате интеграции возможностей Firebase ML kit в приложение и более 10 000 при работе с облачным хранилищем.

Среди первых испытателей Firebase ML kit есть приложение, которому наиболее подходит их функция определения меток – PicsArt.

Где можно использовать: сфер применения масса. В том числе и подбор образов (одежды), кофе, чая, дизайн интерьера при помощи ассоциаций, ведь каждая метка позволяет развить необходимый ассоциативный ряд.

Распознавание естественной речи - NLP/NLU

Распознавание языка сегодня востребовано как никогда ранее, поскольку мобильные и веб приложения используют по всему миру, а их пользователи говорят на совершенно различных языках. Понимание языка ваших пользователей позволит вам понимать его потребности и лучше персонализировать приложение под их запросы.

ML Kit на сегодня распознает более ста языков, написанных латиницей, кириллицей, вязью и другими видами алфавита.

Как можно использовать преимущества такого приложения? Например, создавая чат-бот для общения с клиентами по всему миру. Особенно пригодится большим производственным корпорациям, подрядчики и заводы которых могут быть разбросаны по всем контитентам.

Заинтересовали возможности, описанные здесь? Напишите нам. Используя многолетний опыт в сфере машинного обучения, мы готовы предложить вам коробочные решения для вашего бизнеса или разработать необходимую версию “с нуля” под ваши потребности.

13.05.2019
Рейтинг: 5 / 5 (1)