В повседневном общении мы используем тысячи невербальных сигналов: мимические реакции, интонации, жесты, осанку — для передачи наших эмоций и чувств. Для эффективной коммуникации необходимо уметь распознавать и понимать все эти скрытые подсказки. Люди без труда справляются с этой задачей, но могут ли умные технологии считывать человеческие эмоции так же хорошо?
Искусственный интеллект успел проникнуть во многие сферы нашей повседневной и деловой жизни и вплотную приблизился к сфере человеческих эмоций и чувств.
Искусственный интеллект (ИИ) можно определить как область компьютерной науки, занимающуюся созданием машин, способных воспроизводить человеческое поведение. ИИ является одним из топовых технологических трендов последнего десятилетия, и в ближайшее время будет все так же занимать лидирующие позиции на рынке технологий. Согласно исследованиям, 41% потребителей уверены, что искусственный интеллект может улучшить их жизнь, а в 77% используемых нами устройств функции ИИ присутствуют в той или иной форме.
Эмоциональный ИИ, или эмоциональный искусственный интеллект (Emotion AI) — это подкатегория ИИ, благодаря которой компьютерные системы и алгоритмы могут распознавать и интерпретировать человеческие эмоции, отслеживая выражения лица, язык тела или речь. Эмоциональный ИИ можно описать как инструмент, который обеспечивает более непринужденное взаимодействие между машинами и людьми: он может анализировать тончайшие изменения в человеческой мимике (микровыражения), рисунок голоса, жестикуляцию и реагировать на них подобно человеку.
Согласно прогнозам, мировой рынок технологий определения и распознавания эмоций достигнет отметки в 56,0 млрд. долларов США к 2024 году по сравнению с 21,6 млрд. долларов США в 2019 году. В сегменте программных продуктов технология распознавания лиц и эмоций будет развиваться наиболее высокими темпами в течение прогнозного периода.
Развитие компьютерного зрения и машинного обучения делает распознавание эмоций намного более точным и доступным для широкой аудитории. Распознавание эмоций по выражению лица (facial expression recognition, face computing) является подобластью технологии обработки изображений. В наиболее широком смысле “чтение” лиц позволяет компаниям обнаруживать эмоции людей, проходящих мимо их камер. Его можно использовать в маркетинге, медицине, робототехнике — в целом, в любой области, где требуется глубокое понимание эмоциональной реакции человека на определенные действия. Технология распознавания лиц может применяться в системах безопасности, включая контроль доступа, аутентификацию, верификацию платежей, а также в ходе проведения интервью или допросов.
Emotion AI в системах распознавания считывает выражения лица при помощи любого оптического датчика, например, обычной веб-камеры или камеры смартфона, определяя лицо на видео в режиме реального времени, на записи или изображениях. Алгоритмы компьютерного зрения фиксируют основные точки человеческого лица: глаза, кончик носа, брови, уголки рта — и отслеживают их движение для расшифровки эмоций. Сопоставляя собранные данные с образцами из базы изображений, программа для распознавания может определять чувства человека по сочетанию выражений его лица. Продвинутые решения в области эмоционального искусственного интеллекта, такие как Affectiva или Kairos, умеют отслеживать следующие показатели эмоций: радость, грусть, гнев, презрение, отвращение, страх и удивление. Дополнительные программные функции могут включать идентификацию и верификацию по изображению лица, определение возраста и пола, этнической принадлежности, наличие на фото нескольких людей, и многое другое.
Распознавание эмоций в устной речи — это следующий этап развития технологий обработки естественного языка, качественно улучшающий взаимодействие человека и компьютера. Программа распознавания эмоций по голосу позволяет обрабатывать аудиофайлы, содержащие человеческий голос, и анализировать не то, что говорят, а то, как говорят, извлекая паралингвистические сигналы и наблюдая за изменениями интонации, громкости, темпа, качества речи, ”переводить” полученные данные на язык эмоций, различать пол, возраст говорящего человека. Анализ голоса и распознавание эмоций уже используются крупными брендами во многих отраслях, в том числе в маркетинговых исследованиях, колл-центрах, при создании роботов-помощников, в здравоохранении.
Программное обеспечение для распознавания эмоций в речи работает аналогично системам распознавания выражений лица. Заложенная в основу технология использует алгоритмы машинного обучения (глубокое обучение с помощью Python, сверточные нейронные сети в Keras/ TensorFlow, другие алгоритмы глубокого обучения) для распознавания эмоций в акустической речи и измерения с высокой степенью точности эмоционального состояния человека: счастлив ли он, грустит, удивлен, злится или настроен нейтрально. Компания Nemesysco разработала технологию под названием Layered Voice Analysis (LVA) (многоуровневый анализ голоса) для выявления напряженности и обмана в речи, используя более 150 неконтролируемых биомаркеров для отслеживания подлинных эмоций говорящего вне зависимости от его родного языка и интонации. Информация, которую может предоставить эта технология, является крайне важной для сферы обслуживания, криминалистики, обеспечения безопасности и защиты от мошенничества в банковском секторе и страховании, а также во многих других отраслях.
Согласно “правилу 7-38-55” личного общения, слова влияют только на 7% нашего эмоционального восприятия. Язык тела отвечает за 55%, а интонация голоса — за 38% наших невербальных сигналов.
Закономерно, что машины, использующие эмоциональный ИИ, должны улавливать все вербальные и невербальные сигналы, чтобы с высокой точностью оценить эмоциональное состояние человека, “читая” лицо или голос, или и то, и другое.
Большинство создателей Emotion AI единодушно заявляют, что основной целью мультимодального (смешанного) распознавания эмоций является сделать общение человека с машиной более естественным. Однако, вокруг этой темы точится много споров. Действительно ли мы хотим, чтобы машины читали наши эмоции? Давайте пока что оставим этот вопрос экспертам в области цифровой этики.
Сегодня же мы хотим привести несколько положительных примеров использования эмоционального ИИ.
Эмоциональная поддержка. Боты-сиделки могут напоминать пожилым пациентам о необходимости принимать лекарства и ежедневно с ними "разговаривать", чтобы следить за их общим самочувствием.
Психотерапия. Чатботы на базе Emotion AI могут заменить терапевта или консультанта и помогают автоматизировать разговорную терапию, сделать ее более доступной. Существуют также приложения для отслеживания настроения, например, Woebot, помогающие людям следить за своим психическим здоровьем через короткие ежедневные разговоры в чате, мониторинг настроения, игры, подборки видео. Еще одним примером технологии для поддержания психического здоровья с использованием ИИ является носимое устройство, выпускающее запах, разработанное MIT Media Lab. Прибор может измерять пульс и ритм дыхания владельца и при необходимости выпускать различные ароматические комбинации, если он фиксирует изменения в состоянии человека — стресс или беспокойство.
ИИ в качестве медицинских ассистентов. Emotion AI может помочь врачам в диагностике и вмешательстве и обеспечить лучший уход. Такие приложения, как Affectiva, позволяют измерять частоту сердечных сокращений пациента без необходимости ношения датчика: программа может отслеживать изменения цвета лица человека с каждым ударом сердца.
Полностью виртуальные “цифровые люди”, предназначение которых — не просто отвечать на вопросы, как Siri или Alexa; они созданы выглядеть и вести себя как люди, показывать эмоции, обладают собственной уникальной личностью, могут учиться и вести реальные разговоры.
Понимание эмоциональной реакции потребителей на контент бренда имеет ключевое значение для достижения маркетинговых целей.
Исследование рекламы. Эмоции — основа эффективной рекламы: переход от негативных эмоций к позитивным может в конечном итоге увеличить продажи. ИИ-решения, такие, как Affdex от Affectiva, позволяют маркетологам дистанционно измерять эмоциональные реакции потребителей на рекламу, видео и телепередачи и лучше оценивать их релевантность.
Персонализация. Лучшее понимание эмоционального отклика человека на маркетинговые кампании и способность предоставлять нужный контент с использованием правильного канала и в нужное время.
Наблюдение. Камеры в общественных местах могут отслеживать мимику людей и понимать общее настроение населения. Китай, будучи крупнейшим в мире рынком систем видеонаблюдения, тестирует использование ИИ для мониторинга эмоционального состояния граждан с целью предугадывать преступления.
Страхование. Технологии эмоционального ИИ позволяют компаниям оценивать риски и выявлять случаи мошенничества при предъявлении страховых требований в режиме реального времени, используя распознавание как голоса, так и лиц.
Банки и финансовые учреждения. Оценка кредитного риска, выявление намерений мошенников, немедленная проверка фактов, риск-скоринг. Emotion AI также может быть использован для персонализации платежей, установки биометрических банкоматов с распознаванием лиц.
Правоохранительные органы. Технология распознавания эмоций позволяет в режиме реального времени оценивать реакции подозреваемых во время допросов, а также анализировать аудио- и видеозаписи. Кроме того, эти методы могут быть использованы при найме на ответственные должности.
Наиболее ярким примером того, насколько продвинутым может быть ИИ, является "робот-гражданин" София от Hanson Robotics. Человекоподобные роботы задействованы в сфере обслуживании клиентов: в одном из отелей Токио есть роботы-администраторы, встречающие гостей. Роботизированные аватары, такие, как T-HR3 от Toyota, могут повторять движения операторов-людей. Образовательные роботы умеют читать эмоции, позволяют проводить обучение по индивидуальным программам и могут стать эффективным решением для инклюзивного образования, как, например, роботы Pepper и NAO от SoftBank Robotics. И таких примеров на самом деле множество.
Evergreen имеет опыт внедрения и использования систем распознавания образов на основе ИИ в проектах клиентов. Мы также знаем, как использовать передовые технологии для поддержки инноваций в вашем бизнесе.
Наша команда разработала систему распознавания лиц по фото для Кредитмаркет — одного из лидеров рынка потребительского кредитования Украины. Созданное нами решение позволяет установить присутствие человека на фотографии и сравнить обнаруженное лицо с изображениями, уже хранящимися в системе. Данное решение помогает не только упростить процесс выдачи кредита и использовать меньше ручного труда, но также выявить потенциальных мошенников и оценить связанные с этим риски.
Еще одним примером ИИ-решений от Evergreen является API сервис распознавания паспортов, основанный на использовании нейронных сетей. Мы создали полностью безопасную и надежную систему распознавания электронных паспортов, которая может считывать необходимые поля с фотографии, анализировать и преобразовывать данные в текст с точностью до 96% или выше. Чтобы узнать больше о возможностях нашего сервиса и примерах использования, свяжитесь с нами прямо сейчас.
Обучение нейронной сети позволило нам создать систему визуального распознавания объектов для проекта одного из наших клиентов. Решение Evergreen позволяет эффективно обнаружить объект на фотографии за считанные секунды, даже с учетом таких факторов, как плохое освещение, угол съемки или плохой фон.
На самом деле, в одной статье невозможно описать все возможности искусственного интеллекта и Emotion AI. Несмотря на разногласия, это многообещающая технология, которая в ближайшем будущем во многом изменит нашу жизнь.
Вы заинтересованы в разработке проекта на основе искусственного интеллекта, который поможет привнести инновации в ваш бизнес, наладить связь с клиентами или оптимизировать бизнес-процессы? Хотите создать продукт, использующий технологии распознавания? Отправьте нам сообщение или заполните форму, и наши специалисты с удовольствием поддержат ваши инициативы.