У повсякденному спілкуванні ми використовуємо тисячі невербальних сигналів: мімічні реакції, інтонації, жести, поставу - для передачі наших емоцій і почуттів. Для ефективної комунікації необхідно вміти розпізнавати і розуміти всі ці приховані підказки. Люди без зусиль справляються з цим завданням, але чи можуть розумні технології зчитувати людські емоції так само добре?

Що таке емоційний штучний інтелект?

Штучний інтелект встиг проникнути до багатьох сфер нашого повсякденного та ділового життя і впритул наблизився до сфери людських емоцій і почуттів.

Штучний інтелект (АІ, ШІ) можна визначити як область комп'ютерної науки, що займається створенням машин, здатних відтворювати людську поведінку. ШІ — один із топових технологічних трендів останнього десятиліття, і найближчим часом буде так само займати лідируючі позиції на ринку технологій. Згідно з дослідженнями, 41% споживачів впевнені, що штучний інтелект може поліпшити їхнє життя, а в 77% використовуваних нами пристроїв функції ШІ присутні в тій чи іншій формі.

Емоційний ШІ, або емоційний штучний інтелект (Emotion AI) - категорія ШІ, завдяки якій комп'ютерні системи та алгоритми можуть розпізнавати й інтерпретувати людські емоції, відстежуючи вирази обличчя, мову тіла або мовлення. Емоційний АІ можна описати як інструмент, що забезпечує більш невимушену взаємодію між машинами та людьми: він може аналізувати найтонші зміни в людській міміці (мікровирази), малюнок голосу, жестикуляцію та реагувати на них подібно до людини.

Згідно з прогнозами, світовий ринок технологій визначення і розпізнавання емоцій досягне позначки 56,0 млрд. доларів США до 2024 року у порівнянні з 21,6 млрд. доларів США в 2019 році. У сегменті програмних продуктів технологія розпізнавання облич та емоцій розвиватиметься найбільш швидкими темпами протягом періоду прогнозування.

Технологія розпізнавання емоцій за виразом обличчя

Розвиток комп'ютерного зору та машинного навчання робить розпізнавання емоцій набагато більш точним і доступним для широкої аудиторії. Розпізнавання емоцій за виразом обличчя (facial expression recognition, face computing) —  підобласть технології обробки зображень. У найбільш широкому сенсі "читання" облич дозволяє компаніям виявляти емоції людей, які проходять повз їхні камери. Його можна використовувати у маркетингу, медицині, робототехніці - загалом, у будь-якій сфері, де потрібне глибоке розуміння емоційної реакції людини на певні дії. Технологія розпізнавання облич може застосовуватися в системах безпеки, у тому числі для контролю доступу, автентифікації, верифікації платежів, а також у ході проведення інтерв'ю чи допитів.

Як це працює?

Emotion AI у системах розпізнавання зчитує вираз обличчя за допомогою будь-якого оптичного датчика, наприклад, звичайної веб-камери або камери смартфона, визначаючи обличчя на відео в режимі реального часу, на записі або зображеннях. Алгоритми комп'ютерного зору фіксують основні точки людського обличчя: очі, кінчик носа, брови, кутики рота тощо - і відстежують їхній рух для розшифровки емоцій. Зіставляючи зібрані дані зі зразками з бази зображень, програма для розпізнавання може визначати почуття людини за поєднанням виразів її обличчя. Передові програмні рішення в галузі емоційного штучного інтелекту, такі як Affectiva або Kairos, вміють відстежувати наступні показники емоцій: радість, смуток, гнів, презирство, відраза, страх і подив. Додаткові програмні функції можуть включати ідентифікацію та верифікацію за зображенням особи, визначення віку і статі, етнічної приналежності, наявність на фото декількох людей та багато іншого.

Технологія розпізнавання емоцій за голосом

Розпізнавання емоцій в усному мовленні - це наступний етап розвитку технологій обробки природної мови, що якісно поліпшує взаємодію людини та комп'ютера. Програма розпізнавання емоцій за голосом дозволяє обробляти аудіофайли, що містять людський голос, і аналізувати не тільки те, що кажуть, але й те, як говорять, виокремлюючи паралінгвістичні сигнали і спостерігаючи за змінами інтонації, гучності, темпу, якості мовлення, "перекладати" отримані дані на мову емоцій, розрізняти стать, вік мовця тощо. Аналіз голосу та розпізнавання емоцій уже використовуються великими брендами в багатьох галузях, у тому числі в маркетингових дослідженнях, колл-центрах, при створенні роботів-помічників, в охороні здоров'я.

Як це працює?

Програмне забезпечення для розпізнавання емоцій у мовленні працює аналогічно до систем розпізнавання виразів обличчя. Закладена в основу технологія використовує алгоритми машинного навчання (глибоке навчання за допомогою Python, згорткові нейронні мережі в Keras/TensorFlow, інші алгоритми глибокого навчання) для розпізнавання емоцій в акустичному мовленні та вимірювання з високим ступенем точності емоційного стану людини: чи щаслива вона, сумує, здивована, злиться чи налаштована нейтрально. Компанія Nemesysco розробила технологію під назвою Layered Voice Analysis (LVA) (багаторівневий аналіз голосу) для виявлення напруженості й обману в мовленні, використовуючи більш 150 неконтрольованих біомаркерів для відстеження справжніх емоцій мовця незалежно від його рідної мови й інтонації. Інформація, котру може надати ця технологія, вкрай важлива для сфери обслуговування, криміналістики, забезпечення безпеки та захисту від шахрайства в банківському секторі та страхуванні, а також у багатьох інших галузях.

Мультимодальне розпізнавання емоцій: як далеко може зазирнути штучний інтелект?

Згідно з "правилом 7-38-55" особистого спілкування, слова впливають тільки на 7% нашого емоційного сприйняття. Мова тіла відповідає за 55%, а інтонація голосу - за 38% наших невербальних сигналів.

Закономірно, що машини, які використовують емоційний АІ, повинні вловлювати всі вербальні і невербальні сигнали, щоб із високою точністю оцінити емоційний стан людини, "читаючи" обличчя або голос, або і те, й інше.

Більшість творців Emotion AI одностайно заявляють, що основна мета мультимодального (змішаного) розпізнавання емоцій полягає у тому, щоб зробити спілкування людини з машиною більш природним. Однак, навколо цієї теми точиться багато суперечок. Чи справді ми хочемо, щоб машини читали наші емоції? Давайте поки що залишимо це питання експертам в області цифрової етики.

Сьогодні ми хочемо навести кілька позитивних прикладів використання емоційного АІ.

Сфери застосування емоційного штучного інтелекту

Медицина

Емоційна підтримка. Боти-доглядальники можуть нагадувати пацієнтам літнього віку про необхідність приймати ліки та щодня з ними "розмовляти", щоб стежити за їхнім загальним самопочуттям.

Психотерапія. Чатботи на базі Emotion AI можуть замінити терапевта або консультанта і допомагають автоматизувати розмовну терапію, зробити її більш доступною. Існують також додатки для відстеження настрою, наприклад, Woebot, що допомагають людям стежити за своїм психічним здоров'ям через короткі щоденні розмови в чаті, моніторинг настрою, ігри, добірки відео. Ще одним прикладом технології для підтримки психічного здоров'я з використанням АІ є переносний пристрій, що випускає запах, розроблений MIT Media Lab. Прилад може вимірювати пульс і ритм дихання власника і в разі потреби випускати різні ароматичні комбінації, якщо він фіксує зміни у стані людини - стрес чи занепокоєння.

ШІ в якості медичних асистентів. Emotion AI може допомогти лікарям у діагностиці та втручанні і забезпечити кращий догляд. Такі програми, як Affectiva, дозволяють вимірювати частоту серцевих скорочень пацієнта без необхідності носіння датчика: програма може відстежувати зміни кольору обличчя людини з кожним ударом серця.

Віртуальні асистенти для емоційного спілкування

Повністю віртуальні "цифрові люди", призначення яких - не просто відповідати на запитання, як Siri або Alexa; вони створені виглядати і поводитися як люди, проявляти емоції, наділені власною унікальною особистістю, можуть вчитися і вести реальні розмови.

Маркетинг

Розуміння емоційної реакції споживачів на контент бренду має ключове значення для досягнення маркетингових цілей.

Дослідження реклами. Емоції - основа ефективної реклами: перехід від негативних емоцій до позитивних може в кінцевому рахунку збільшити продажі. АІ-рішення, такі, як Affdex від Affectiva, дозволяють маркетологам дистанційно вимірювати емоційні реакції споживачів на рекламу, відео та телепередачі і краще оцінювати їх релевантність.

Персоналізація. Краще розуміння емоційного відгуку людини на маркетингові кампанії та здатність надавати потрібний контент за допомогою відповідного каналу і в потрібний час.

Громадський сектор

Спостереження. Камери в громадських місцях можуть відстежувати міміку людей і розуміти загальний настрій населення. Китай, будучи найбільшим у світі ринком систем відеоспостереження, тестує використання ШІ для моніторингу емоційного стану громадян із метою передбачати злочини.

Страхування. Технології емоційного ШІ дозволяють компаніям оцінювати ризики та виявляти випадки шахрайства при пред'явленні страхових вимог у режимі реального часу, використовуючи розпізнавання голосу й обличчя.

Банки і фінансові установи. Оцінка кредитного ризику, виявлення намірів шахраїв, негайна перевірка фактів, ризик-скоринг. Emotion AI також може бути використаний для персоналізації платежів, установки біометричних банкоматів із розпізнаванням облич тощо.

Правоохоронні органи. Технологія розпізнавання емоцій дозволяє в режимі реального часу оцінювати реакції підозрюваних під час допитів, а також аналізувати аудіо- та відеозаписи. Крім того, ці методи можуть бути використані при працевлаштуванні на відповідальні посади.

Людиноподібні роботи

Найбільш яскравим прикладом того, наскільки просунутим може бути АІ, є "робот-громадянин" Софія від Hanson Robotics. Людиноподібні роботи задіяні у сфері обслуговування клієнтів: в одному з готелів Токіо є роботи-адміністратори, що зустрічають гостей. Роботизовані аватари, такі, як T-HR3 від Toyota, можуть повторювати рухи операторів-людей. Освітні роботи вміють читати емоції, дозволяють проводити навчання за індивідуальними програмами і можуть стати ефективним рішенням для інклюзивної освіти, як, наприклад, роботи Pepper і NAO від SoftBank Robotics. І таких прикладів справді безліч.

Системи розпізнавання з використанням штучного інтелекту від Evergreen

Evergreen має досвід впровадження і використання систем розпізнавання образів на основі АІ у проєктах клієнтів. Ми також знаємо, як використовувати передові технології для підтримки інновацій у вашому бізнесі.

Наша команда розробила систему розпізнавання осіб за фото для КредитМаркет - одного з лідерів ринку споживчого кредитування України. Створене нами рішення дозволяє встановити присутність людини на фотографії та порівняти виявлене обличчя з зображеннями, збереженими в системі. Дане рішення допомагає не тільки спростити процес видачі кредиту та використовувати менше ручної праці, але також виявити потенційних шахраїв і оцінити пов'язані з цим ризики.

Ще одним прикладом АІ-рішень від Evergreen є API сервіс розпізнавання паспортів, заснований на використанні нейронних мереж. Ми створили повністю безпечну та надійну систему розпізнавання електронних паспортів, що може зчитувати необхідні поля з фотографії, аналізувати та перетворювати дані у текст із точністю до 96% або вище. Щоб дізнатися більше про можливості нашого сервісу і приклади використання, зв'яжіться з нами прямо зараз.

Навчання нейронної мережі дозволило нам створити систему візуального розпізнавання об'єктів для проєкту одного з наших клієнтів. Рішення Evergreen дозволяє ефективно виявити об'єкт на фотографії за лічені секунди, навіть з урахуванням таких факторів, як погане освітлення, кут зйомки чи поганий фон.

Насправді, в одній статті неможливо описати всі можливості штучного інтелекту й Emotion AI. Незважаючи на розбіжності, це перспективна технологія, що в найближчому майбутньому багато в чому змінить наше життя.

Ви зацікавлені у розробці проєкту на основі штучного інтелекту, що допоможе привнести інновації у ваш бізнес, налагодити зв'язок із клієнтами або оптимізувати бізнес-процеси? Бажаєте створити продукт, що використовує технології розпізнавання? Надішліть нам повідомлення або заповніть форму, і наші фахівці залюбки підтримають ваші ініціативи.

19.06.2020
Зображення, використані в статті, були взяті з відкритих джерел і використовуються як ілюстрації.