На Python ми зробили простого голосового чат-бота з використанням Google Speech To Text API, Dialogflow, Google Text To Speech API.

У нашому репозиторії на GitHub ви можете подивитися клас, який забезпечує наступний цикл очікування голосу (Listen Loop): слухає голос користувача, переводить в текст за допомогою Google Cloud STT API, передає в Dialogflow, який розуміє що відповісти і повертає текстовий відповідь і читає його вголос за допомогою Google Cloud TTS API.

По суті це скелет базового голосового бота на Dialog Flow. Ми тестували цей бот на Windows 10 x64 і Raspberry Pi 3 українською та англійською мовами. Англійська працює добре, українська відмінно розпізнається, але погано читається, оскільки Google не дає в загальне користування свій TTS API для української мови.

Dialogflow

Перевага цієї технології в тому що можна керувати логікою діалогу в Dialogflow, без необхідності ще раз встановіть бота на пристроях. Недолік - вимоглива до інтернет-з'єднання, плюс всі недоліки Google Speech API.

Коротеньке демо голосового бота

Подібного бота можна навчити будь-яких сценаріїв, і наділити різним функціоналом. Все залежить від того, з якою метою вам потрібна розробка голосового бота. Є ідеї? Напишіть нам, і ми допоможемо вам їх реалізувати.

04.12.2018
Рейтинг: 5 / 5 (1)