На Python ми зробили простого голосового чатбота з використанням Google Speech To Text API, Dialogflow, Google Text To Speech API.
У нашому репозиторії на GitHub ви можете подивитися клас, який забезпечує наступний цикл очікування голосу (Listen Loop): слухає голос користувача, перетворює на текст за допомогою Google Cloud STT API, передає в Dialogflow, який розуміє, що відповісти, і повертає текстову відповідь і читає її вголос за допомогою Google Cloud TTS API.
По суті, це скелет базового голосового бота на Dialogflow. Ми тестували цей бот на Windows 10 x64 і Raspberry Pi 3 українською та англійською мовами. Англійська працює добре, українська відмінно розпізнається, але погано читається, оскільки Google не дає в загальне користування свій TTS API для української мови.
Перевага цієї технології в тому, що можна керувати логікою діалогу в Dialogflow без необхідності повторного встановлення бота на пристроях. Недолік - вимоглива до інтернет-з'єднання, плюс всі недоліки Google Speech API.
Подібного бота можна навчити будь-яким сценаріям і наділити різним функціоналом. Все залежить від того, з якою метою вам потрібна розробка голосового бота. Маєте ідеї? Напишіть нам, і ми допоможемо вам їх реалізувати.