Системы распознавания
При распознавании речевой сигнал может:
- Преобразовываться в текстовый формат. Данные тысяч звонков собираются, после чего система сможет проанализировать их и собрать статистику или отследить новые тренды на рынке и так далее.
- Анализироваться роботом. Тот будет делать транскрибацию по звукам, морфемам, сравнивая полученный результат с базой возможных ответов и их синонимов и по итогу выдавать нужную информацию клиентам (расписание работы, справочные службы, ответы на популярные вопросы) либо перенаправлять клиентов к компетентным менеджерам внутри колл-центра для решения дополнительных вопросов.
- Анализироваться и идентифицироваться. По речи (достаточно 8–15 секунд разговора), банковская система, например, может убедиться в том, что звонит реальный пользователь, ID которого есть в базе клиентов, а не мошенник. Мошенников могут вычислять и по записям фрод-звонков.
Системы, специализирующиеся на распознавании речи, используют для приема и распределения входящих звонков, анкетирования, сбора отзывов, обслуживания клиентов с помощью IVR и пр. Все зависит от их вида. Технологии с закрытой грамматикой предусматривают, что робот будет ориентироваться на ключевые слова, выискивая их во фразах, которые произносит клиент, и с учетом этих слов давать ответы на вопросы, переключать на оператора и так далее.
Открытая грамматика – это усложненный вариант, но и более практичный – робот реагирует не на определенные фразы, а на любые. Это делает системы более дружелюбными, повышает качество обслуживания клиентов и их лояльность к бренду.
Системы синтеза речи
Синтез речи – это процесс преобразования цифровой информации, текста в речевой сигнал. Он осуществляется через статистический подход в акустическом моделировании. То есть, программа создает новый голос, используя интонации живых людей, чтобы сделать искусственную речь максимально похожей на речь живого человека (придать ей нужной эмоциональной окраски – сделать голос нейтральным или добрым и т. д.)
Преимущества систем
Голосовой робот, который умеет распознавать речь:
- Экономит время менеджеров и операторов. Он может подтверждать заказы, обзванивать холодную базу клиентов, знакомить с новым продуктом и др.
- Снижает затраты на расширение или обслуживание колл-центра в 3–5 раз. Компаниям не нужно искать сотрудников, обучать, вводить в должность, а после – выплачивать им заработную плату, платить за них налоги.
- Не теряет звонки. Напротив, даже в пиковые часы быстро реагирует на обращения потребителей, сегментирует их, переводя каждого клиента на нужного оператора.
Системы распознавания речи в МТТ работают круглосуточно и подключаются в день подачи заявки. Иными словами, с их помощью можно сразу начинать зарабатывать.
Синтез речи выручает бизнес там, где заранее записать ответы на запросы клиентов невозможно, так как информация быстро меняется. Например, с помощью таких технологий можно информировать клиентов о статусе их заказа, цене искомой позиции. Также робот может проверять наличие товара, рассчитывать дату отправки и так далее.
Важные моменты
При внедрении ASR систему желательно тестировать сначала внутри компании, а потом – на группах потенциальных клиентов. Задача – убедиться, что распознавание осуществляется без ошибок, а потребители довольны сервисом. Если проблемы выявлены, сервисы корректируются, скрипты перезаписываются, база расширяется, чтобы при анализе речи больше не случалось ошибок.
Подобным образом происходит и тестирование систем, осуществляющих синтез речи. Оно позволяет выявлять и устранять мелкие ошибки – неправильно сделанное ударение, не ту интонацию, неестественность в звучании и так далее.