Отрасли Решения Услуги Телефония О компании 8-800 555-9000

Распознавание и синтез речи

Чтобы сократить расходы на содержание операторов колл-центра или хотя бы оставить на прежнем уровне, несмотря на рост бизнеса, используют системы распознавания речи (ASR) и синтеза речи (TTS). Это решения от МТТ, которые быстро внедряются и автоматизируют общение с клиентами.

Системы распознавания

При распознавании речевой сигнал может:

  • Преобразовываться в текстовый формат. Данные тысяч звонков собираются, после чего система сможет проанализировать их и собрать статистику или отследить новые тренды на рынке и т. д.;
  • Анализироваться роботом. Тот будет делать транскрибацию по звукам, морфемам, сравнивая полученный результат с базой возможных ответов и их синонимов и по итогу выдавать нужную информацию клиентам (расписание работы, справочные службы, ответы на популярные вопросы) либо перенаправлять клиентов к компетентным менеджерам внутри колл-центра для решения дополнительных вопросов.
  • Анализироваться и идентифицироваться. По речи (достаточно 8–15 секунд разговора), банковская система, например, может убедиться в том, что звонит реальный пользователь, ID которого есть в базе клиентов, а не мошенник. Мошенников могут вычислять и по записям фрод-звонков.

 

Системы, специализирующиеся на распознавании речи, используют для приема и распределения входящих звонков, анкетирования, сбора отзывов, обслуживания клиентов с помощью IVR и пр. Все зависит от их вида. Технологии с закрытой грамматикой предусматривают, что робот будет ориентироваться на ключевые слова, выискивая их во фразах, которые произносит клиент, и с учетом этих слов давать ответы на вопросы, переключать на оператора и т.д. Открытая грамматика – это усложненный вариант, но и более практичный – робот реагирует не на определенные фразы, а на любые. Это делает системы более дружелюбными, повышает качество обслуживания клиентов и их лояльность к бренду.

Системы синтеза речи

Синтез речи – это процесс преобразования цифровой информации, текста в речевой сигнал. Он осуществляется через статистический подход в акустическом моделировании. То есть, программа создает новый голос, используя интонации живых людей, чтобы сделать искусственную речь максимально похожей на речь живого человека (придать ей нужной эмоциональной окраски – сделать голос нейтральным или добрым и т. д.)

Преимущества систем

Голосовой робот, который умеет распознавать речь:

  • Экономит время менеджеров и операторов. Он может подтверждать заказы, обзванивать холодную базу клиентов, знакомить с новым продуктом и др.
  • Снижает затраты на расширение или обслуживание колл-центра в 3–5 раз. Компаниям не нужно искать сотрудников, обучать, вводить в должность, а после – выплачивать им заработную плату, платить за них налоги и т. д.
  • Не теряет звонки. Напротив, даже в пиковые часы быстро реагирует на обращения потребителей, сегментирует их, переводя каждого клиента на нужного оператора.

Системы распознавания речи в МТТ работают круглосуточно и подключаются в день подачи заявки. Иными словами, с их помощью можно сразу начинать зарабатывать.

Синтез речи выручает бизнес там, где заранее записать ответы на запросы клиентов невозможно, так как информация быстро меняется. Например, с помощью таких технологий можно информировать клиентов о статусе их заказа, цене искомой позиции. Также робот может проверять наличие товара, рассчитывать дату отправки и т. д.

Важные моменты

При внедрении ASR систему желательно тестировать сначала внутри компании, а потом – на группах потенциальных клиентов. Задача – убедиться, что распознавание осуществляется без ошибок, а потребители довольны сервисом. Если проблемы выявлены, сервисы корректируются, скрипты перезаписываются, база расширяется, чтобы при анализе речи больше не случалось ошибок.

Подобным образом происходит и тестирование систем, осуществляющих синтез речи. Оно позволяет выявлять и устранять мелкие ошибки – неправильно сделанное ударение, не ту интонацию, неестественность в звучании и т. д.

Назад
Предыдущая статья Следующая статья
Назад