Эволюция голосовых технологий меняет рынок: простые IVR уступают место роботам. На смену приходят роботы, которые работают с базой знаний, CRM и сценариями действий. В 2025 году [1] 68% российских компаний использовали нейросети и речевые технологии в клиентском сервисе, а [1] 71% — генеративный ИИ, хотя бы в одной функции. Почти [1] 90% организаций связывают финансовый эффект от решения со снижением операционных затрат.
Разберём, на что смотреть при выборе голосового робота, какие технологии должны быть в основе и как посчитать экономику внедрения.
Технический фундамент: что должно быть в голосовом роботе в 2026 году
Выбор голосового робота для бизнеса зависит от сценария: откуда робот берёт ответ, как ведёт себя при перебивании и в какой момент переводит разговор на сотрудника.
База знаний и контроль ответа
Если вам нужен робот, который отвечает на вопросы с минимальным числом галлюцинаций, используйте RAG. Бот отвечает не по общим знаниям модели, а по вашей базе знаний. По результатам исследования, без поиска по документам доля ошибок в ответах доходит до [2] 21%, а с RAG снижается до [2] 7,5%.
Проверьте, можно ли загружать PDF, Word, TXT, таблицы и другие рабочие документы без разработчика и как оперативно робот начинает отвечать по новой версии файла. Если каждый апдейт уходит в IT или нужна пересборка сценария, база знаний быстро устаревает.
Ошибок становится меньше только при хорошей базе документов и точном поиске по ней. Проконтролируйте, как собрана база знаний, видно ли источник ответа и можно ли открыть документ, из которого робот взял формулировку.
Работа с перебиваниями в разговоре
Паузы, перебивания и смена темы мешают диалогу. Если клиент перебивает робота, а тот не подхватывает реплику, диалог растягивается и часто начинается с начала.
В телефонных системах точность распознавания у обычных реплик доходит до [3] 82,8%, а у реплик с перебиваниями падает до [3] 49,6% — не все голосовые ассистенты одинаково работают в голосовом канале.
Это влияет не только на комфорт разговора. В продажах и сервисе задержка после перебивания снижает конверсию и NPS: клиент вынужден повторять вопрос, а часть звонков уходит к оператору уже на первом уточнении.
Эмоциональный интеллект и голос
Хороший голос — это управляемая речь: темп, паузы, интонация и чтение адресов, дат и номеров без сбоев. В крупных российских проектах речевая аналитика разбирает [4] 100% звонков, оценивает эмоциональный фон и сокращает постобработку сложных обращений на [4] 7–15 минут, но без правил маршрутизации этого недостаточно.
Важна и адаптация тона. В жалобе робот должен говорить короче и спокойнее, в подтверждении записи — быстрее и нейтральнее, а в продажном звонке — увереннее и без лишних пауз. Если голос остаётся одинаковым в конфликте, продаже и напоминании, пользователь слышит не помощника, а скрипт.
Интеграция и бизнес-логика
Робот должен уметь читать данные из CRM и базы знаний, записывать результат разговора и запускать следующий шаг в процессе. Без этого он останется голосовой надстройкой, а не частью процесса.
Подключение к CRM, учётным системам и базе знаний
Проверьте, умеет ли робот читать и обновлять данные в Bitrix24, amoCRM, 1С, ERP, биллинге, базе знаний и карточке клиента, а также работать с правами доступа, журналом действий и защитой от дублей.
Отдельно определите, какие действия робот запускает через API: меняет статус заказа, ставит задачу, резервирует слот, создаёт тикет или блокирует карту. Чем меньше ручных действий остаётся после звонка, тем ближе робот к реальной автоматизации.
Действия вместо формальных ответов
Вряд ли вам нужен бот, который только озвучивает справочную информацию. Обычно он должен проверить статус заказа, оформить возврат, записать клиента к врачу или передать данные в CRM.
Если вы не хотите собирать проект с нуля, можно начать с готового голосового бота МТТ VoiceBox: команда интегрирует робота с вашими CRM, базой знаний и телефонией.
Телефония, SIP и BYOC
Заранее проверьте SIP, очереди, маршрутизацию и работу с действующими номерами. Если уже есть оператор связи, уточните поддержку [5] BYOC — Bring Your Own Carrier: робот подключается к действующему провайдеру, номерам и SIP-схеме без полной замены телефонии. Для критичных линий зафиксируйте SLA с доступностью не ниже 99,99%.
На демо попросите показать перевод звонка с сохранением контекста: кто звонит, что уже спросил клиент и на каком шаге оборвался сценарий. Без этого оператор начинает разговор заново, а робот добавляет ещё один этап вместо экономии времени.
На этапе распознавания тестировать нужно шумную линию, длинные Ф. И. О. и отраслевую лексику.
Безопасность и соответствие требованиям
Чем больше робот знает о клиенте и чем больше действий выполняет, тем жёстче требования к данным. Для России базовый минимум задаёт [6] 152-ФЗ: если робот хранит записи, транскрипты и карточки клиентов, отдельно проверьте [6] трансграничную передачу данных, [6] правила защиты данных, срок хранения и автоматическое удаление данных, шифрование и согласия для исходящих кампаний.
В медицине, финансовом секторе и других чувствительных сценариях лучше выбрать развёртывание на своих серверах или в российском облаке.
Сценарии применения и требования к ним
Функции продаж или поддержки работают не так, как уведомления. Проверьте сценарий: по длине разговора, цене ошибки, требованиям к данным и метрикам качества.
Поддержка и справка
В поддержке важны точность ответа, доступ к базе знаний, быстрое переключение на сотрудника и доля вопросов, которые менеджеры закрывают с первого раза. Основные метрики здесь — доля решённых обращений с первого раза FCR, индекс удовлетворённости CSAT и индекс лояльности клиентов NPS.
Например, в страховании автоматическое распознавание и разбор голосовых обращений сократили среднее время диалога [7] на 7%: система быстрее определяет тему запроса и передаёт его по нужному сценарию.
Для базы знаний важна и маршрутизация. Если робот не уверен в ответе, он должен переводить звонок до того, как клиент повторит вопрос. Иначе FCR падает даже при хорошем распознавании.
Исходящие продажи и обзвон
Для рекламы, по [8] статье 18 38-ФЗ, нужно предварительное согласие абонента, а [9] ФАС запрещает автоматический дозвон без участия человека.
Не ставьте робота на холодный рекламный обзвон. Используйте решение, если у вас есть сервисный сценарий или согласие на контакт: для подтверждения заказа, напоминания, реактивации базы или первичной квалификации после заявки. Удобный инструмент — голосовой бот МТТ VoiceBox.
В продажных сценариях заранее определите, что считать успехом: дозвон, согласие на разговор, прохождение квалификации или заказ. Без этого робот может формально выполнить сценарий, но вы не получите ни конверсии, ни экономии.
Напоминания и уведомления
Вы быстро запустите напоминания и подтверждения: сценарий короткий, число статусов ограничено, а результат можно посчитать по дозвону, подтверждению и стоимости звонка. На поддержку нужно больше времени из-за базы знаний и интеграций. Внедрить продажи сложнее: из-за согласий, ограничений по рекламе и проверки конверсии.
Эти сценарии подходят для первого пилота: у них низкая цена ошибки, понятный список статусов и простой расчёт экономии на одном звонке.
Медицина и чувствительные сферы
В чувствительных отраслях важна приватность и точность терминологии. Выбирайте более закрытую схему, если сценарий связан с диагнозами, оплатой или страхованием.
Для медицины и страхования отдельно проверьте словарь терминов, работу с длинными фамилиями и правила передачи разговора врачу или оператору.
Экономика внедрения
Чтобы оптимизировать затраты, определите модели тарификации, дополнительные расходы и результаты пилота.
Модели тарификации
На рынке есть четыре базовые схемы: оплата за минуту разговора, рабочее место, объём обработанных запросов или гибридная модель. Для напоминаний важна цена минуты, в поддержке — стоимость закрытого обращения, а для проектов с большим числом сотрудников учитывайте общую стоимость лицензий, интеграции и сопровождения.
Где появляются скрытые расходы
Скрытые расходы связаны с интеграцией, поддержкой сценариев, хранением данных и телефонией:
- интеграция с CRM, ERP и базой знаний
- настройка сценариев и правил эскалации
- обучение сотрудников и запуск пилота
- поддержка и обновление базы знаний
- хранение записей и расшифровок
- телефонные каналы, если провайдер не поддерживает BYOC
Как считать пилот и окупаемость
Вы можете внедрить ИИ-решение за [1] 3 месяца. Около [1] месяца уйдёт на согласование старта проекта и коммерческих условий.
При правильном внедрении голосовые роботы для бизнеса обычно окупаются за 6–10 месяцев. Нагрузка на операторов за это время может снизиться на 40–60%, а в продажных сценариях конверсия способна вырасти на 25–35%.
Поэтому лучше считать внедрение голосового ИИ по трём метрикам:
- какое количество обращений робот закрыл без оператора
- сколько времени сэкономил для первой линии
- какую долю ручной постобработки взял на себя
На пилоте зафиксируйте исходную нагрузку, стоимость обращения и долю диалогов, которые можно перевести на робота без потери качества.
Срок пилота и срок окупаемости лучше не смешивать. Пилот нужен, чтобы проверить сценарий, нагрузку и качество ответа, а окупаемость вы посчитаете после того, как команда определит стоимость интеграции, телефонии, поддержки и реальный процент автоматизации.
Заключение
Критерии выбора голосового робота важны: откуда он берёт знания, как работает с перебиваниями, какие действия выполняет, поддерживает ли SIP и BYOC, где хранятся данные, как оформлены согласия и как считается эффект пилота. После ответов на эти вопросы вы сможете сравнивать решения по качеству, рискам и экономике.
Источники
- Яков и Партнёры. Исследование рынка ИИ в России 2025
- arXiv. Исследование точности ответов с RAG и без поиска по документам
- ISCA Archive. Точность распознавания речи с перебиваниями в телефонных системах
- CNews. Автоматизация речевой аналитики в крупных российских проектах
- Google Cloud. Документация BYOC для Contact Center AI Platform
- КонсультантПлюс. Федеральный закон 152-ФЗ «О персональных данных»
- CNews. Росгосстрах: автоматизация голосовых обращений
- КонсультантПлюс. Федеральный закон 38-ФЗ «О рекламе», статья 18
- КонсультантПлюс. Требования ФАС к автоматическому дозвону