Онлайн‑общение — от чатов до звонков — уже давно анализируют с помощью ИИ. А как быть с живыми разговорами? Обновлённый Yandex SpeechSense теперь умеет работать и с офлайном — рассказываем, как это помогает бизнесу.
Речевую аналитику активно применяют в цифровых каналах и колл‑центрах: она помогает оценивать работу сотрудников поддержки или отдела продаж, следить за соблюдением скриптов и находить точки роста. Но значительная часть клиентского опыта по‑прежнему формируется офлайн — в офисах продаж, магазинах, поликлиниках, отделениях банков, кассовых зонах или даже в зоне обслуживания посетителей на автомобилях.
Анализ таких коммуникаций становится всё более актуальным, но на практике компании сталкиваются с ограничениями: многие решения не могут корректно работать с одноканальными записями, где в одном потоке звучат голоса нескольких собеседников. В результате теряется часть контекста и точность аналитики.
Мы обновили сервис Yandex SpeechSense, чтобы бизнес мог анализировать офлайн‑диалоги с одноканальных устройств: аудиобейджей и микрофонов. Теперь сервис автоматически различает голоса в записи и определяет роли собеседников: кто сотрудник, а кто клиент. Это упрощает подключение офлайн‑точек к аналитике и позволяет выявлять ценную информацию даже там, где раньше она была недоступна.
Новая функциональность построена на комбинации нескольких технологий:
Благодаря такому подходу можно анализировать диалоги не только как поток текста, но и как структурированный разговор с конкретными ролями и действиями. Это особенно важно в сценариях, где качество взаимодействия напрямую влияет на продажи и удовлетворённость клиентов.
По нашей оценке, потенциальный объём российского рынка речевой офлайн‑аналитики — около 11,5 млрд рублей. Это свыше 320 тыс. звукозаписывающих устройств, включая диктофоны и аудиобейджи. Для сравнения: на глобальном уровне мы оцениваем рынок в 6–7 млрд долларов, и доля России в нём — примерно 1,9%. Такие решения особенно востребованы в финансовом секторе (12% сотрудников отрасли), медицине (8%), ритейле (6%) и ресторанной сфере (4%) — где живое общение с клиентом играет ключевую роль.
Работа SpeechSense с одноканальными записями строится поэтапно. Вот как это устроено:
Если у вас уже есть аккаунт в Yandex Cloud, можно сразу переходить к работе с Yandex SpeechSense. Здесь мы собрали пошаговую инструкцию для быстрого старта: https://yandex.cloud/ru/docs/speechsense/quickstart.
Подключение — это раздел в интерфейсе Yandex SpeechSense, где настраиваются параметры передачи данных. Здесь нужно указать тип аудиозаписей. Для анализа записей с микрофонов, камер или аудиобейджей выберите вариант «Одноканальное подключение».
Если в загружаемых аудио содержатся длинные фрагменты и вам нужно выделить только целевые диалоги между оператором и клиентом, включите опцию «Разбивать диалоги на отрезки».

Важно: аналитика тарифицируется только по целевым диалогам — фоновые разговоры и личные обсуждения, например между сотрудниками, не учитываются в расчётах.
После создания подключения и проекта можно загружать данные. Это делается через API — чтобы вы могли повторить, собрали подробную документацию с готовыми примерами кода на Python™.
Анализировать загруженные данные можно через встроенные инструменты Yandex SpeechSense. Подробности — в обучающих видео How to Support, How to Sell, а также в совместном курсе с Яндекс Практикумом.
Несколько компаний уже испытывают новую функциональность SpeechSense в своих офлайн‑точках:
Все кейсы находятся в стадии пилотирования. Их масштабирование позволит точнее оценить влияние на метрики качества и продаж.
Работа с одноканальными аудио — привычная практика для многих компаний, но до сих пор такие данные редко становились частью полноценной аналитики. Обновление в Yandex SpeechSense закрывает этот пробел: теперь можно обрабатывать записи с микрофонов и аудиобейджей так же удобно, как и звонки в колл‑центр — с разметкой ролей, поиском ключевых фраз и разбивкой по сценариям.
Функциональность уже доступна. Она не требует изменений в инфраструктуре, работает с готовыми записями и настраивается под конкретные задачи бизнеса.
.
Источник: https://yandex.cloud/ru/blog/yandex-speechsense-update