IP-телефония на базе Asterisk
Введите свой номер телефона
и мы перезвоним вам
Решаем Ваши бизнес-задачи с помощью IT-технологий. Знаем, как сделать лучше, быстрее и дешевле. Наш опыт – на службе Вашего бизнеса.
Не все герои носят плащи. Сотни техических статей, написанных инженерами нашей компании. Делимся опытом и своими знаниями со всем сообществом.
Сотни функций и возможностей Asterisk помогут вывести коммуникации в Вашей компании на принципиально новый уровень. Технические ограничения – фантазия Заказчика.
Вы платите за систему, которая будет полностью соответствовать Вашим ожиданиям, требованиям и будет драйвером роста Вашего бизнеса
Идти в ногу со временем или оставаться на старых технологиях? Такой вопрос не стоит перед нашими клиентами. Решаем самые смелые задачи для Колл-Центров. Строим с нуля или работаем с существующими.
Поместите свой бизнес в эпицентр продаж. Интеграция IP-телефонии и CRM даст новый и мощный импульс Вашему Отделу Продаж и выведет компанию на три шага впереди конкурентов.
Подбираем для клиентов такие тарифы, которые ему редко получится найти на рынке самостоятельно. Работаем с 100+ операторов связи в интересах клиента.
Разработки, созданные нашей командой под запросы клиентов. Не отказывайтесь от инноваций. Мы поможем идти с ногу со временем.
Умные всю жизнь учатся, а остальные всегда все и так знают. Мы проводим обучение более 8 лет и выпустили более 1000 специалистов по Asterisk и Mikrotik. Проводим ежегодную конференцию Asterisk.
Купить наш опыт дешевле, чем набивать свои шишки. Мы реализовали более 800 проектов и накопили экспертизу для того, чтобы идеально выполнить Ваш проект.
Правильный выбор оборудования позволяет сэкономить от 20 до 50% бюджета телефонии. Мы предельно внимательно подойдем к выбору «железа» в Ваш проект.
Наши цены доступны не только для Москвы, но и для регионов. А вложения в нашу экспертизу обычно окупаются за несколько месяцев.
Работаем с 2011 года. Собрали отличную команду реальных фанатов своего дела. Подходим к работе с душой и ответственностью.
Данный материал посвящён обзору синтеза речи, основным элементам его пайплайна, а также технологиям, применяемым в современных сервисах преобразования текста в голос. Отдельно рассматриваются задачи, связанные с обработкой голоса и речи, решаемые в рамках платформы Tinkoff VoiceKit. Доклад ориентирован на специалистов, которые не слишком глубоко погружены в машинное обучение, но работают с телефонией и смежными направлениями.
В банке Tinkoff развитие голосовых технологий началось с команды студентов из Вистеха, которые разрабатывали речевую аналитику для колл-центра. Первоначально активно применялось решение Яндекса для распознавания речи, однако быстро возникла необходимость в собственных моделях: их можно оперативно обучать на специфичных данных, что улучшало итоговое качество распознавания.
Параллельно появилась идея разрабатывать и синтез речи «под ключ» внутри компании. В 2018 году была создана первая «MVP-версия» синтеза. Годом позже, в 2019-м, состоялся релиз голосового помощника «Олег» в приложении Tinkoff — ключевой вехой стало объединение технологий синтеза, распознавания и инфраструктуры в единый продакшн.
В том же году были представлены модули для Asterisk, дающие возможность интегрировать синтез и распознавание в эту телефонию на базе разработок Tinkoff. Решение опубликовано в open source и продолжает активно использоваться.
В 2021 году началось развитие технологии voice conversion (преобразование голоса) и голосовой биометрии на основе нейросетей. Подобные инструменты находят применение в различных сервисах, включая колл-центры и системы безопасности.
Для этого применяется векторизация слов (например, модель BERT) и несколько параллельных нейросетевых моделей.
Система кэширует готовые фрагменты, чтобы при повторе одинакового текста не запускать тяжёлый процесс заново. При релизах новые версии моделей обнуляют кэш, чтобы слушатели получали обновлённое качество озвучки.
Если во входных данных присутствуют ошибки или бессвязные фрагменты (например, «java.lang.Object.ru.tinkoff.amshans.if java.lang.Boolean java.lang.Object …»), синтезируетcя именно то, что было прислано. Система не исправляет и не фильтрует подобные искажения.
В ближайших релизах планируется дать возможность управлять скоростью, высотой и громкостью речи на этапе синтеза. Это особенно важно для голосовых роботов, которые должны подстраивать темп и интонацию под различные сценарии.
Для задания параметров применяется SSML (Speech Synthesis Markup Language), позволяющий, например, в одной и той же фразе менять голос, тембр, громкость и расстановку пауз.
Дополнительные материалы, примеры работы Vocoder’ов и результаты тестирования доступны на сайте Tinkoff VoiceKit. Там же можно протестировать доступный функционал синтеза и распознавания.
Синтез речи в Tinkoff прошёл путь от эксперимента в колл-центре до комплексного решения, способного обслуживать масштабные задачи в области голосовых технологий. Адаптированные под телефонию Asterisk модули, собственные модели синтеза и распознавания, а также новые разработки вроде voice conversion и голосовой биометрии дают широкие возможности для создания современных и эффективных голосовых сервисов.
Работы в этом направлении продолжаются, и впереди ожидается появление ещё более гибких и точных инструментов, которые позволят развивать голосовые решения в разных отраслях — от клиентской поддержки до автоматизации сложных бизнес-процессов.
Билеты уже в продаже!
Я - Компаниец Никита, менеджер компании Voxlink. Хотите уточнить детали или готовы оставить заявку? Укажите номер телефона, я перезвоню в течение 3-х секунд.
Быстро узнать мобильного или городского оператора. Впишите номер