«ВКонтакте» открыл сторонним разработчикам доступ к собственным технологиям распознавания речи
«ВКонтакте» открыл сторонним разработчикам доступ к собственным технологиям распознавания речи
Их можно интегрировать в любые проекты — от мини-приложений в соцсети и игр до сторонних стартапов.
Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на конференции Saint HighLoad++. «Применение технологии ограничено только фантазией разработчиков: можете сделать игру с голосовым управлением или с помощью чат-бота добавить распознавание аудио в сторонний мессенджер», — пояснил он. Речь о технологии Automatic Speech Recognition, или ASR, которая распознает устную речь и преобразует её в текст. Она работает при помощи трёх нейросетей: одна отвечает за само распознавание, вторая находит подходящие слова, третья расставляет знаки препинания. По словам компании, инструмент обрабатывает записи за несколько секунд, хорошо справляется с посторонними шумами и паузами, неразборчивым произношением, а также сленгом и сокращениями. Для распознавания работают две модели: нейтральная — для ясной речи, как, например, в телешоу или интервью, и спонтанная — для непринужденных бесед и монологов с разговорной и ненормативной лексикой. Компания предлагает две версии ASR: одна позволяет обрабатывать до 100 минут аудио в сутки, другая не имеет ограничений по времени, но её нужно запрашивать отдельно — отправив заявку. Технологию можно протестировать на отдельной странице, а также интегрировать через публичный API «ВКонтакте». Методы, с помощью которых создаются мини-приложения для «ВКонтакте, доступны по ссылке.
Источник: vc.ru
|