Yandex Cloud научила ИИ расставлять знаки препинания при распознавании речи

Обсудить на форуме - Помощь проекту

Облачная платформа Yandex Cloud сообщила, что научила ИИ расставлять знаки препинания при распознавании речи. Для этого был обновлен сервис Yandex SpeechKit, предназначенный для синтеза и распознавания речи на базе машинного обучения. Таким образом теперь при переводе голоса в текст сервис сам расставляет необходимые знаки пунктуации.

Разработаны нововведения для улучшения пользовательского опыта в сценариях, где человек напрямую взаимодействует с речевыми технологиями – например, при общении с голосовым помощником, автоматическом транскрибировании (преобразовании голосовой информации в текстовую) или формировании субтитров.

Новую функцию Yandex SpeechKit назвали «Пунктуатор». Она работает и при распознавании в реальном времени, что актуально для сценариев с голосовыми помощниками, и при распознавании предзаписанных аудиофайлов. Распознанный же нейросетью текст, по словам разработчиков, максимально приближен к литературному, чтобы проще восприниматься читателем.

Разработан «Пунктуатор» с помощью двух последовательно работающих моделей машинного обучения, где первая занимается переводом голоса в текст, а вторая – расстановкой знаков препинания, руководствуясь нормами русского языка. К настоящему времени модель уже расставляет все основные пунктуационные знаки. Оценить работу «Пуктуатора», настраиваемого стандартными средствами в API (программном интерфейсе приложения), могут все пользователи Yandex SpeechKit.

Неделей ранее iot.ru рассказывал о появлении в TikTok дополненной реальности. Новый инструмент, получивший название Effect House, создан, чтобы разнообразить форматы контента и дать авторам новые возможности для самовыражения и развлечения аудитории.

Дополнительно: