«Сбер» представил обновленную нейросеть, генерирующую тексты на 61 языке мира

Обсудить на форуме - Помощь проекту

Входящая в «Сбер» IT-компания полного цикла SberDevices представила многоязычную версию анонсированной в 2020-ом нейросети GPT-3 (используется в виртуальных ассистентах Джой и Афине, разработанных в «Сбере», и находится на платформе SmartMarket). Новая же модель, получившая название mGPT, готова генерировать тексты на 61 языке мира, включая языки стран СНГ и народов России, среди которых – киргизский, азербайджанский, калмыцкий, татарский, бурятский и якутский. Попали в список и такие языки, как африкаанс, баскский, бенгали, бирманский, малаялам, маратхи, персидский, суахили, тайский, тамильский, телугу, урду и хинди.

«mGPT – это первая в мире генеративная модель, которая поддерживает такое количество языков», – рассказали в пресс-службе «Сбера», отметив, что модель доступна в двух версиях. Базовая версия нейросети с 1,3 млрд параметров опубликована в открытом доступе в облачном хранилище «СберДиск». Расширенную же версию, насчитывающую 13 млрд параметров, «Сбер» обещает сделать доступной вскоре на платформе машинного обучения ML Space от SberCloud.

По словам разработчиков, использовать mGPT можно и для генерации текста, и для решения различных задач в области обработки естественного языка путем дообучения или в составе ансамблей моделей. Автоматизированная система сможет научиться отвечать на вопросы, определять эмоциональную окраску текста, извлекать из текста сведения, вроде, имен, фамилий, названий компаний и пр. «Модель может также использоваться как компонент различных речевых технологий – например, для улучшения качества распознавания речи, генерации сценариев диалоговых систем и т. д.», – добавили в «Сбере», указав, что mGPT станет и вкладом компании в сохранение и развитие языков народов России.

В начале месяца iot.ru рассказывал о представленном «Сбером» новом кассовом устройстве «3 в 1», которое работает на Android 10 и заменяет ритейлу полноценную POS-систему с системным блоком и монитором.

Дополнительно: