Доступ к нейросети для генерации русскоязычного текста ruGPT-3.5 открыл Сбер

По инф. ИА Телеинформ   
20.07.2023 23:49

Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B, сообщает пресс-служба банка.

Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B – самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке. Обе модели доступны на HuggingFace, и их могут использовать все разработчики (модели опубликованы под открытой лицензией MIT от английского MIT License – лицензия открытого и свободного программного обеспечения, разработанная Массачусетским технологическим институтом).

ruGPT-3.5

Внутри GigaChat находится целый ансамбль моделей – NeONKA (NEural Omnimodal Network with Knowledge-Awareness). Для его создания нужно было выбрать базовую языковую модель, которую потом можно было обучать на инструктивных данных. Russian Generative Pretrained Transformer версии 3.5 с 13 миллиардов параметров (ruGPT-3.5 13B) – новая версия нейросети ruGPT-3 13B.

Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 миллиардов параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования. Длина контекста модели составляет 2048 токенов. Она обучена на текстовом корпусе размером около 1 Тб, в который, помимо уже использованной для обучения ruGPT-3 большой коллекции текстовых данных из открытых источников, вошли, например, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Финальный чекпоинт модели – это базовый претрейн для дальнейших экспериментов.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub. В обучении модели участвовали команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

mGPT

Также в открытом доступе опубликована многоязычная модель mGPT 13B под открытой лицензией MIT. Версия mGPT 13B содержит 13 миллиардов параметров и способна продолжать тексты на 61 языке, включая языки стран СНГ и малых народов России. Длина контекста модели составляет 512 токенов. Она была обучена на 600 Гб текстов на разных языках, собранных из очищенных и подготовленных датасетов multilingual C4 и других открытых источников.

Модель может использоваться для генерации текста, решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Модель также доступна на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.

– Сбер как ведущая технологическая компания выступает за открытость технологий и обмен опытом с профессиональным сообществом, ведь любые разработки и исследования имеют ограниченный потенциал в замкнутой среде. Поэтому, мы уверены, что публикация обученных моделей подстегнёт работу российских исследователей и разработчиков, нуждающихся в сверхмощных языковых моделях, создавать на их базе собственные технологические продукты и решения. Пробуйте, экспериментируйте и обязательно делитесь полученными результатами, – говорит старший вице-президент, CTO, руководитель блока «Технологии» Сбербанка Андрей Белевцев.

ИА Телеинформ

новости электронных устройств и связи

Новости связи и IT-технологий

МТС оцифровала новый терминал аэропорта «Байкал» в Улан-Удэ

МТС построила масштабную телеком-сеть внутри нового пассажирского терминала аэропорта «Байкал» и обеспечила качественной связью пассажиров и гостей воздушных ворот Бурятии.

 
Новая базовая станция обеспечила жителей поселка Октябрьский-2 высокоскоростным интернетом и мобильной связью

«Ростелеком» и министерство цифрового развития и связи Иркутской области запустили в эксплуатацию новую базовую станцию сотовой связи в поселке Октябрьский-2 Тулунского района. Это одна из первых вышек, установленных в рамках реализации региональной госпрограммы «Цифровое развитие, связь и телекоммуникации».

 
На платформе Roblox появился «Кибергород» и эксклюзивные скины от «Ростелекома»

«Ростелеком» построил на игровой онлайн-платформе Roblox виртуальный мир «Кибергород» с эксклюзивными скинами в стиле киберпанк и мини-игрой с интересной полосой препятствий.

 
Раз – и «Навсегда»: «Ростелеком» предложил новые тарифы на услуги для дома и семьи, которые не изменятся никогда

«Ростелеком» запустил специальную акцию «Навсегда»: клиенты могут подключить все нужные для дома и семьи цифровые услуги по фиксированной цене – тарифы на них не будут повышаться никогда. В условиях, когда вокруг всё меняется, включая ценники в магазинах, тарифы по новой акции «Ростелекома» будут «Навсегда» радовать своей стабильностью.

 
МТС второй год подряд становится лидером цифровой безопасности для абонентов Иркутской области

Аналитики компании J'son Partners Consulting назвали лидеров цифровой безопасности на основе ежегодного исследования крупнейших российских экосистем и операторов связи.

Метки:
 

Сергей Шмидт - серия колонок

Видеосюжеты
Сергей Шмидт: Срок