Сбер: бенчмарк MERA назвал GigaChat 2 MAX сильнейшей нейросетевой моделью на русском языке

ИА БайкалИнформ   
18.03.2025 15:05

По данным бенчмарка MERA для русского языка, модель Сбера GigaChat 2 MAX занимает первое место среди AI-моделей. А в международных бенчмарках обновлённый модельный ряд превосходит по многим показателям GPT4o, DeepSeek-V3, LLaMA 70B и Qwen2.5. Об этом сообщает пресс-служба Сбера.

Весь модельный ряд GigaChat 2.0 получил значительный апгрейд, что позволяет бизнес-клиентам быстрее и качественнее решать текущие задачи и реализовывать масштабные проекты.

  • GigaChat 2 MAX стал ещё мощнее и уверенно опережает многие зарубежные аналоги в задачах на русском языке.
  • GigaChat 2 Pro демонстрирует качество на уровне предыдущей версии MAХ и справляется с задачами, в которых важны креатив и точность. При этом сама модель менее требовательна к ресурсам.
  • GigaChat 2 Lite – базовая модель для решения лёгких задач – по качеству теперь сопоставима с предыдущей версией Pro: на ней можно быстрее и выгоднее решать сложные задачи.

Сбер: бенчмарк MERA назвал GigaChat 2 MAX сильнейшей нейросетевой моделью на русском языке

Фото: пресс-служба Сбербанка

Пользователи сохраняют доступ к моделям первого поколения и могут протестировать GigaChat 2.0, прежде чем перейти на новый модельный ряд. Чтобы подобрать оптимальную для своего бизнеса версию GigaChat и промпты для неё, необязательно разбираться в программировании. Вся линейка доступна бизнесу в облаке через API, её также можно развернуть локально в инфраструктуре компании (on-premise).

– GigaChat 2.0 демонстрирует не просто рост метрик и технических характеристик, а значительный шаг в развитии русскоязычных больших языковых моделей (LLM). Мы создали модель на уровне лучших мировых решений, а в задачах на русском языке модель превосходит большинство из них. Сильные отечественные нейросети стратегически важны для любого бизнеса, который ведёт свою деятельность в России. 15 тысяч внешних клиентов уже используют GigaChat, и мощное обновление нашей линейки позволит ещё большему числу клиентов эффективнее решать огромный спектр задач. Совершенствуя процессы с помощью искусственного интеллекта, компании получат уникальную возможность опередить конкурентов, увеличить прибыль и повысить лояльность потребителей, – заявил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.

Позволяют создавать более продуктивных AI-агентов

На базе GigaChat 2.0 компании смогут создавать более продуктивных автономных помощников (AI-агенты), способных рассуждать и самостоятельно решать сложные многокомпонентные задачи. Это стало возможным поскольку модели увеличили свои знания в математике, естественных и гуманитарных науках, научились лучше программировать и писать более качественный код. Для разработки агентов на Python и JS можно использовать популярный SDK LangChain, с которым GigaChat полностью совместим. Пакеты совместимости доступны в публичном репозитории GigaChain.

Обрабатывают в четыре раза больше контекста

Модели нового поколения гораздо дольше удерживают контекст беседы, отвечают на сложные длинные вопросы и анализируют больше текста. Если раньше в один запрос можно было загрузить примерно 48 страниц A4 с текстом (шрифт 14 pt), то теперь максимальный объём запроса вырос почти до 200 страниц. Поэтому с GigaChat 2.0 удобнее создавать чат-ботов.

В два раза лучше решают рабочие задачи

Новые модели в два раза точнее следуют инструкциям пользователя и на 25% лучше отвечают на вопросы: соблюдают заданные форматы и условия, формируют ответы в определённом стиле, что помогает эффективнее решать рабочие задачи: готовить сопроводительную правовую документацию, анализировать обращения клиентов и так далее.

В числе мировых лидеров

По данным независимого бенчмарка MERA для русского языка, GigaChat 2 MAX занимает первое место среди AI-моделей. А по результатам бенчмарков формата MMLU на русском и английском языках, новый модельный ряд не уступает показателям мировых лидеров или даже в чем-то превосходит их. Наиболее впечатляющие результаты показала флагманская модель линейки. По сравнению с DeepSeek-V3, Qwen2.5 (версия Qwen-2.5-75b), GPT4o и LLaMA 70B GigaChat 2 MAX лучше отвечает на фактологические вопросы на русском языке и следует заданному формату. Модель также опережает зарубежные аналоги на бенчмарке для оценки кодовых способностей HumanEval и более глубоко разбирается в точных науках.

Сбер: бенчмарк MERA назвал GigaChat 2 MAX сильнейшей нейросетевой моделью на русском языке

Фото: пресс-служба Сбербанка

Реклама Байкальский Банк ПАО Сбербанк, Erid: 2VfnxyDrKbW

Новости компаний

Сбер: бенчмарк MERA назвал GigaChat 2 MAX сильнейшей нейросетевой моделью на русском языке

По данным бенчмарка MERA для русского языка, модель Сбера GigaChat 2 MAX занимает первое место среди AI-моделей. А в международных бенчмарках обновлённый модельный ряд превосходит по многим показателям GPT4o, DeepSeek-V3, LLaMA 70B и Qwen2.5. Об этом сообщает пресс-служба Сбера.

 
Дети сотрудников БрАЗа отправятся в «Экспедицию на планету РУСАЛ»

Дети сотрудников Братского алюминиевого завода вновь получат возможность провести летние каникулы в корпоративном лагере «Экспедиция на планету РУСАЛ» в Хакасии. Программа реализуется в рамках социальной политики компании, направленной на поддержку семей работников и создание благоприятных условий для отдыха и развития подрастающего поколения.

 
В Иркутске 18 марта на конференции Сбера обсудят ключевые изменения на рынке ИЖС

Сбер проведет конференцию по индивидуальному жилищному строительству 18 марта 2025 года в Иркутске, сообщает пресс-служба компании.

 
Праздничные мастер-классы организовал Женский совет БрАЗа

Женский совет БрАЗа организовал пять мастер-классов на встрече, посвященной Международному женскому дню. Более 50 участниц - сотрудницы завода, жены работников и ветераны предприятия собрались вместе, чтобы провести день в творческой атмосфере.

 
Среди жителей Иркутска 18% откладывают деньги регулярно, а 41% по мере возможности

Каждый пятый житель Иркутска (18%) заявил, что регулярно откладывает средства (в среднем по России – 17,7%), 41% сберегают по мере возможностей (по России – 37,9%), а 9% опрошенных планируют начать это делать (по России – 12,6%), показало исследование СберСтрахования жизни. Об этом сообщает пресс-служба Сбера.

Метки:
 

История Оксаны Костиной, художественная гимнастика

Видеосюжеты
Сергей Шмидт: Срок