Kandinsky 4.0 Video: Сбер представил обновленную нейросетевую модель для создания видео

ИА БайкалИнформ   
13.12.2024 09:55

Сбер представил на международной конференции AI Journey бета-версию нейросети нового поколения Kandinsky 4.0 Video для создания реалистичных видеороликов по текстовому описанию или стартовому кадру, сообщает пресс-служба банка.

Нейросеть могут использовать как обычные пользователи, чтобы создать анимированные ролики с поздравлением близких людей, так и дизайнеры, маркетологи, мультипликаторы, для которых Kandinsky может стать помощником в генерации трейлеров и клипов.

– За год с момента релиза первой версии модели Kandinsky Video на AI Journey 2023 наша команда значительно улучшила такие показатели, как качество и скорость генерации полноценных видеороликов, открывая тем самым безграничные горизонты для креатива, а также продуктовых применений модели. Теперь каждый пользователь новой версии Kandinsky Video может воплотить свои идеи и выразить их в видеоформате. Мы всегда рады видеть, как наши технологии помогают людям реализовывать свои самые смелые творческие задумки. При этом всё ближе то время, когда искусственный интеллект будет способен решать множество задач сразу, причем с самыми разными типами данных и в разных доменах. И такие модели как Kandinsky Video способствуют мировому развитию в этом важном направлении, значительно приближая современные технологии к тому синергетическому уровню обработки, восприятия и создания информации, каким обладает человек, – сообщил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.

Продолжительность и разрешение

Теперь модель генерирует видеоряд продолжительностью до 12 секунд в разрешении HD (1280x720) по любому текстовому описанию или произвольному стартовому кадру. С помощью модели можно создавать видео с разным соотношением сторон под любые пользовательские и продуктовые потребности.

Качество и реалистичность

Важнейшими отличительными свойствами новой модели являются улучшенное визуальное качество – высокий контраст и чёткость кадров, выстраивание общей композиции сцены, и реалистичность движений генерируемых объектов. Добиться такого качества позволило уникальное сотрудничество научных и инженерных команд, которые вместе работали как над развитием архитектуры новой модели, так и над сбором и фильтрацией данных для обучения.

В дополнение к основной модели команда Kandinsky представила быструю версию Kandinsky 4.0 Video Flash, которая генерирует видеоряд продолжительностью до 12 секунд в разрешении 480p (720x480) по любому текстовому описанию всего за 15 секунд.

Kandinsky 4.0 Video – это ансамбль моделей, главная часть которого является диффузионным трансформером с пятью миллиардами параметров. Инженеры команды Kandinsky использовали самые передовые алгоритмы и способы оптимизации обучения больших моделей, что позволило эффективно выучить модель такого размера на огромных массивах видео. Модель разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института AIRI на объединённом датасете Сбера.

Первыми доступ к новой версии Kandinsky Video получат представители креативных индустрий – художники, дизайнеры и кинематографисты. Для них модель будет доступна в рамках инструмента https://fusionbrain.ai/, который даёт его пользователям возможность генерировать полноценные мини-фильмы – со сценарием, полноценным видеорядом и звуковым сопровождением. Для широкой аудитории нейросеть будет доступна в первом квартале 2025 года.

Реклама Байкальский Банк ПАО Сбербанк, Erid: 2Vfnxy192Qg

Новости компаний

Маркетплейсу для предпринимателей Portal DA исполнилось семь лет

Площадка Portal DA позволяет предпринимателям быстро и без посредников найти имущество для бизнеса. Ежедневно платформу посещают более четырех тысяч пользователей, сообщает пресс-служба Сбера.

 
Представители Национальной библиотеки Якутии рассказали об опыте использования ИИ-помощника

Национальная библиотека Якутии представила свой проект на основе GigaChat на AI Journey в Москве, сообщает пресс-служба Сбера.

 
Искусственный интеллект Сбера GigaChat научился создавать музыку и вокал по текстовым запросам

Новые музыкальные возможности GigaChat не только способствуют реализации творческого потенциала человека, но и помогают решить насущные задачи в работе и быту, сообщает пресс-служба Сбера.

 
Сбер рассказал на AI Journey об ИИ-разработках: защита природы, поиск безбилетников и пропавших людей

Сбер рассказал об опыте применения ИИ-решений в 76 регионах страны, поиске безбилетников и пропавших людей с помощью ИИ, о сотрудничестве с Росзаповедцентром с целью сохранения природы, применении ИИ-видеоаналитики при выращивании овощей на международной конференции Сбера по искусственному интеллекту AI Journey. Об этом сообщает пресс-служба компании.

 
ИИ призван стать важнейшим ресурсом достижения национальных целей развития России, заявил Владимир Путин

На международной конференции AI Journey («Путешествие в мир искусственного интеллекта») завершилась главная дискуссия «Искусственный интеллект для человека. Помогая людям, объединяя страны», сообщает пресс-служба Сбера.

Метки:
 

Сергей Шмидт - серия колонок

Видеосюжеты
Сергей Шмидт: Срок