«Сбер» представил бесплатную бета-версию нейросети Kandinsky Video 1.1. Она предназначена для создания шестисекундных роликов по текстовому описанию и изображению.
Новая версия ИИ-модели позволяет «оживлять» статичную картинку. Формат сгенерированного видео — непрерывная сцена с движением объекта и фона.
Модель генерирует видеоряд продолжительностью до шести секунд с частотой восемь и 32 кадра в секунду. При этом ролик можно создавать в разных форматах — 16:9, 9:16 или 1:1. В новой версии также можно контролировать динамику генерируемого видео с помощью специального параметра motion score.
Новую ИИ-модель разрабатывали и обучали исследователи Sber AI при поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.
Напомним, что в ноябре 2023 года «Сбер» показал нейросеть Kandinsky Video — генеративную модель для создания полноценных видеороликов по текстовому описанию. Тогда отмечалось, что её архитектура состоит из двух ключевых блоков. В основе обоих лежит модель Kandinsky 3.0.
Источник: Sostav