Kandinsky

Kandinsky — многоязычная платформа для генерации изображений и видео из текстовых описаний, разработанная Сбером в сотрудничестве с FusionBrain. Названа в честь русского художника Василия Кандинского, основателя абстрактного искусства. Kandinsky особо выделяется поддержкой русского языка и культурной адаптацией к русскому менталитету (например, понимает, что «селедка под шубой» — это салат, а не рыба в одежде).

Модель имеет несколько версий: Kandinsky 3.1 — последняя генерация (11.9B параметров, уникальная архитектура), Kandinsky 2.2 (поддержка ControlNet, фотореализм, до 1024×1024), Kandinsky 2.1 (3.3B параметров, SOTA качество на 2023 год) и Kandinsky 2.0 (первая мультиязычная версия). Более 12 млн уникальных пользователей генерировали более 200 млн изображений. Платформа интегрирована в СберБанк Онлайн, Hugging Face и GitHub.

Особенности:

Мультиязычность: поддержка 101+ языка, особенно оптимизирована для русского.
Kandinsky 3.1: 11.9B параметров, SOTA качество, упрощенная архитектура без prior-модели.
Kandinsky Flash: быстрая генерация с улучшением качества через дистилляцию.
Текст-в-изображение с фотореализмом и художественными стилями.
Режимы: смешивание изображений, вариации, outpainting, inpainting, перенос стиля.
Генерация видео: четырехсекундные гифки и композиции.
ControlNet: локальное редактирование сгенерированных изображений.
Открытый исходный код на GitHub и интеграция с Hugging Face.
Интеграция в СберБанк Онлайн для создания персональных заставок.

Ссылки:

Записей не найдено.