Обновление Kandinsky: Новая модель генерации изображений
Согласно недавнему заявлению, представлена новая версия модели генерации изображений на основе Kandinsky 4.1 Image.
В новой модели нейрохудожников появился AI-редактор MALVINA (Мультифункциональный Искусственный Язык Визуальный Невральный Ассистент), который позволяет редактировать изображения, следуя текстовым инструкциям.
Основой новой версии модели генерации изображений является обновленная архитектура — диффузионный трансформер (DiT). Модель Kandinsky 4.1 Image была дообучена на отобранных вручную изображениях, сбалансированных по девяти метака категориям (люди, техника, природа и другие). Отбор данных проводился командой, состоящей более чем из 100 специалистов.
Модель умеет распознавать стили известных художников, таких как Айвазовский, Босх, Кранаха, Кандинский и других. Кроме того, пользователь может создавать изображения в различных художественных стилях — от импрессионизма до поп-арта или генерировать изображения, например, в стиле знаменитой анимационной студии Ghibli.
Интеграция телеграм-бота GigaChat с AI-редактором MALVINA открывает пользователям возможность редактировать любые изображения.
«Новый редактор изображений в GigaChat — это простой и удобный инструмент для реализации любых креативных задумок. Он работает с пиксельной точностью, сохраняя максимум исходных деталей, но при этом позволяет легко менять фон, объекты и даже стиль фото. Теперь пользователи могут не тратить время на графические редакторы — достаточно освоить несколько текстовых команд. Мы специально обучили обновленную модель Kandinsky на разнообразных и при этом детальных выбранных данных, чтобы нейросеть могла работать с различными сценами: от портретов до пейзажей. Интеграция с GigaChat превращает нашу языковую модель в универсальный инструмент для творчества и работы, который может освоить любой желающий», — отметил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев.