Сбер представил Giga-Embeddings и Kandinsky Video Lite
Сбер анонсировал открытый доступ к обновленной модели для создания векторных представлений текста Giga-Embeddings и к модели генерации видео Kandinsky Video Lite. Оба продукта доступны по открытой лицензии, позволяющей свободное использование в любых коммерческих проектах. Об этом сообщил старший вице-президент, руководитель блока «Технологическое развитие» на мероприятии «День ИИ» в Сколково.
«Научная команда Сбера активно публикует различные модели генеративного искусственного интеллекта», — отметил Андрей Белевцев. Он добавил, что в открытом доступе уже представлены модели линейки Kandinsky и семействo акустических моделей для русского языка GigaAM, которые используются в сервисе GigaChat. По его словам, предоставление бизнесу и разработчикам новых инструментов ускоряет исследования и развитие продуктов мирового уровня, а также укрепляет позиции России в технологической сфере.
Kandinsky Video Lite создает короткие видеоролики длительностью до десяти секунд по текстовому запросу и содержит около двух миллиардов параметров. По внутренним тестам разработчика, модель по совокупному качеству превосходит более крупные решения, включая Wan 2.1 14B, Wan 2.2 5B и оригинальную Sora, а по визуальному качеству сопоставима с Wan 2.2 A14B, которая больше Kandinsky в тринадцать раз. При обучении уделялось внимание пониманию отечественного культурного контекста: был сформирован специальный датасет из более чем миллиона изображений и видео, значительная часть которых отбиралась в несколько этапов командой художников и дизайнеров. Также доступна ускоренная версия Kandinsky Video Lite Flash, работающая примерно в шесть раз быстрее базовой.
Giga-Embeddings преобразует текстовую информацию в векторные представления и, по данным Сбера, занимает первое место в общем зачете бенчмарка ruMTEB с результатом 74.1. Модель предназначена для построения RAG-систем, повышения качества поиска по документам, аналитики данных и автоматизированной поддержки пользователей на актуальной информации.
Модели уже доступны для свободного использования на ведущих платформах. Kandinsky Video Lite размещена на Hugging Face, GitVerse и GitHub. Giga-Embeddings опубликована на Hugging Face и GitVerse.