На конференции ACL 2025 обсудили способы ускорения создания российских ИИ
На международной конференции ACL 2025, одной из самых значимых площадок в области компьютерной лингвистики, исследователи представили результаты научной статьи «GigaChat Family: Эффективное моделирование русского языка с помощью архитектуры смеси экспертов».
В статье раскрываются преимущества архитектуры «смесь экспертов» (Mixture of Experts, MoE), которая позволяет моделям работать подобно команде специалистов, активируя только необходимые элементы системы в зависимости от задачи. Результаты работы GigaChat демонстрируют значительное преимущество в скорости и экономичности по сравнению с аналогичными решениями при сохранении высокого качества.
В Сбере отмечают, что разработка обладает особым значением для российского рынка, так как ранее не существовало качественных языковых моделей, созданных специально для русского языка и учитывающих его культурные и лингвистические особенности. GigaChat открывает новые возможности для бизнеса — от автоматизации клиентской поддержки до генерации контента.
Младшая из семейства моделей уже доступна для свободного использования. Особого внимания заслуживает разработанный исследователями токенизатор, оптимизированный специально для русского языка, который позволяет более точно управлять тематикой ответов искусственного интеллекта (AI).
«Российские компании получают доступную и эффективную технологию для создания чат-ботов, автоматизации текстовых задач и разработки AI-сервисов на русском языке. Для ученых открыты веса моделей и код, что ускоряет исследования, а стартапы могут создавать AI-продукты без больших затрат. Это важный шаг в развитии русскоязычного искусственного интеллекта», — отметил технический директор GigaChat Сбербанка Федор Минькин.