«России нужен промышленный конвейер исследований в области ИИ» Сергей Марков рассказал как технологии меняют бизнес и общество
Недавно прошла ежегодная технологическая конференция GigaConf, главной темой которой стал генеративный искусственный интеллект (GenAI). Ключевое отличие этой технологии — способность создавать новый контент, комбинируя доступные инструменты. Перспективы развития данной технологии предполагают фантастические изменения для обычных пользователей и в бизнес-процессах. О том, как будет формироваться новый технологический ландшафт, как трансформируются нейросети и почему уже сегодня нужно делать ставку на продуктовые инновации, «Лента.ру» поговорила с одним из спикеров конференции — директором по развитию технологий искусственного интеллекта.
«Лента.ру»: Что произойдет на GenAI-рынке к середине 2025 года?
Мы живем в интересную эпоху, поскольку оказались в самом разгаре лет искусственного интеллекта. Тренды настоящего во многом связаны с технологиями генеративного искусственного интеллекта. Сегодня мы находимся в стадии системной трансформации технологии генеративного ИИ в технологию интерактивного ИИ. Системы искусственного интеллекта подходят к решению задач, которые не выполняются за один шаг.
Одно дело сгенерировать картинку по текстовому запросу, другое дело — найти необходимые референсы, сгенерировать эскизы, обсудить их с пользователем, возможно, по результату выбрать наилучший вариант, затем его отредактировать в соотвествии с командами пользователя и т.д. Когда мы говорим об интерактивном ИИ, речь идет именно о системах, способных решать комплексные интеллектуальные задачи и в процессе их решения взаимодействовать с заказчиком, другими системами ИИ, использовать различные внешние инструменты.
Что такое LLM-модели, как они работают и какие тренды, связанные с ними, определяют ситуацию в индустрии?
Строительным кирпичиком интерактивного ИИ являются LLM-агенты. Сам по себе термин в основе своей содержит латинский корень и, переводя его дословно, мы понимаем, что речь идет о чем-то или ком-то, кто может выполнять действия. В основе LLM-агента лежит большая языковая модель. И принципиальное отличие современных языковых моделей от тех, которыми мы пользовались еще несколько лет назад, заключается в том, что они способны не только выполнять простые задачи вроде написания текста или мозгового штурма, но и строить цепочки рассуждений, генерировать команды для вызова внешних инструментов.
Каковы тренды развития ИИ в глобальном масштабе, с учетом национальных особенностей крупных игроков?
В мире идут процессы, связанные с регионализацией, увеличением закрытости. Все уже давно шутят на тему того, что OpenAI, как компания, которая в своем названии содержит слово «открытый», в действительности делится минимумом результатов своих исследований с обществом. Она ограничивается только скупыми техническими отчетами. Если еще год-два назад в публичной сфере в области ИИ самыми обсуждаемыми были вопросы, связанные с этикой, с применением технологий ИИ во благо человечества, то сегодня тон обсуждений сместился. Вектор обсуждений направлен на поиск «неправильных» стран, которые хорошо бы ограничить в технологиях.
В целом очевидно стремление определенных кругов ограничить использование технологий с балансом контрольной и демократичной атмосферы. Россия должна в полной мере использовать возможности в международном партнерстве.
Если заглянуть в ближайшее будущее, то мои надежды связаны с созданием в России промышленного конвейера исследований. Создание более эффективных алгоритмов и методов возможно только, если мы поставим эксперименты и инновации на поток; если в единичном времени мы будем проверять больше гипотез, если сможем обеспечить более надежную проверку гипотез, снижая вероятность ошибки в такой проверке. Я верю в то, что исследования, поставленные на «промышленные рельсы», способны привести к феноменальным результатам.
Технологии будут менять мир к лучшему?
Конечно, ИИ в конечном итоге принесет благо человечеству, поскольку технологии — важная часть общественного прогресса. Они расширяют границы возможного для человека, для нашего разума, подобно тому, как это произошло в других областях. У нас нет острых когтей и клыков — появились вилки и ножи. У нас нет густого меха и толстой шкуры — мы придумали одежду. Наш биологический разум ограничен, эволюция идет гораздо медленнее, чем технический прогресс — мы создаем такой класс инструментов, который позволяет расширить границы возможного для человека, усилить его возможности в решении интеллектуальных задач.
Какие еще тренды, помимо агентности, можно выделить сегодня?
Справедливо будет назвать быстрое развитие мультимодальности (модели учатся оперировать не только текстом, они осваивают и речь, и музыку, и изображения, и видео). Появляются модели, которые в решении разных задач способны сочетать разные модальности. Свяще́нным Граалом в этой области являются модели, которые могли бы получать на вход смесь текста и картинки и на выход выдавать любую композицию. Но в целом направление исследований сегодня очень многообразно. Понятно, что, когда появился ChatGPT, внимание и интерес общества, финансовых и исследовательских кругов сместились в сторону ИИ и особенно больших языковых моделей.
На эту сферу было выделено дополнительное количество ресурсов, вычислительных и человеческих. Поэтому сегодня эти технологии развиваются стремительно. Тестируется много идей, некоторые из них связаны с определенными вызовами, которые наметились в развитии больших языковых моделей. Например, с тем, что количество текстовых данных в мире растет темпами более медленными, чем растут вычислительные бюджеты на обучение моделей. А это значит, что для того, чтобы обеспечивать дальнейшее совершенствование моделей, мы должны каким-то образом придумывать, как более эффективно использовать доступные нам данные. Все это определяет положение дел в индустрии и задает тренды.
Каковы тенденции развития ИИ в глобальном масштабе, с учетом национальных особенностей крупных игроков?
В мире идут процессы, связанные с регионализацией, увеличением закрытости. Все уже давно шутят на тему того, что OpenAI, как компания, которая в своем названии содержит слово «открытый», в действительности делится минимумом результатов своих исследований с обществом. Она ограничивается только скупыми техническими отчетами. Если еще год-два назад в публичной сфере в области ИИ самыми обсуждаемыми были вопросы, связанные с этикой, с применением технологий ИИ во благо человечества, то сегодня тон обсуждений сместился. Вектор обсуждений направлен на поиск «неправильных» стран, которые хорошо бы ограничить в технологиях.