Искусственный интеллект из России успешно прошел испытания в клинической практике
Недавний эксперимент, проведенный специалистами Института AIRI, показал, что российский AI-помощник в области здравоохранения, основанный на нейросетевой модели GigaChat, выступил в тестах на 30 реальных клинических случаях (из 200 случайным образом отобранных) из журнала New England Journal of Medicine с точностью 93 процента (28 верных заключений). Тестирование проходило по методике, аналогичной эксперименту проверки решения Microsoft AI Diagnostic Orchestrator (MAI-DxO).
Искусственный интеллект работал в следственном режиме, начав с базовых данных о пациентах — пола, возраста и симптомов. Далее модель последовательно запрашивала анализы, визуализации и консультации, чтобы прийти к диагнозу. Взаимодействие с медицинским работником состояло из трех приемов: информация от пациента — комментарий или вопрос врача — ответ пациента. Этот подход позволяет значительно ускорить процесс принятия решений.
«Эксперимент показал, что наша технология не только конкурентоспособна, но и может задавать стандарты в медицинской диагностике для всего мира. Мы видим, как мультитагентная архитектура ускоряет и улучшает процесс постановки диагнозов. Особенно важно, что система демонстрирует гибкость: она пересматривает гипотезы, запрашивает дополнительные данные и даже реагирует на эмоциональные подачи клинических сценариев. В будущем это открывает двери для консилиумов, где AI станет надежным помощником врача», — отметил директор Центра индустрии здоровья.
Все клинические случаи были отмечены тремя типами сложности. Искусственный интеллект успешно распознал такие редкие патологии, как болезнь Уиппла (за один ход), ацерулоплазмоз (за шесть ходов) и метгемоглобинемию, вызванную расбуки.
Помощник продемонстрировал несколько ключевых преимуществ. Он работает быстро — в среднем за три хода. Мыслит логически, успешно диагностируя редкие и сложные патологии. Сочетает клиническую строгость с гибкой диалоговой логикой и умеет работать с человекоориентированной подачей. Неожиданным эффектом эксперимента стала эмоциональная вовлеченность: драматические сценарии, как это часто происходит в реальной жизни, повысили диагностическую внимательность алгоритма.
«Сегодня мультитагентные системы способны уверенно различать редкие, маскирующиеся патологии за пределами типовых алгоритмов применного отделения. Сможет ли медицинский AI-ассистент вовремя перестроить гипотезу, отбросив наиболее вероятную, но ложную дорогу? AI-помощник показал, что способен, и делал это быстрее, чем ожидал эксперт-наблюдатель с 15-летним стажем в медицине», — рассказал генеральный директор Института AIRI Иван Оселедец.
Эксперимент носит пилотный характер и продолжается в данный момент. Исследователи AIRI планируют расширить выборку, включив кейсы из других медицинских журналов. Однако уже сейчас технология демонстрирует потенциал не только для практической медицины, но и для обучения врачей, предлагая им реалистичные симуляции сложных случаев.
AI-помощник был разработан учеными Института AIRI и специалистами СберМедИи и впервые представлен на конференции AI Journey 2024, после чего прошел пилотное тестирование в приложении медицинской компании «СберЗдоровье», где успешно функционирует и помогает людям. На данный момент им воспользовались уже более 160 тысяч раз.