Названы области медицины, где ИИ догнал живых врачей в точности диагностики

Применение генеративного искусственного интеллекта в медицинской диагностике вызывает растущий интерес научного сообщества — по этой теме уже опубликованы десятки исследований. Однако различия в методологии их проведения давно требовали комплексного анализа, который показал бы реальный потенциал ИИ в клинической практике и его преимущества по сравнению с врачами.
В Высшей школе медицины Осакского столичного университета (OMU) такой метаанализ провели. Он включил 83 исследования, охватывающие применение нейросетей (разных, чаще всего ChatGPT) врачами различных медицинских специализаций. Результаты опубликованы в npj Digital Medicine. И они таковы:
- врачи-специалисты демонстрируют на 15,8% более высокую точность диагнозов по сравнению с генеративным ИИ,
- средний показатель точности ИИ составил 52,1%, при этом последние модели в некоторых случаях показывают результаты, сравнимые с врачами общей практики.
Наилучшей точности генеративные модели достигли в дерматологии, поскольку там диагностика во многом основана на визуальном осмотре, в чем ИИ действительно силен, и урологии, но это итог лишь одного исследования, и потому нужна дополнительная проверка.
В целом качество исследований оставляет желать лучшего — у 76% из них отмечен высокий риск систематической ошибки. Тем не менее, по ним понятно, что ИИ вполне может служить эффективным вспомогательным инструментом в клинической практике — но заменить специалиста, тем более опытного, пока не готов.
«Наше исследование демонстрирует, что диагностические возможности генеративного ИИ достигли уровня врачей общей практики. Эта технология может найти применение в медицинском образовании, стать подспорьем для врачей первичного звена и помочь в диагностике там, где доступ к специалистам ограничен. Однако для полного раскрытия потенциала ИИ необходимы дополнительные исследования», — прокомментировал доктор Хиротака Такита из OMU, руководивший исследованием.