Оглавление
Исследование, опубликованное в научном журнале Cureus, показывает, что языковая модель ChatGPT способна распознавать заболевания роговицы по фотографиям щелевой лампы с точностью, превышающей 85%. Это одно из первых исследований, где большая языковая модель применяется для диагностики офтальмологических заболеваний.
Методология исследования
В ретроспективном исследовании использовалась база данных из 1247 фотографий щелевой лампы, сделанных в период с 2020 по 2022 год. Снимки включали различные патологии:
- Инфекционный кератит
- Язвы роговицы
- Дистрофии роговицы
- Дегенеративные изменения
- Рубцовые изменения
- Нормальные роговицы
ChatGPT в версии GPT-4 анализировал изображения через API OpenAI, предоставляя первичный диагноз, дифференциальную диагностику, уровень уверенности и ключевые диагностические признаки.
Результаты диагностики
Общая точность диагностики составила 85,2% с доверительным интервалом 83,1-87,1%. Модель продемонстрировала особенно высокие показатели в выявлении инфекционного кератита — чувствительность 92,3% и площадь под ROC-кривой (AUC) 0,91.
Другие ключевые метрики по заболеваниям:
- Язвы роговицы: чувствительность 88,7%, специфичность 84,2%
- Дистрофии роговицы: чувствительность 79,4%, специфичность 91,8%
- Дегенерации роговицы: чувствительность 83,1%, специфичность 88,9%
Анализ уверенности модели
Исследователи отметили корреляцию между уровнем уверенности ChatGPT и правильностью диагноза. Средняя уверенность при верных диагнозах составляла 87,3%, тогда как при ошибочных — всего 52,1%.
Вот что получается — языковая модель, изначально созданная для генерации текста, внезапно оказывается способной ставить медицинские диагнозы лучше некоторых интернов. Хотя результаты впечатляют, возникает закономерный вопрос: не станем ли мы свидетелями ситуации, когда ИИ начинает заменять не только рутинные задачи, но и экспертные оценки? Особенно учитывая, что модель демонстрирует адекватную самооценку — когда не уверена, так и говорит. В регионах с нехваткой офтальмологов такой инструмент мог бы стать настоящим спасением, но вот вопрос ответственности за ошибки пока остается открытым.
Клинические перспективы и ограничения
Авторы исследования подчеркивают, что ChatGPT может стать ценным диагностическим помощником, особенно в условиях ограниченных ресурсов или для начинающих специалистов. Однако они отмечают необходимость человеческого контроля при постановке окончательного диагноза.
Среди ограничений исследования — ретроспективный дизайн и возможная систематическая ошибка отбора изображений. Требуются дальнейшие проспективные исследования для валидации результатов.
По материалам Cureus.
Оставить комментарий