В Стэнфордском университете разработали систему искусственного интеллекта, которая распознаёт пневмонию, эмфизему лёгких и другие заболевания по рентгенограмме грудной клетки. Всего спустя месяц после начала обучения она стала выполнять анализ снимков с меньшим числом ошибок, чем допустили участвовавшие в тесте врачи-рентгенологи.

Взгляните на снимок выше и попытайтесь поставить диагноз. Сложно? Конечно, ведь умение расшифровывать рентгенограммы требует большого опыта. Диагностика пневмонии – частная задача из области анализа изображений, в которой есть масса тонкостей. Выделяют отдельные наборы рентгенологических признаков для определения стадии пневмонии и её локализации, наличия плеврита и сопутствующих осложнений. Иногда пневмонию легко проглядеть или спутать с другими заболеваниями лёгких, поэтому находить и правильно интерпретировать диагностические признаки врачи учатся годами.

В последнее время классическая рентгенография вытесняется цифровой, а к обработке оцифрованных данных привлекают системы искусственного интеллекта. Их преимущество в том, что они учатся выполнять анализ изображений гораздо быстрее человека. Врач физически не сможет изучить миллион снимков за всю свою жизнь, а нейросеть справится с таким объёмом за полгода-год.

Качество диагностики врача зависит не только от его опыта, но и от его психоэмоционального состояния. Искусственный интеллект лишён влияния человеческого фактора, а его точность – это легко вычисляемый показатель, который предсказуемо растёт по мере работы.

В основе созданного в Стэнфорде ИИ под названием CheXNet лежит свёрточная нейросеть (CNN). Она содержит 121 слой и относится к так называемым глубоким нейронным сетям. Её ключевое отличие от более простых CNN состоит в том, что она способна обучатся с минимальным участием человека и, следовательно, исключительно быстро.

Классический подход машинного обучения подразумевает, что для нейросетей требуется предварительная формализация признаков. Для этого программисты и профильные специалисты вместе пытаются перевести решаемую задачу на язык математики и прикладной статистики. В глубоких нейронных сетях формализация признаков происходит автоматически, что экономит время их обучения. Дополнительные начальные слои в них самостоятельно выполняют преобразование исходных сигналов в наборы векторов, которые далее анализируются следующими слоями.

Каждый слой – это группа изолированных друг от друга нейронов с общими входами. Большинство существующих нейронных сетей содержат от трёх до пары десятков слоёв. Их число определяется решаемой задачей и методами её математического описания.

В любой нейросети первый слой – входной. Он принимает на вход какой-либо сигнал (в данном случае – оцифрованную рентгенограмму). Второй и последующий слои выполняют преобразования сигнала, выделение признаков и их анализ. Самый последний слой всегда служит для вывода. Он формирует на выходе какой-либо результат в заданном виде. У CheXNet это расшифровка рентгенограммы с указанием типа, локализации патологического процесса и оценкой его выраженности.

Уже сейчас CheXNet может помочь практикующим врачам, представляя анализы рентгенограмм в более информативном виде. На их основе он создаёт “тепловую карту” грудной клетки, на которой условными цветами выделяет зоны патологических процессов. Каждому соответствует свой цвет, и чем сильнее он выражены, тем более яркой будет выглядеть поражённая область. Например, вот так выглядит многоочаговая пневмония.

Созданием CheXNet руководил известный специалист в области машинного обучения адъюнкт-профессор Стэнфордского университета Эндрю Ын (Andrew Ng). Наверняка вы знаете его и как сооснователя образовательного портала Coursera.

Написание алгоритма CheXNet заняло всего неделю. Обучение нейросети выполнялось по данным, опубликованным Национальными институтами здравоохранения США в сентябре 2017 года. Обобщённый набор содержал 112`120 рентгенограмм грудной клетки c 14 разными диагнозами. Исследователи отобрали из него 420 снимков, после чего удалили данные диагностики и попросили четырех рентгенологов из Стэнфорда выполнить их описание.

Спустя месяц результаты практикующих врачей сравнили с работой CheXNet, и нейросеть оказалась точнее в своих выводах. Аналогичная ситуация была с определением не только пневмонии, но также пневмоторакса, эмфиземы и других патологий, распространённых в пульмонологии. Во всех тестах ИИ превзошёл рентгенологов как по критерию чувствительности (корректно указывая наличие заболевания), так и по критерию специфичности (правильно определяя отсутствие признаков заболевания).

На графике ниже показатели качества диагностики четырёх отдельных врачей представлены оранжевыми крестиками, их усреднённый результат – зеленым крестиком, а результаты ChexNet – синей кривой, отображающей изменение пороговых значений, используемых для диагностики.

В своей работе Эндрю Ын и соавторы отмечают, что CheXNet – это начало качественно нового этапа в развитии медицины. Недавние достижения в области глубокого обучения позволили создавать алгоритмы, которые статистически достоверно превосходят по качеству диагностики специалистов в самых разных областях. Уже созданы эффективные алгоритмы для определения типа аритмии (Rajpurkar et al., 2017), обнаружения диабетической ретинопатии (Gulshan et al., 2016), рака кожи (Esteva et al., 2017) и других заболеваний.

Статья подготовлена по материалам исследования “CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning”.

Автор статьи: Андрей Васильков

Изображения взяты с: Tumbler, Stanford ML Group.

Максим Костерин

Максим Костерин

Редактор и разработчик в THE-ROBOT.RU
Интересуюсь робототехникой, программированием и бизнесом. В нашей команде я технарь.
Максим Костерин
Поделись ссылкой
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •