Челлендж по автоматической сегментации лёгких на КТ

Челлендж по сегментации лёгких — lola11.com

Когда мы запускали этот челлендж, главной целью было понять, насколько по-разному люди подходят к выделению лёгочных полей на КТ. Я тогда работал рентгенологом и каждый день видел, сколько времени уходит на разметку даже нескольких срезов. Хотелось создать пространство, где врачи, инженеры и просто энтузиасты смогли бы сравнить свои методы и найти неочевидные приёмы.

Участники присылали маски, выполненные полностью вручную, с помощью полуавтоматических инструментов или собственных скриптов. Разброс подходов оказался огромным — от тщательного пиксель-художества до грубой пороговой обработки где-то на коленке. Но именно это разнообразие и стало самым ценным: мы собрали десятки кейсов, которые впоследствии помогли сформулировать базовые принципы качественной сегментации.

Что дал челлендж: разбор решений и методические рекомендации

После завершения основного этапа мы систематизировали все работы и выделили несколько ключевых проблем, с которыми сталкивается практически каждый, кто пытается оконтурить лёгкие на КТ:

Прилегание плевры и средостения. Алгоритмы часто «захватывают» соседние структуры, если не учитывать анатомические границы. В ручной разметке это решается опытом, но для автоматизации нужны дополнительные эвристики.
Сосудистые структуры в корнях лёгких. Многие участники либо включали крупные сосуды в маску, либо наоборот — вырезали слишком агрессивно, теряя часть лёгочной ткани. Мы показывали, как небольшая коррекция пороговых значений меняет результат.
Зоны консолидации и матового стекла. Ручной сегментатор обычно интуитивно включает участки уплотнения в объём лёгкого, а простейшие пороговые методы могут их пропустить. В челлендже это стало одной из главных точек расхождения между участниками.

На основе этих наблюдений мы подготовили серию методических заметок. Они не претендуют на статус учебника, но дают практические ориентиры: как выбирать окно визуализации, как проверять края, какие инструменты полуавтоматической коррекции реально экономят время. Все материалы мы выложили в открытый доступ и до сих пор получаем вопросы от студентов и врачей, которые только начинают работать с КТ-изображениями.

Интервью с участниками: что оказалось самым трудным

Челлендж не ограничивался сухим сравнением метрик Dice и IoU. Мы поговорили с несколькими участниками, которые предложили нестандартные подходы. Один из них использовал комбинацию активных контуров и ручной корректировки опорных точек на каждом десятом срезе — это давало очень быструю разметку всей серии, но требовало аккуратного подбора начальной инициализации. Другой участник, физик по образованию, написал небольшой скрипт на Python, который анализировал гистограмму интенсивностей и сам предлагал верхний и нижний пороги для бинаризации. Его решение работало хорошо на типичных КТ без выраженной патологии, но ломалось на сложных случаях.

В этих разговорах стало понятно: ручная разметка никогда не будет полностью воспроизводимой не потому, что люди плохо стараются, а потому что само понятие «лёгкое» на томограмме включает множество пограничных решений. И именно это подтолкнуло меня к мысли, что нужно двигаться в сторону алгоритмов, способных учиться на примерах, а не только на жёстко заданных правилах.

От челленджа к автоматической сегментации: первые шаги

Сразу скажу: никакой «смены тематики» не было. Скорее, естественное развитие. Челлендж показал ограничения ручных методов, и захотелось понять, а можно ли автоматизировать хотя бы черновую сегментацию так, чтобы врач тратил время только на проверку и правку сложных мест. Я начал с классических подходов, которые десятилетиями использовались в обработке медицинских изображений:

Пороговая обработка с морфологической постобработкой. Выбор порога по гистограмме в диапазоне HU (единиц Хаунсфилда), затем удаление мелких объектов и сглаживание границ. Это быстро, но очень зависит от качества исходного снимка и не работает при обширных уплотнениях.
Метод наращивания регионов. От затравки внутри лёгочной ткани алгоритм «разрастается», пока не встречает резкий перепад плотности. Плюс в том, что он меньше реагирует на шум, но приходится аккуратно выбирать порог остановки.
Активные контуры (змеи). Итерационно подтягивают начальную кривую к реальным границам лёгкого, учитывая как интенсивность, так и гладкость контура. Подход гибкий, но требует начального приближения, а с глубокими вырезками на средостении справляется нестабильно.

Экспериментируя с этими методами, я всё чаще натыкался на ситуации, где универсального правила не существует. Например, лёгкое курильщика с эмфиземой и лёгкое молодого пациента без патологий требуют совершенно разных параметров. И тогда стало ясно: пора смотреть, что могут дать нейросети.

Приход U-Net и свёрточных сетей

Примерно в тот же период в научной литературе активно обсуждалась архитектура U-Net, специально созданная для биомедицинской сегментации. В отличие от классических методов, она обучается на парах «изображение — маска» и не требует ручного подбора параметров под каждый томограф. Я начал с простых реализаций на Keras, используя публичные датасеты, а затем и данные, полученные в ходе нашего челленджа — предварительно проверив их на согласованность.

Первые результаты впечатляли: сеть достаточно уверенно отделяла лёгочные поля даже в присутствии плеврального выпота или новообразований. Однако быстро выяснилось, что остаётся проблема с артефактами на границе сердца и крупных сосудов, а также с мелкими субплевральными очагами, которые маскируются под сосуды. Потребовалась более тонкая настройка — аугментация данных, регуляризация и постобработка предсказаний с помощью условных случайных полей (CRF).

Постепенно из чисто геометрической задачи сегментация лёгких превратилась в задачу понимания контекста. И этот переход оказался ключевым: если сеть способна выделить лёгочную ткань, значит, она может научиться находить внутри неё паттерны — узелки, участки «матового стекла», консолидации. Так появилась идея перейти от простого оконтуривания к содержательному анализу КТ.

Дальше — больше: от сегментации к объёмным измерениям и поиску патологий

Имея надёжную маску лёгких, можно автоматически вычислять объём лёгочной ткани, отслеживать динамику при хронических заболеваниях, выделять подозрительные области для прицельного просмотра. Мы начали экспериментировать с многоэтапными пайплайнами: сначала U-Net сегментирует лёгкие, затем вторая сеть анализирует внутреннюю структуру и размечает зоны интереса. Это уже гораздо ближе к реальной клинической задаче, чем просто контур.

Параллельно приходилось решать вопросы с форматами: большинство клинических КТ хранятся в DICOM, и для подачи на вход нейросети нужна была аккуратная предобработка — нормализация, приведение к единому шагу среза, устранение анатомической асимметрии. Здесь помогал опыт, полученный ещё на этапе челленджа: тогда мы столкнулись с разными протоколами сканирования и научились это учитывать.

Клиническое внедрение и рабочий процесс

Сейчас, оглядываясь назад, я вижу прямую линию: челлендж по ручной сегментации запустил цепочку вопросов, которые вели к автоматическим, затем к нейросетевым методам, а теперь уже затрагивают интеграцию с PACS и нормативные аспекты. Медицинская визуализация не стоит на месте, и алгоритмический анализ КТ лёгких постепенно становится рутиной, особенно в скрининговых программах и при динамическом наблюдении онкологических пациентов.

На страницах этого сайта я продолжаю делиться практическими гайдами по сегментации, обзорами архитектур, разборами реальных кейсов внедрения ИИ в клиниках. Много внимания уделяю тому, как проверять качество работы алгоритмов — тот же коэффициент Дайса, который когда-то считали на челлендже вручную, теперь вычисляется автоматически, но вопрос доверия к нему всё ещё не снят. А ещё — как сочетать автоматический анализ с экспертным контролем, чтобы не потерять важные находки.

Челлендж по сегментации лёгких не закончился с последней присланной маской. Он продолжается в каждом сравнении классического подхода с нейросетевым, в каждой проверке нового датасета и в попытках сделать инструментарий по-настоящему полезным для врача. И если вы хотите присоединиться к этому разговору — будь то новичок или опытный разработчик — материалы этой страницы должны стать хорошей отправной точкой.

Илья Руденко, автор lola11.com