'
Зеленский А.Д.
АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА *
Аннотация:
в статье представлены методы реализации и обучения смешанной модели нейронной сети для диагностирования сердечно-сосудистых заболеваний по снимкам МРТ. Модель базируется на архитектурах Unet++ и DenseNet. Основа подхода заключается в декомпозиции задачи диагностирования на 2 подзадачи: сегментация изображений и классификация. Это позволило достичь высокой точности и оптимального потребления вычислительных ресурсов
Ключевые слова:
сердечно-сосудистые заболевания, снимки МРТ, сверточные нейронные сети, архитектура U-net++, архитектура DenseNet
УДК 004.42
Зеленский А.Д.
бакалавр
Национальный исследовательский университет ИТМО
(г. Санкт-Петербург, Россия)
АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ
НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ
СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА
Аннотация: в статье представлены методы реализации и обучения смешанной модели нейронной сети для диагностирования сердечно-сосудистых заболеваний по снимкам МРТ. Модель базируется на архитектурах Unet++ и DenseNet. Основа подхода заключается в декомпозиции задачи диагностирования на 2 подзадачи: сегментация изображений и классификация. Это позволило достичь высокой точности и оптимального потребления вычислительных ресурсов.
Ключевые слова: сердечно-сосудистые заболевания, снимки МРТ, сверточные нейронные сети, архитектура U-net++, архитектура DenseNet.
По данным Всемирной организации здравоохранения сердечно-сосудистые заболевания (ССЗ) являются основной причинной смерти населения в мире. Предложенные в работе методы позволят повысить эффективность существующих моделей нейронных сетей (НС) для распознавания и анализа медицинских изображений, что упростит диагностирование заболеваний сердца.
Основа подхода - это разделение основной задачи распознавания заболеваний по снимкам МРТ на 2 подзадачи. Первая подзадача это сегментация изображений, а вторая подзадача классификация уже предобработанных (сегментированных) изображений (рисунок 1). Такой подход позволяет повысить эффективность относительно моделей с односложными структурами. Так же это позволяет значительно расширить базу изображений для обучения моделей, так как декомпозиция первоначальной задачи сильно снижает требования к входным данным, что положительно сказывается на точности работы итоговой программы.
Рисунок 1 - визуализация архитектуры декомпозированной модели
В качестве объекта исследования выступают наборы данных (датасеты) со снимками МРТ сердечной мышцы человека на основе анализа которых и будет выноситься вердикт о предполагаемом заболевании. Использовались датасеты Data Science Bowl Cardiac Challenge Data[1] и Sunnybrook Cardiac Data[2] из открытых источников.
В наборе данных Data Science Bowl Cardiac Challenge Data представлены МРТ снимки сердца 1580 пациентов. Данные представлены в двух различных проекциях: снимки сечения по короткой оси левого желудочка и снимки четырехкамерного сечения. Так же набор содержит соответствующую разметку левого желудочка и коронарных сосудов для каждого снимка.
Набор Sunnybrook Cardiac Data содержит медицинские снимки МРТ сердца 45 пациентов в различных сечениях в формате DICOM: по короткой оси левого желудочка и четырёхкамерное сечение. Так же содержит заключение врача-диагноста по заболеванию выявленному у пациента.
Всего представлено 6 соответвующих меток диагнозов: Normal, Hypertrophy, Hypertension, Heart deseas, Heart failure without infarct и Heart failure with infarct.
Для сегментации изображений была выбрана архитектура Unet++ [3], так как она хорошо зарекомендовала себя в задачах распознавания медицинских изображений.
Модель сегментации содержит 4 блока энкодеров и соответствующее количество декодеров. Восстанавливающие блоки применялись на каждом уровне пропускных связей. Такое построение архитектуры позволило достичь точности сегментации левого желудочка сердца и коронарных сосудов с точностью 91% на тестовой выборке.
Для обучения модели выбран модификатор градиентного спуска Mini-batch SGD [6] (Mini-batch Stochastic gradient descent), так как имеет более предсказуемое поведение расчета градиента в отличие от модификации SGD, но как и предшественник позволяет избегать локальных минимумов при обучении.
В качестве функции потерь использовалась Binary Cross-Entropy Loss (1).
(1)
, где –верный индекс класса, – Softmax встречаемость i-го класса
Обучение проводилось на выборке Data Science Blow Cardiac Challenge Data из 1500 серий снимков в 2х проекциях: по короткой стороне левого желудочка и четырёхкамерном сечении. Обучение достигло отметки в 92% на валидационной выборке к 46 эпохе.
Модель классификации основывается на архитектуре DenseNet, так как она имеет методы борьбы с затуханием градиента, наблюдаемом на моделях большой сложности, а также хорошо показывает себя в задачах со сравнительно малой обучающей выборкой.
Была разработана модель архитектуры DenseNet, состоящая из 4 плотных блоков, как показано на рисунке 2. Каждый плотный блок включает повторяющиеся плотные слои, которые последовательно соединены слоями конкатенации.
При обучении так же использовался модификатор Mini-batch SGD, однако в качестве функции потерь была выбрана Categorical Cross-Entropy Loss Function (2)
(2)
, где –верный индекс класса, – Softmax встречаемость i-го класса
Обучение проходило на данных Sunnybrook Cardiac Data, содержащие информацию по заболеванию и серии снимков для 45 пациентов. К данным были применены методы автоматического расширения выборки, такие как: Random rotation, Width shift и Height shift. За счёт применённых методов удалось расширить датасет до 450 примеров.
Рисунок 2 – модель плотного блока сети DenseNet
Перед подачей в модель DenseNet[5] данные сегментировались моделью Unet++, что позволяло выбирать из изображений только контуры левого желудочка и коронарных сосудов, за счёт чего упрощалась задача классификации [4].
После обучения в течении 50 эпох модель достигла точности в 81% на тестовой выборке, метрики обучения можно увидеть на рисунке 3.
Рисунок 3 - метрики обучения итоговой модели
Полученная модель имеет относительно небольшую сложность, среднее время обработки запроса составило около 7 секунд при довольно высоком показатели точности. Таки результаты подтверждают обоснованность и эффективность предложенного подхода по решению сложных задач распознавания и классификации изображений.
СПИСОК ЛИТЕРАТУРЫ:
Номер журнала Вестник науки №6 (63) том 1
Ссылка для цитирования:
Зеленский А.Д. АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА // Вестник науки №6 (63) том 1. С. 889 - 894. 2023 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/8693 (дата обращения: 19.05.2024 г.)
Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2023. 16+
*