Рассказываем, что такое федеративное обучение, как с его помощью можно безопасно тренировать ML-модели на чувствительных данных и какую роль в этом играют облачные технологии.
Федеративное обучение — метод тренировки ML-моделей, при котором данные остаются на стороне владельца и не передаются внешним подрядчикам. Метод соответствует ФЗ № 152 «О персональных данных», его можно применять для работы с конфиденциальной информацией, например в медицине.
Такой подход позволяет каждой медицинской организации хранить данные в своём формате, и это не мешает обучению модели. В одной больнице данные могут быть в формате CSV, в другой — в JSON, а в третьей — в виде записей в реляционной базе данных.
С помощью федеративного обучения можно объединить ресурсы разных учреждений без централизованного обмена данными. Этот метод позволяет обучать модель на локальных данных каждой организации, несмотря на различия в форматах.
Эксперимент, проведённый командой Yandex Cloud совместно с Сеченовским Университетом и ИСП РАН, продемонстрировал, что метод работает на практике. Он помогает распознавать патологии сердца на снимках ЭКГ. Цель сотрудничества — подтвердить эффективность федеративного подхода в медицине, где конфиденциальность данных особенно важна.
Пока это единственный случай применения федеративного обучения ML-модели на медицинских данных в России.
В статье расскажем о том, как прошёл эксперимент и как федеративное обучение помогло решить проблему разнородности и нехватки данных. Поделимся результатами применения федеративного обучения и возможностями, которые эта технология открывает для медицины в будущем.
Обычно при обучении моделей ИИ данные собираются из различных источников: архивов медицинских учреждений, устройств для мониторинга здоровья и баз данных пациентов, и передаются на центральный сервер, где происходит их обработка и обучение модели.
Такой подход может создавать риски для конфиденциальности данных, особенно в таких сферах, как медицина. Например, возможны утечки или несанкционированный доступ к персональным медицинским данным пациентов.
Федеративное обучение работает по-другому. Модель тренируется на локальном сервере клиента, который называется федеративным сервером и является частью распределённой системы обучения. Данные остаются у клиента, а на центральный федеративный сервер отправляются только обновлённые параметры модели, где они объединяются с параметрами, полученными от других клиентов.
При таком подходе сохраняется конфиденциальность данных, так как они остаются у владельцев и не передаются на центральный сервер. Это позволяет объединить ресурсы различных медицинских учреждений для улучшения качества моделей.
Архитектура федеративного обучения. На центральном федеративном сервере обезличенные параметры модели объединяются от всех клиентов, которые участвуют в обучении
Центральный федеративный сервер не обрабатывает и не хранит исходные данные, как это происходит в традиционных централизованных системах. Его задача — координировать обучение, агрегируя параметры для улучшения общей модели, обеспечивая при этом конфиденциальность данных.
После того как параметры модели от всех клиентов объединяются на центральном федеративном сервере, её обновлённая версия возвращается на устройства клиентов, чтобы учиться на новых данных.
Благодаря этому модель учитывает изменения и особенности каждого клиента, становясь точнее и эффективнее. Этот процесс повторяется до тех пор, пока разработчики не достигнут заданных метрик качества: точности предсказаний и устойчивости модели.
Кроме того, вместе с параметрами модели на локальные федеративные серверы отправляется задание по её обучению. Оно содержит инструкции, как именно должна обучаться модель на локальных данных, и включает в себя, например, параметры конфигурации обучения, шаги оптимизации и критерии, которые должны быть учтены при обучении.
Перед тем как задание будет выполнено, его код и конфигурация проверяются на каждом федеративном сервере. Проверка включает:
Архитектура федеративного обучения. Код задания и его конфигурация проверяются на каждом федеративном сервере для обеспечения безопасности и соответствия стандартам
Если проверка успешна, обучение модели начинается на локальных данных. В случае неудачи задание отклоняется. Это предотвращает утечку данных и гарантирует, что обучение происходит в надёжной среде.
Их всего три: горизонтальное, вертикальное и трансферное.
Подробнее о федеративном обучении
При федеративном подходе модель обучается на инфраструктуре владельца данных, а расходы покрывает заказчик. Если у команды нет серверов, оснащённых графическими процессорами (GPU), которые необходимы для сложных вычислений, можно арендовать необходимую инфраструктуру у облачного провайдера. Графические процессоры значительно ускоряют процесс обучения сложных моделей, таких как нейронные сети. Доступна и гибридная модель, когда часть данных хранится и обрабатывается локально, а часть — в облаке.
Облачный провайдер предоставляет посекундную оплату за ресурсы, что позволяет платить только за фактическое использование и избегать лишних расходов.
Эксперимент заключался в обучении ML-модели, чтобы распознавать патологии сердца на основе данных ЭКГ. Для этого использовали фреймворк NVFlare, который поддерживает федеративное обучение с использованием GPU. Команда архитекторов Yandex Cloud продумала архитектуру и внедрила техническое решение, а Сеченовский Университет предоставил медицинскую поддержку и экспертизу.
Проект реализовали на гибридной инфраструктуре: ИСП РАН развернул часть ресурсов в своём ЦОД, а команда Yandex Cloud подключила дополнительные облачные серверы с нужной конфигурацией, чтобы данные оставались в закрытом контуре и обучение соответствовало принципам федеративного.
Инженеры компании «ИМПРУВ ИТ» разработали схему, которая позволила развернуть фреймворк в облаке и настроить его буквально по клику, чтобы вычислительные ресурсы использовались только во время обучения и не расходовались впустую.
На схеме изображены основные компоненты системы, используемой в эксперименте. В инфраструктуре Yandex Cloud развёрнут FL-сервер, а также FL-клиент Сеченовского Университета. В свою очередь, FL-клиент ИСП РАН развёрнут в локальной инфраструктуре института. Также во фреймворке используется специальный клиент — Admin Console для администрирования кластера и управления обучением. FL-сервер координирует работу FL-клиентов. Все подключения к FL-серверу используют протокол gRPC, а каждый клиент работает со своим приватным датасетом по протоколу S3. Кроме того, в системе использован бакет с одноразовыми ключами для распространения конфигураций FL-клиентов
Такой подход позволил протестировать инфраструктуру на недорогих виртуальных машинах и подключать дорогостоящие GPU только для обучения моделей. Это значительно снизило расходы на вычислительные ресурсы.
Проблему нехватки медицинских данных решили, выбрав для эксперимента расшифровки данных ЭКГ: их было достаточно для обучения модели. Также у данных единая разметка, поэтому нам не пришлось приводить их к единому стандарту, что сэкономило время.
ИСП РАН адаптировал свою существующую модель для классификации ЭКГ, чтобы она могла работать в рамках фреймворка федеративного обучения, и запустил тренировку. Обучение провели на датасете из 57 тысяч двенадцатиканальных ЭКГ: 22 тысячи от ИСП РАН и 35 тысяч от Сеченовского Университета и ИКТИ РАН.
В ходе эксперимента специалисты обучили модель диагностировать 12 видов фибрилляции предсердий. Чувствительность модели составила 99%, а специфичность — 95%. Результаты работы модели проверили трое врачей функциональной диагностики с опытом работы более 10 лет, чтобы убедиться в её точности и клинической применимости.
В медицине алгоритмы федеративного обучения применяют как для анализа статистических данных пациентов, так и для диагностики болезней — в системах поддержки принятия врачебных решений (СППВР). В системах используются технологии компьютерного зрения для лучевой диагностики и прогнозные инструменты для обработки и анализа данных пациентов. Всё это помогает врачам ставить диагнозы.
«Полного совершенства при обследовании с нейросетями достичь пока что не удаётся, но это и не нужно: всё же мы говорим об использовании нейросетей для помощи врачу, а не для его замены. Системы поддержки принятия врачебных решений берут на себя ту часть работы, которую можно автоматизировать и которая связана с рутинными процедурами, занимающими время. Но конечное решение принимает врач, и он может при необходимости самостоятельно проанализировать нужные показатели, учесть то, что не учла программа, и составить окончательное мнение».
Институт персонализированной кардиологии Сеченовского Университета вместе с научными сотрудниками из ИСП РАН и ИКТИ РАН разрабатывает устройства, которые работают с СППВР и помогают в дистанционном мониторинге сердца с помощью алгоритмов федеративного обучения.
Они фиксируют сердечно-сосудистые заболевания, помогают обрабатывать ЭКГ, значения ЧСС и пульсовой волны. Модель помогает врачам расшифровывать полученные данные и определяет предварительный диагноз. При необходимости можно отправить данные коллегам и проконсультироваться.
«В ИСП РАН разработка алгоритмов федеративного обучения — часть создания систем доверенного искусственного интеллекта. В этом году при поддержке Минобрнауки России открылась молодёжная лаборатория, где мы обучаем большие модели для медицинских задач. Также мы занимаемся защитой данных и предотвращением угроз, которые могут повлиять на качество обучения. Это имеет важное научное и практическое значение, что подтверждается успешным экспериментом с Сеченовским Университетом и Yandex Cloud».
Федеративное обучение применимо не только в здравоохранении, но и в других сферах. Например, в финансовой отрасли его можно использовать для обнаружения мошенничества и оценки кредитоспособности. При этом данные клиентов остаются защищёнными, что особенно важно при работе с конфиденциальной информацией.
Проект обучения ML-модели на медицинских данных реализовали при поддержке Центра технологий для общества Yandex Cloud.
В проектах, связанных с наукой и образованием, здравоохранением, экологией и культурой, Yandex Cloud выступает технологическим партнёром: анализирует потенциал реализации, разрабатывает IT-архитектуру, бесплатно предоставляет доступ к технологиям и консультациям экспертов, а также оказывает маркетинговую и PR-поддержку. Оставить заявку на партнёрство с Yandex Cloud можно на сайте центра.
Источник: https://yandex.cloud/ru/blog/posts/2024/10/ml-models-and-federated-learning