Глоссарий

Активное обучение

Открой для себя активное обучение - экономически эффективный метод машинного обучения, который повышает точность при меньшем количестве меток. Узнай, как он преобразует обучение ИИ!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Активное обучение - это специализированная область машинного обучения (ML), в которой алгоритм обучения может в интерактивном режиме запрашивать у пользователя, часто называемого "оракулом" или человеком-аннотатором, метки для новых точек данных. В отличие от традиционного контролируемого обучения, которое обычно требует большого, предварительно помеченного набора данных, активное обучение нацелено на достижение высокой производительности модели при значительно меньших усилиях по маркировке. Для этого оно стратегически выбирает наиболее информативные немаркированные экземпляры для аннотации. Такой подход особенно ценен в тех областях, где получение меченых данных дорого, требует много времени или специальных экспертных знаний, например в анализе медицинских изображений или сложных задачах обработки естественного языка (NLP). Основная идея заключается в том, чтобы позволить модели руководить процессом маркировки данных, направляя усилия человека туда, где они будут наиболее эффективны для повышения точности модели.

Как работает активное обучение

Процесс активного обучения обычно следует итерационному циклу, позволяя модели постепенно улучшаться с помощью целевых данных:

  1. Начальное обучение модели: Модель, например Ultralytics YOLO модель для обнаружения объектов или сегментации изображений, обучается на небольшом, изначально помеченном наборе данных.
  2. Запрос немаркированных данных: Обученная модель используется для предсказаний(inference) на пуле немаркированных данных.
  3. Применение стратегии запросов: Стратегия запросов анализирует предсказания модели (например, на основе уверенности или неопределенности предсказания), чтобы выбрать наиболее информативные немаркированные точки данных - те, в отношении которых модель наименее уверена или которые, как ожидается, дадут наибольшее количество новой информации.
  4. Аннотация оракула: Выбранные точки данных предоставляются человеку-аннотатору (оракулу) для маркировки. Эффективный сбор данных и практика аннотирования имеют здесь решающее значение.
  5. Переобучение модели: Новые помеченные данные добавляются к обучающему набору, и модель переобучается (или настраивается) на этом расширенном наборе данных.
  6. Итерация: Цикл повторяется с шага 2 до тех пор, пока не будет достигнут желаемый уровень производительности, исчерпан бюджет на маркировку или не останется ни одного информативного образца.

Стратегии запросов

Эффективность активного обучения во многом зависит от стратегии запросов - алгоритма, используемого для выбора точек немаркированных данных, которые должны быть помечены следующими. Цель состоит в том, чтобы выбрать образцы, которые, будучи помеченными, скорее всего, приведут к наибольшему улучшению производительности модели. К распространенным стратегиям относятся:

  • Выборка неопределенности: Выбирает случаи, когда модель наименее уверена в своем предсказании. Это часто измеряется вероятностью предсказания, энтропией или разницей между верхними предсказаниями.
  • Query-by-Committee (QBC): Использует ансамбль моделей. Для маркировки выбираются случаи, когда члены комитета больше всего расходятся во мнениях относительно предсказания.
  • Ожидаемое изменение модели: Выбирает экземпляры, которые вызвали бы наибольшее изменение параметров или градиентов модели, если бы их метки были известны.
  • Подходы, основанные на плотности: Приоритет отдается экземплярам, которые не только неопределенны, но и репрезентативны для базовых распределений данных.

Исчерпывающий обзор стратегий можно найти в таких ресурсах, как литературный обзор "Активное обучение" Берра Сеттлза.

Актуальность и преимущества

Active Learning значительно снижает нагрузку и затраты, связанные с маркировкой данных, которая часто является основным узким местом в разработке надежных моделей Deep Learning (DL). Благодаря стратегическому фокусированию усилий по аннотированию, оно позволяет командам:

  • Достигни более высокой точности при меньшем количестве данных: Получи более высокую производительность модели по сравнению со случайной выборкой при том же бюджете на маркировку.
  • Сократи расходы на маркировку: Минимизируй время и ресурсы, затрачиваемые на ручное аннотирование.
  • Ускорь разработку модели: Достигай желаемых уровней производительности быстрее, расставляя приоритеты для наиболее значимых данных. Узнай, как активное обучение ускоряет разработку компьютерного зрения.
  • Улучши устойчивость модели: Фокусировка на неоднозначных или сложных примерах может помочь моделям лучше обобщать.

Применение в реальном мире

Активное обучение применяется в различных областях, где ограничением являются помеченные данные:

  • Медицинская визуализация: В таких задачах, как обнаружение опухолей с использованием моделей YOLO , время экспертов-радиологов очень ценно. Активное обучение отбирает наиболее неоднозначные сканы для просмотра, оптимизируя использование ресурсов экспертов. Это очень важно для разработки эффективных ИИ-решений в здравоохранении.
  • Обработка естественного языка (NLP): Для таких задач, как анализ настроения или распознавание именованных сущностей (NER), выявление информативных образцов текста (например, с неоднозначным настроением или редкими сущностями) для маркировки эффективно повышает точность модели. Инструменты от таких платформ, как Hugging Face часто извлекают пользу из подобных техник.
  • Автономные транспортные средства: Выбор сложных или редких сценариев вождения (например, необычные погодные условия, сложные перекрестки) из огромного количества немаркированных данных о вождении для аннотирования помогает повысить безопасность и надежность систем автономного вождения.
  • Анализ спутниковых снимков: Выявление специфических особенностей или изменений в больших наборах данных спутниковых снимков можно ускорить, если заставить модель запрашивать неопределенные области для экспертной оценки.

Активное обучение против смежных концепций

Важно отличать активное обучение от других парадигм обучения, которые также используют немеченые данные:

  • Полуподконтрольное обучение: В процессе обучения модели одновременно используются как меченые, так и немеченые данные. В отличие от активного обучения, оно обычно пассивно использует все доступные немеченые данные, а не выборочно запрашивает метки у конкретных экземпляров.
  • Самостоятельное обучение (Self-Supervised Learning): Изучает представления на немаркированных данных, создавая предтекстовые задачи (например, предсказание замаскированной части изображения). Оно не требует человеческой аннотации на этапе предварительного обучения, в то время как активное обучение полагается на оракула для получения меток.
  • Обучение с подкреплением: Обучается методом проб и ошибок, взаимодействуя с окружающей средой, получая вознаграждение или наказание за свои действия. Оно не предполагает запроса явных ярлыков, как активное обучение.
  • Федеративное обучение: Фокусируется на обучении моделей на децентрализованных устройствах, сохраняя данные локальными, что в первую очередь решает проблему конфиденциальности данных. Активное обучение направлено на эффективное получение меток. Иногда эти техники можно комбинировать.

Инструменты и реализация

Реализация активного обучения часто включает в себя интеграцию ML-моделей с инструментами аннотации и управление рабочим процессом данных. Фреймворки и библиотеки вроде scikit-learn предлагают некоторые функциональные возможности, а для конкретных задач существуют специализированные библиотеки. Программное обеспечение для аннотирования, такое как Label Studio, может быть интегрировано в конвейеры активного обучения, позволяя аннотаторам предоставлять метки для запрашиваемых образцов. Такие платформы, как DagsHub предлагают инструменты для создания и управления этими конвейерами, о чем ты узнаешь из докладаYOLO VISION 2023, посвященного конвейерам активного обучения DagsHub . Эффективное управление развивающимися наборами данных и обученными моделями крайне важно, и такие платформы, как Ultralytics HUB, предоставляют инфраструктуру для организации этих активов на протяжении всего жизненного цикла разработки. Изучи репозиторийUltralytics на GitHub и присоединяйся к сообществуUltralytics , где можно найти обсуждения и ресурсы, связанные с внедрением передовых методов ML.

Читать полностью
OSZAR »