Глоссарий

Классификация изображений

Открой для себя классификацию изображений с помощью Ultralytics YOLO : обучай пользовательские модели для здравоохранения, сельского хозяйства, розничной торговли и многого другого, используя передовые инструменты.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Классификация изображений - это фундаментальная задача в компьютерном зрении (КВ), которая заключается в присвоении единой метки или категории всему изображению на основе его визуального содержания. Это одна из основных возможностей искусственного интеллекта (ИИ), позволяющая машинам понимать и классифицировать изображения подобно тому, как человек распознает сцены или объекты. Используя методы машинного обучения (ML) и особенно глубокого обучения (DL), классификация изображений призвана ответить на вопрос: "Что является основным объектом этого изображения?". Эта задача служит строительным блоком для многих более сложных проблем визуального понимания.

Как работает классификация изображений

Обычно этот процесс включает в себя обучение модели, часто специализированного типа нейронной сети, называемой конволюционной нейронной сетью (CNN), на большом наборе данных помеченных изображений. Для обучения надежных моделей обычно используются такие известные наборы данных, как ImageNet, содержащие миллионы изображений по тысячам категорий. В процессе обучения модель учится определять отличительные паттерны и особенности - например, текстуры, формы, края и распределение цветов, - которые характеризуют различные категории. Такие фреймворки, как PyTorch и TensorFlow предоставляют необходимые инструменты и библиотеки для создания и обучения этих моделей глубокого обучения. Ты можешь изучить различные наборы данных для классификацииUltralytics , такие как CIFAR-100 или MNIST, чтобы начать свои собственные проекты. Конечная цель состоит в том, чтобы обученная модель точно предсказывала метку класса для новых, ранее не виденных изображений. Для более глубокого технического понимания механизмов, лежащих в основе, такие ресурсы, как курс Stanford CS231n по Convolutional Neural Networks for Visual Recognition, предлагают исчерпывающий материал.

Основные отличия от других задач по зрению

Классификация изображений сосредоточена на присвоении единой, всеобъемлющей метки всему изображению. Это отличает ее от других распространенных задач компьютерного зрения:

  • Обнаружение объекта: Эта задача идет на шаг дальше, не только классифицируя объекты на изображении, но и определяя их местоположение, обычно рисуя ограничительные рамки вокруг каждого обнаруженного экземпляра. Она отвечает на вопрос "Какие объекты есть на этом изображении и где они расположены?".
  • Сегментация изображений: Это подразумевает классификацию каждого пикселя на изображении.
    • Семантическая сегментация Присваивает каждому пикселю метку класса (например, "автомобиль", "дорога", "небо"), не делая различий между разными экземплярами одного и того же класса.
    • Сегментация экземпляров Различает отдельные экземпляры объектов, присваивая пикселям, принадлежащим каждому отдельному объекту, уникальный идентификатор (например, маркировка "автомобиль 1", "автомобиль 2").

Понимание этих различий крайне важно для выбора подходящей техники для решения конкретной задачи, так как каждая задача обеспечивает разный уровень детализации содержимого изображения.

Применение в реальном мире

Классификация изображений широко используется в различных областях благодаря своей эффективности в категоризации визуальной информации:

Классификация изображений с помощью Ultralytics

Модели Ultralytics YOLO , хотя и славятся обнаружением объектов, также демонстрируют высокую производительность в задачах классификации изображений. Современные архитектуры, такие как Ultralytics YOLO11 можно легко обучить или настроить для классификации с помощью интуитивно понятного пакетаUltralytics Python или платформы Ultralytics HUB, не требующей кода. Эти инструменты предоставляют обширные ресурсы, включая советы по обучению моделей и понятную документацию, например, руководство по использованию Ultralytics YOLO11 для классификации изображений. Для дальнейшей практики изучи учебники по классификации вPyTorch или прими участие в соревнованиях по классификации изображений в Kaggle. Чтобы быть в курсе последних научных достижений, неоценимую помощь оказывают такие ресурсы, как Papers With Code. Ты также можешь сравнить производительность модели YOLO на стандартных бенчмарках.

Читать полностью
OSZAR »