Глоссарий

Классификация изображений

Открой для себя классификацию изображений с помощью Ultralytics YOLO : обучай пользовательские модели для здравоохранения, сельского хозяйства, розничной торговли и многого другого, используя передовые инструменты.

Классификация изображений - это фундаментальная задача в компьютерном зрении (КВ), которая заключается в присвоении единой метки или категории всему изображению на основе его визуального содержания. Это одна из основных возможностей искусственного интеллекта (ИИ), позволяющая машинам понимать и классифицировать изображения подобно тому, как человек распознает сцены или объекты. Используя методы машинного обучения (ML) и особенно глубокого обучения (DL), классификация изображений призвана ответить на вопрос: "Что является основным объектом этого изображения?". Эта задача служит строительным блоком для многих более сложных проблем визуального понимания.

Как работает классификация изображений

Обычно этот процесс включает в себя обучение модели, часто специализированного типа нейронной сети, называемой конволюционной нейронной сетью (CNN), на большом наборе данных помеченных изображений. Для обучения надежных моделей обычно используются такие известные наборы данных, как ImageNet, содержащие миллионы изображений по тысячам категорий. В процессе обучения модель учится определять отличительные паттерны и особенности - например, текстуры, формы, края и распределение цветов, - которые характеризуют различные категории. Такие фреймворки, как PyTorch и TensorFlow предоставляют необходимые инструменты и библиотеки для создания и обучения этих моделей глубокого обучения. Ты можешь изучить различные наборы данных для классификацииUltralytics , такие как CIFAR-100 или MNIST, чтобы начать свои собственные проекты. Конечная цель состоит в том, чтобы обученная модель точно предсказывала метку класса для новых, ранее не виденных изображений. Для более глубокого технического понимания механизмов, лежащих в основе, такие ресурсы, как курс Stanford CS231n по Convolutional Neural Networks for Visual Recognition, предлагают исчерпывающий материал.

Основные отличия от других задач по зрению

Классификация изображений сосредоточена на присвоении единой, всеобъемлющей метки всему изображению. Это отличает ее от других распространенных задач компьютерного зрения:

Обнаружение объекта: Эта задача идет на шаг дальше, не только классифицируя объекты на изображении, но и определяя их местоположение, обычно рисуя ограничительные рамки вокруг каждого обнаруженного экземпляра. Она отвечает на вопрос "Какие объекты есть на этом изображении и где они расположены?".
Сегментация изображений: Это подразумевает классификацию каждого пикселя на изображении.
- Семантическая сегментация Присваивает каждому пикселю метку класса (например, "автомобиль", "дорога", "небо"), не делая различий между разными экземплярами одного и того же класса.
- Сегментация экземпляров Различает отдельные экземпляры объектов, присваивая пикселям, принадлежащим каждому отдельному объекту, уникальный идентификатор (например, маркировка "автомобиль 1", "автомобиль 2").

Понимание этих различий крайне важно для выбора подходящей техники для решения конкретной задачи, так как каждая задача обеспечивает разный уровень детализации содержимого изображения.

Применение в реальном мире

Классификация изображений широко используется в различных областях благодаря своей эффективности в категоризации визуальной информации:

Анализ медицинских изображений: Классификация медицинских снимков (например, рентгеновских, компьютерных или магнитно-резонансных) для помощи в диагностике. Например, модель может быть обучена классифицировать сканы как имеющие признаки определенного заболевания, например, использовать модели YOLO для обнаружения опухолей, помогая тем самым радиологам. Узнай больше о решениях ИИ в здравоохранении.
Сельскохозяйственные технологии: Классификация изображений сельскохозяйственных культур для выявления болезней, оценки состояния растений или определения спелости. Например, приложение может классифицировать фотографии, сделанные дроном или фермером, как "здоровая пшеница" или "обнаружена ржавчина пшеницы", что позволит своевременно принять меры. Узнай больше о компьютерном зрении в сельском хозяйстве.
Розничная торговля и электронная коммерция: Автоматически классифицируй изображения товаров для онлайн-каталогов, улучшая удобство поиска и управление запасами.
Модерация контента: Фильтрует изображения в социальных сетях или на сайтах, классифицируя их как безопасные или неуместные.
Охрана дикой природы: Классифицируй изображения с камер-ловушек, чтобы следить за популяциями животных и идентифицировать виды(например, зебр).