Glosario

Cuadro delimitador

Descubra cómo los recuadros delimitadores permiten la detección de objetos, la IA y los sistemas de aprendizaje automático. Explore su papel en las aplicaciones de visión por ordenador.

Un cuadro delimitador es un marco rectangular utilizado en visión por ordenador (VC) para indicar la ubicación y extensión aproximada de un objeto dentro de un fotograma de imagen o vídeo. Típicamente definidos por las coordenadas de sus esquinas superior izquierda e inferior derecha (o punto central, anchura y altura), estos recuadros proporcionan un método sencillo pero eficaz para especificar dónde está situado un objeto y cuánto espacio ocupa. Los recuadros delimitadores son componentes fundamentales en diversas tareas de CV, como la detección de objetos, el seguimiento de objetos y la anotación de imágenes, y constituyen la piedra angular de muchos sistemas modernos de Inteligencia Artificial (IA) y aprendizaje automático (AM). Son esenciales para permitir que las máquinas comprendan no sólo qué objetos están presentes, sino también dónde están situados en una escena visual.

Importancia en la detección de objetos

Los recuadros delimitadores son cruciales tanto para el entrenamiento como para la evaluación de modelos de detección de objetos. En tareas abordadas por modelos como Ultralytics YOLO, los recuadros delimitadores sirven de "verdad de base" durante el proceso de entrenamiento. Esto significa que representan la ubicación y el tamaño correctos de los objetos en los datos de entrenamiento, enseñando al modelo a localizarlos con precisión. Este proceso suele comenzar con una cuidadosa anotación de los datos, en la que humanos o herramientas automatizadas dibujan estos recuadros alrededor de los objetos en las imágenes, utilizando con frecuencia plataformas como CVAT o integrándose con plataformas como Ultralytics HUB para la gestión de conjuntos de datos. Durante la inferencia, el modelo entrenado predice los recuadros alrededor de los objetos detectados, junto con las etiquetas de clase y las puntuaciones de confianza. Esta capacidad de localización es vital para aplicaciones que requieren no sólo la identificación de objetos, sino también su posición exacta.

Conceptos clave relacionados con los recuadros delimitadores

Existen varias métricas y técnicas estrechamente relacionadas con el uso y la evaluación de los recuadros delimitadores en los modelos de ML:

  • Intersección sobre Unión (IoU): Métrica utilizada para medir el solapamiento entre el cuadro delimitador previsto y el cuadro delimitador real. Cuantifica la precisión de la localización.
  • Supresión no máxima (NMS): Técnica de posprocesamiento utilizada para eliminar los recuadros delimitadores redundantes y superpuestos de un mismo objeto, conservando únicamente la predicción más fiable.
  • Precisión media (mAP): Una métrica estándar para evaluar el rendimiento de los modelos de detección de objetos, teniendo en cuenta tanto la precisión de clasificación como la precisión de localización (a menudo basada en un umbral IoU). Consulte las métricas de rendimiento detalladas de YOLO.
  • Cajas de anclaje: Cajas predefinidas de varios tamaños y relaciones de aspecto utilizadas en algunos detectores (como las versiones antiguas de YOLO) para ayudar a predecir las cajas delimitadoras con mayor eficacia. Los modelos más recientes, incluido YOLO11, no suelen tener anclajes, lo que simplifica el cabezal de detección.
  • Conjunto de datos COCO: Un conjunto de datos de detección, segmentación y subtitulado de objetos a gran escala ampliamente utilizado para la evaluación comparativa de modelos de detección de objetos. Ultralytics facilita el acceso a COCO y a otros conjuntos de datos de detección.

Cajas delimitadoras frente a términos relacionados

Mientras que las cajas delimitadoras estándar (alineadas con el eje) localizan objetos con rectángulos simples, otras técnicas de visión por ordenador ofrecen distintos niveles de detalle o manejan escenarios diferentes:

Aplicaciones en el mundo real

Las cajas delimitadoras forman parte integral de numerosas aplicaciones prácticas de la IA:

  1. Vehículos autónomos: Los coches autónomos dependen en gran medida de la detección de objetos para identificar y localizar peatones, otros vehículos, semáforos y obstáculos mediante cuadros delimitadores. Esta conciencia espacial, a menudo lograda mediante modelos de aprendizaje profundo, es fundamental para la seguridad de la navegación y la toma de decisiones. Empresas como Waymo exhiben ampliamente esta tecnología. Ultralytics ofrece información sobre la IA en los coches autoconducidos.
  2. Análisis del comercio minorista: En el comercio minorista, las cajas delimitadoras ayudan en la gestión de inventarios impulsada por IA mediante la detección de productos en los estantes, la supervisión de los niveles de existencias y el análisis del comportamiento de los clientes a través de la interacción en los estantes o los patrones de tráfico peatonal(recuento de objetos).
  3. Seguridad y vigilancia: Las cajas delimitadoras permiten a los sistemas de vigilancia automatizados detectar y rastrear personas u objetos de interés en tiempo real, activando alertas de accesos no autorizados o actividades sospechosas. Esto es fundamental para aplicaciones de construcción como los sistemas de alarma de seguridad.
  4. Análisis de imágenes médicas: En el ámbito sanitario, los recuadros delimitadores ayudan a los radiólogos y médicos a resaltar posibles anomalías, como tumores o lesiones, en las exploraciones (radiografías, TC, RM), lo que contribuye a un diagnóstico más rápido y preciso. Vea ejemplos en Radiología: Inteligencia Artificial y la visión general de Ultralytics sobre el análisis de imágenes médicas.
  5. Agricultura: Las cajas delimitadoras se utilizan en la agricultura de precisión para tareas como la identificación de frutos para la cosecha(detección de frutos), el control de la salud de los cultivos o la detección de plagas.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles
OSZAR »