Recall
Aprenda qué es la recuperación en el aprendizaje automático, por qué es importante y cómo garantiza que los modelos de IA capturen instancias positivas críticas de forma eficaz.
La recuperación es una métrica de rendimiento crucial en el aprendizaje automático (AM) y la clasificación estadística, que mide la capacidad de un modelo para identificar todos los casos relevantes dentro de un conjunto de datos. En concreto, cuantifica la proporción de casos positivos reales que el modelo predijo correctamente como positivos. También conocida como sensibilidad o tasa de verdaderos positivos (TPR), la recuperación es especialmente importante en situaciones en las que no detectar un caso positivo (falso negativo) tiene consecuencias importantes. Ayuda a responder a la pregunta "De todos los casos positivos reales, ¿cuántos identificó correctamente el modelo?". La evaluación de modelos requiere conocer varias métricas, y Recall ofrece una perspectiva vital sobre la exhaustividad.
Cómo se calcula la recuperación
La recuperación se calcula dividiendo el número de verdaderos positivos (TP) por la suma de verdaderos positivos y falsos negativos (FN). Los Verdaderos Positivos son las instancias correctamente identificadas como positivas, mientras que los Falsos Negativos son las instancias positivas que el modelo clasificó incorrectamente como negativas. Una puntuación Recall alta indica que el modelo es eficaz a la hora de encontrar la mayoría de los casos positivos en los datos. Esta métrica es fundamental para evaluar el rendimiento del modelo, especialmente en tareas como la detección de objetos y la clasificación de imágenes. Herramientas y plataformas como Ultralytics HUB suelen mostrar Recall junto con otras métricas durante la evaluación de modelos.
Recall Vs. Métricas relacionadas
Para entender la recuperación, a menudo hay que compararla con otras métricas de evaluación habituales:
- Precisión: Mientras que Recall se centra en capturar todos los casos positivos reales, Precision mide la precisión de las predicciones positivas realizadas por el modelo (TP / (TP + Falsos Positivos)). A menudo existe un equilibrio entre la precisión y la recuperación, ya que mejorar una puede reducir la otra. Es lo que se conoce como compromiso Precisión-Recuperación.
- Precisión: La precisión mide la exactitud global del modelo en todas las clases ((TP + Verdaderos Negativos) / Predicciones Totales). Sin embargo, la precisión puede ser engañosa, especialmente en conjuntos de datos desequilibrados en los que una clase supera significativamente a las demás. En estos casos, la recuperación de la clase minoritaria suele ser una métrica más informativa.
- Puntuación F1: La puntuación F1 es la media armónica de la precisión y la recuperación, lo que proporciona una métrica única que equilibra ambas preocupaciones. Resulta útil cuando se necesita un compromiso entre encontrar todos los casos positivos (Recall) y garantizar que los casos identificados son realmente positivos (Precision). Puede consultar guías detalladas sobre las métricas de rendimiento YOLO para obtener más información.
Importancia y aplicaciones
Una alta recuperación es fundamental en aplicaciones en las que omitir casos positivos resulta costoso o peligroso. El objetivo es minimizar los falsos negativos.
- Análisis de imágenes médicas: En los sistemas de diagnóstico, como la detección de tumores cancerosos a partir de escáneres, es primordial maximizar la recuperación. No detectar una enfermedad (un falso negativo) puede tener graves consecuencias para la salud del paciente, por lo que es preferible tener algunos falsos positivos (marcar tejido sano como potencialmente enfermo) que puedan descartarse con más pruebas. La IA en la atención sanitaria se basa en gran medida en modelos de alta capacidad de recuperación para el cribado, lo que ha contribuido a los avances analizados en revistas como Radiology: Artificial Intelligence. Por ejemplo, la detección de tumores cerebrales requiere una alta sensibilidad.
- Detección de fraudes: En los sistemas financieros, identificar las transacciones fraudulentas es crucial. Un modelo de alta recuperación garantiza la detección de la mayoría de los intentos de fraude reales, minimizando las pérdidas financieras. Aunque esto puede llevar a marcar algunas transacciones legítimas para su revisión (falsos positivos), el coste de pasar por alto una transacción fraudulenta (falso negativo) suele ser mucho mayor. Muchas aplicaciones financieras de IA dan prioridad a la recuperación.
- Sistemas de seguridad: En los sistemas de vigilancia diseñados para detectar intrusos o amenazas, un alto nivel de recuperación garantiza que no se pasen por alto peligros potenciales. Pasar por alto una amenaza real (falso negativo) podría comprometer la seguridad, como se observa en las aplicaciones de seguridad basadas en IA.
- Control de calidad en la fabricación: En los sistemas de inspección automatizados, una alta Recuperación ayuda a identificar casi todos los productos defectuosos en una línea de producción, evitando que los artículos defectuosos lleguen a los consumidores. Pasar por alto un defecto (falso negativo) puede provocar la insatisfacción del cliente y problemas de seguridad. Más información sobre la IA en la fabricación.
Recuperación en los modelos YOLO de Ultralytics
En el contexto de la visión por ordenador (CV) y de modelos como Ultralytics YOLO, la recuperación es una métrica clave que se utiliza junto con la precisión y la precisión media (mAP) para evaluar el rendimiento en tareas como la detección de objetos y la segmentación de instancias. Lograr un buen equilibrio entre Recall y Precision suele ser esencial para obtener un rendimiento sólido en el mundo real. Por ejemplo, cuando se comparan modelos como YOLOv8 frente a YOLO11, Recall ayuda a comprender lo bien que cada modelo identifica todos los objetos objetivo. Los usuarios pueden entrenar modelos personalizados utilizando marcos como PyTorch o TensorFlow y realizar un seguimiento de la recuperación utilizando herramientas como Weights & Biases o las funciones integradas en Ultralytics HUB. Comprender la recuperación ayuda a optimizar los modelos para casos de uso específicos, lo que puede implicar el ajuste de hiperparámetros o la exploración de diferentes arquitecturas de modelos como YOLOv10 o la última YOLO11. Recursos como la documentación de Ultralytics ofrecen guías completas sobre formación y evaluación.