Glossario

Intersezione su Unione (IoU)

Scopri cos'è l'Intersection over Union (IoU), come si calcola e il suo ruolo fondamentale nel rilevamento degli oggetti e nella valutazione dei modelli di intelligenza artificiale.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

L'Intersection over Union (IoU) è una metrica fondamentale utilizzata ampiamente nella computer vision (CV), in particolare per compiti come il rilevamento di oggetti e la segmentazione di immagini. Quantifica l'accuratezza con cui un confine previsto (come un riquadro di delimitazione nel rilevamento degli oggetti) corrisponde al confine reale di un oggetto. In sostanza, l'IoU misura il grado di sovrapposizione tra l'area prevista e quella vera, fornendo un punteggio semplice ma efficace per le prestazioni di localizzazione. La comprensione dell'IoU è essenziale per valutare e confrontare l'efficacia dei modelli di computer vision, soprattutto per gli utenti che hanno familiarità con i concetti di base dell 'apprendimento automatico (ML).

Importanza dell'IoU nella valutazione dei modelli

L'IoU è un indicatore di performance fondamentale per valutare l'efficacia di modelli come Ultralytics YOLOindividuano gli oggetti all'interno di un'immagine. Mentre la classificazione ci dice quale oggetto è presente (vedi Classificazione dell'immagine), l'IoU ci dice quanto il modello è riuscito a localizzarne la posizione. Questa precisione spaziale è fondamentale in molti scenari del mondo reale, dove la localizzazione precisa è importante quanto la classificazione corretta. Punteggi IoU elevati indicano che le previsioni del modello sono strettamente allineate con i confini reali dell'oggetto. Molti benchmark per il rilevamento di oggetti, come il popolare dataset di valutazione COCO e la vecchia sfida PASCAL VOC, si basano molto sulle soglie IoU per determinare se un rilevamento è considerato corretto. Puoi esplorare vari dataset di riferimento come COCO e PASCAL VOC nella nostra documentazione.

Calcolo dell'IoU

Il calcolo consiste nel dividere l'area in cui il rettangolo di selezione previsto e quello della verità si sovrappongono (l'intersezione) per l'area totale coperta da entrambi i rettangoli combinati (l'unione). Questo rapporto si traduce in un punteggio compreso tra 0 e 1. Un punteggio di 1 indica una corrispondenza perfetta, ovvero il riquadro previsto si sovrappone esattamente alla verità a terra. Un punteggio di 0 indica che non c'è alcuna sovrapposizione. Una pratica comune in molti protocolli di valutazione del rilevamento degli oggetti è quella di considerare corretta una previsione se il punteggio IoU soddisfa o supera una certa soglia, spesso 0,5. Tuttavia, le soglie più rigide (come ad esempio il punteggio di 0,5) non sono sufficienti. Tuttavia, si possono utilizzare soglie più rigide (ad esempio 0,75 o addirittura 0,9) a seconda delle esigenze di precisione dell'applicazione, come si vede in metriche come [email protected]:.95 utilizzate nelle valutazioni COCO. Questa soglia ha un impatto diretto su metriche come la precisione e il richiamo.

Applicazioni reali dell'IoU

La capacità di IoU di misurare la precisione della localizzazione lo rende indispensabile in diversi ambiti:

IoU contro altre metriche di valutazione Altre metriche di valutazione

Sebbene l'IoU misuri specificamente la qualità della localizzazione per una singola previsione rispetto a una verità di base, viene spesso utilizzato insieme ad altre metriche per ottenere un quadro completo delle prestazioni.

  • Precisione media (mAP): Si tratta di una metrica aggregata molto utilizzata nel rilevamento degli oggetti. Calcola la precisione media su varie soglie IoU (ad esempio, da 0,5 a 0,95) e spesso su più classi di oggetti. A differenza di IoU, che valuta le singole previsioni, mAP fornisce un unico numero che riassume le prestazioni complessive del modello in termini di accuratezza di classificazione e localizzazione in diversi punti operativi. Per saperne di più su queste metriche, consulta la nostra guida alle metriche delle prestazioni diYOLO .
  • Precisione e Richiamo: IoU non misura direttamente la correttezza della classificazione, ma solo la sovrapposizione della localizzazione. La precisione misura l'accuratezza delle previsioni positive (quante caselle rilevate contengono effettivamente un oggetto), mentre il richiamo misura la capacità del modello di trovare tutte le istanze rilevanti (quanti oggetti reali sono stati rilevati). Le soglie IoU vengono utilizzate nel calcolo della precisione e del richiamo per determinare se un rilevamento è un vero positivo. Capire la relazione tra precisione e richiamo è fondamentale per interpretare metriche come mAP e il punteggio F1.

Migliorare le prestazioni dei modelli con l'IoU

L'IoU non è solo una metrica di valutazione, ma è anche parte integrante del processo di formazione stesso. Molte moderne architetture di rilevamento degli oggetti, comprese le varianti di Ultralytics YOLOv8 e YOLOv10, utilizzano l'IoU o le sue varianti (come l'IoU generalizzato (GIoU), il Distance-IoU (DIoU) o il Complete-IoU (CIoU)) direttamente nelle loro funzioni di perdita. Queste perdite avanzate basate sull'IoU aiutano il modello ad apprendere a prevedere riquadri di delimitazione che non solo si sovrappongono bene, ma che considerano anche fattori come la distanza tra i centri e la coerenza delle proporzioni, portando a una convergenza più rapida e a prestazioni di localizzazione migliori rispetto alle perdite di regressione tradizionali. Puoi trovare confronti dettagliati tra i diversi modelli YOLO nella nostra documentazione.

Il monitoraggio dell'IoU durante l'addestramento del modello e la regolazione degli iperparametri aiuta gli sviluppatori a perfezionare i modelli per una migliore localizzazione. Strumenti come Ultralytics HUB permettono di monitorare l'IoU e altre metriche, semplificando il ciclo di miglioramento del modello. Nonostante la sua utilità sia molto diffusa, l'IoU standard può essere talvolta poco sensibile, soprattutto nel caso di box non sovrapposti o di box con scale molto diverse. Questo ha motivato lo sviluppo delle varianti di IoU sopra citate. Tuttavia, l'IoU rimane una pietra miliare della valutazione della computer vision e un concetto chiave del deep learning (DL).

Leggi tutto
OSZAR »