Glossario

Modello di servizio

Impara gli elementi essenziali del model serving: distribuisci i modelli AI per ottenere previsioni in tempo reale, scalabilità e integrazione perfetta nelle applicazioni.

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Per saperne di più

Una volta che un modello di Machine Learning (ML) è stato addestrato e convalidato, il passo successivo è renderlo disponibile per generare previsioni su nuovi dati. Questo processo è noto come Model Serving. Si tratta di distribuire un modello addestrato in un ambiente di produzione, in genere dietro un endpoint API (Application Programming Interface), consentendo alle applicazioni o ad altri sistemi di richiedere previsioni in tempo reale. Il model serving funge da ponte tra il modello sviluppato e la sua applicazione pratica, trasformandolo da un file statico in un servizio attivo e generatore di valore all'interno del più ampio ciclo di vita del Machine Learning.

L'importanza del servizio di assistenza ai modelli

Il servizio del modello è fondamentale per rendere operativi i modelli di ML. Senza di esso, anche i modelli più accurati, come lo stato dell'arte di Ultralytics YOLO di Ulralytics, rimangono isolati negli ambienti di sviluppo, incapaci di avere un impatto sui processi del mondo reale. Un model serving efficace garantisce che le intuizioni e le capacità di automazione sviluppate durante la formazione siano accessibili e utilizzabili. Consente l'inferenza in tempo reale, permettendo alle applicazioni di rispondere in modo dinamico ai nuovi dati, il che è fondamentale per attività che vanno dal rilevamento di oggetti nei video all'elaborazione del linguaggio naturale (NLP) nei chatbot. In definitiva, il servizio di modelli è essenziale per realizzare il ritorno sull'investimento (ROI) delle iniziative di IA.

Servizio del modello vs. Distribuzione del modello

Anche se spesso viene usato in modo intercambiabile, il Model Serving è tecnicamente un componente specifico all'interno del più ampio processo di Model Deployment. La distribuzione del modello comprende tutte le fasi necessarie per prendere un modello addestrato e renderlo operativo in un ambiente di produzione reale, tra cui il packaging, la configurazione dell'infrastruttura, l'integrazione e il monitoraggio. Il Model Serving si concentra specificamente sul livello infrastrutturale e software che ospita il modello e gestisce le richieste di previsione in entrata, rendendo disponibili le funzionalità del modello come servizio, spesso tramite protocolli di rete come REST o gRPC. Per maggiori dettagli, consulta la nostra guida sulle opzioni di distribuzione dei modelli.

Applicazioni del mondo reale

Il model serving abilita innumerevoli funzioni basate sull'intelligenza artificiale con cui interagiamo quotidianamente. Ecco due esempi:

Componenti chiave del servizio modello

L'implementazione di un robusto sistema di servizio di modelli implica la collaborazione di diversi componenti:

Piattaforme come Ultralytics HUB mirano a semplificare l'intero flusso di lavoro, offrendo soluzioni integrate per l'addestramento, il versioning, la distribuzione e il servizio dei modelli di computer vision, in linea con le migliori pratiche MLOps (Machine Learning Operations). Le considerazioni principali riguardano la scalabilità per gestire le variazioni di carico, la sicurezza(Data Security) e la manutenibilità.

Leggi tutto
OSZAR »