Glossario

GPT (Trasformatore Generativo Pre-Addestrato)

Scopri la potenza dei modelli GPT: un'intelligenza artificiale avanzata basata su trasformatori per la generazione di testi, attività NLP, chatbot, codifica e molto altro. Scopri subito le caratteristiche principali!

GPT (Generative Pre-trained Transformer) si riferisce a una famiglia di potenti Large Language Models (LLM) sviluppati da OpenAI. Questi modelli sono progettati per comprendere e generare testo simile a quello umano in base all'input che ricevono, noto come prompt. I modelli GPT hanno fatto progredire in modo significativo il campo dell'elaborazione del linguaggio naturale (NLP) e sono un ottimo esempio di IA generativa. Sfruttano l'architettura Transformer, che consente loro di elaborare grandi quantità di dati testuali e di apprendere modelli linguistici complessi, grammatica e contesto.

Come funziona il GPT

Il nome stesso di "GPT" ne suddivide i componenti principali:

Generativo: I modelli GPT creano nuovi output testuali originali che sono coerenti e contestualmente rilevanti rispetto alla richiesta di input. A differenza dei modelli discriminativi che classificano i dati, i modelli generativi producono contenuti nuovi. Questo può andare dalla continuazione di una storia alla scrittura di un'email o alla generazione di codice.
Pre-addestrati: Prima di essere utilizzati per compiti specifici, i modelli GPT vengono sottoposti a una fase di addestramento estensivo su enormi insiemi di dati testuali provenienti da internet e da altri materiali autorizzati. Questa fase di pre-addestramento consente al modello di acquisire un'ampia conoscenza del linguaggio, dei fatti e del ragionamento. Questa capacità generale può poi essere adattata ad applicazioni specifiche attraverso un processo chiamato " fine-tuning" o attraverso la "prompt engineering".
Transformer: L'architettura di base è il Transformer, introdotto nell'autorevole articolo"Attention Is All You Need". I Transformer utilizzano un meccanismo di auto-attenzione che consente al modello di valutare l'importanza delle diverse parole nella sequenza di input, indipendentemente dalla loro posizione. In questo modo si superano i limiti delle architetture più vecchie, come le reti neurali ricorrenti (RNN), nel gestire le dipendenze a lungo raggio e si consente un'elaborazione più parallela su hardware come le GPU.

Caratteristiche principali ed evoluzione

La serie GPT ha visto un'evoluzione significativa, con ogni iterazione che ha offerto funzionalità migliori:

GPT-2: ha dimostrato notevoli capacità di generazione di testo, ma inizialmente è stato rilasciato con cautela a causa delle preoccupazioni di un uso improprio.
GPT-3: ha rappresentato un grande salto di scala e di prestazioni, in grado di eseguire un'ampia gamma di compiti con un minimo di dati di addestramento specifici, spesso eccellendo nell'apprendimento a pochi scatti.
GPT-4: ha migliorato ulteriormente le capacità di ragionamento, creatività e risoluzione dei problemi. In particolare, il GPT-4 è un modello multimodale, in grado di elaborare input sia di testo che di immagine, ampliando in modo significativo il suo campo di applicazione. Per maggiori dettagli, leggi il Rapporto Tecnico GPT-4.

Questi modelli eccellono in compiti come la generazione di testi, la sintesi di testi, la traduzione automatica, la risposta a domande e la generazione di codici. Molti modelli GPT sono accessibili tramite piattaforme come Hugging Face e possono essere implementati utilizzando framework come PyTorch o TensorFlow.

Applicazioni del mondo reale

I modelli GPT sono alla base di numerose applicazioni in vari settori:

Creazione di contenuti e assistenza: Strumenti come Jasper o Writesonic utilizzano i modelli GPT per aiutare gli utenti a generare post di blog, testi di marketing, e-mail e altri contenuti scritti, velocizzando in modo significativo i flussi di lavoro creativi. Anche gli sviluppatori utilizzano varianti come GitHub Copilot (basato su OpenAI Codex, un discendente di GPT) per il completamento e la generazione di codice.
Chatbot e assistenti virtuali avanzati: GPT consente un'intelligenza artificiale conversazionale più sofisticata e naturale. I chatbot del servizio clienti possono gestire domande complesse, comprendere meglio il contesto e fornire risposte più simili a quelle umane, migliorando l'esperienza dell'utente. Gli esempi includono integrazioni con piattaforme come Intercom o soluzioni personalizzate costruite utilizzando le API OpenAI.

GPT vs. altri modelli

È importante distinguere la GPT da altri tipi di modelli di intelligenza artificiale:

vs. BERT: sebbene entrambi siano LLM basati su trasformatori, BERT (Bidirectional Encoder Representations from Transformers) è principalmente un modello di codifica progettato per comprendere il contesto in modo bidirezionale. Eccelle in compiti come l'analisi del sentimento, il riconoscimento di entità denominate (NER) e la classificazione del testo. GPT, essendo incentrato sul decodificatore, è ottimizzato per la generazione di testo.
rispetto ai modelli di visione artificiale: I modelli GPT elaborano e generano testo (e talvolta immagini, come il GPT-4). Si differenziano fondamentalmente dai modelli di Computer Vision (CV) come Ultralytics YOLO (ad es, YOLOv8, YOLO11). I modelli YOLO analizzano i dati visivi (immagini, video) per eseguire compiti come il rilevamento di oggetti, la classificazione di immagini o la segmentazione di istanze, identificando quali oggetti sono presenti e dove sono localizzati utilizzando bounding box o maschere. Mentre GPT-4 è in grado di descrivere un'immagine, YOLO eccelle nella localizzazione e classificazione precisa all'interno delle immagini ad alta velocità, adatta all'inferenza in tempo reale. Sistemi complessi potrebbero combinare entrambi, potenzialmente gestiti tramite piattaforme come Ultralytics HUB.

I modelli GPT sono considerati modelli di base grazie alle loro ampie capacità e alla loro adattabilità, rappresentando una pietra miliare del moderno apprendimento automatico.

GPT (Trasformatore Generativo Pre-Addestrato)

Addestra i modelli YOLO semplicemente
con Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Come funziona il GPT

Caratteristiche principali ed evoluzione

Applicazioni del mondo reale

GPT vs. altri modelli

Leggi altri blog

Unisciti alla comunità di Ultralytics

GPT (Trasformatore Generativo Pre-Addestrato)

Addestra i modelli YOLO semplicementecon Ultralytics HUB

Una soluzione flessibile di licenze aziendali per alimentare la tua innovazione

Addestra i modelli di intelligenza artificiale in pochi secondi con Ultralytics YOLO

Addestra i modelli di YOLO in modo semplice con Ultralytics HUB

Come funziona il GPT

Caratteristiche principali ed evoluzione

Applicazioni del mondo reale

GPT vs. altri modelli

Leggi altri blog

Unisciti alla comunità di Ultralytics

Addestra i modelli YOLO semplicemente
con Ultralytics HUB