Descobre como a aprendizagem auto-supervisionada aproveita os dados não rotulados para uma formação eficiente, transformando a IA em visão computacional, PNL e muito mais.
A aprendizagem auto-supervisionada (SSL) é uma abordagem de aprendizagem automática (ML) que permite que os modelos aprendam a partir de grandes quantidades de dados não rotulados. Ao contrário da aprendizagem supervisionada, que depende fortemente de dados meticulosamente rotulados, a SSL cria engenhosamente os seus próprios sinais de supervisão diretamente a partir dos próprios dados de entrada. Isto torna-a excecionalmente valiosa em campos como a visão por computador (CV) e o processamento de linguagem natural (PNL), onde os dados não rotulados são abundantes, mas o custo e o esforço da rotulagem manual(anotação de dados) podem ser proibitivos.
O mecanismo central por detrás do SSL envolve a conceção de uma "tarefa de pretexto". Trata-se de uma tarefa auxiliar, auto-gerada, em que o modelo tem de prever certas propriedades dos dados que foram intencionalmente ocultadas ou alteradas. Ao resolver esta tarefa de pretexto, o modelo é obrigado a aprender estruturas e representações subjacentes significativas(embeddings) dos dados sem rótulos fornecidos por humanos. Esta fase inicial de formação é normalmente designada por pré-treino.
Por exemplo, na visão por computador, uma tarefa de pretexto pode envolver:
Em PNL, uma tarefa de pretexto bem conhecida é a modelação de linguagem mascarada, utilizada por modelos como o BERT. Neste caso, o modelo aprende a prever palavras que foram aleatoriamente mascaradas (escondidas) nas frases.
Após o pré-treinamento em grandes conjuntos de dados não rotulados, o modelo capta representações de caraterísticas ricas. Este modelo pré-treinado pode então ser adaptado a tarefas específicas a jusante - como a deteção de objectos, a classificação de imagens ou a análise de sentimentos - através deum processo designado por afinação. Normalmente, o ajuste fino requer uma quantidade muito menor de dados rotulados em comparação com o treino de um modelo a partir do zero, o que torna a SSL um fator essencial para uma aprendizagem por transferência eficaz.
É crucial diferenciar o SSL dos paradigmas de ML relacionados:
O SSL tem capacidades de Inteligência Artificial (IA) significativamente avançadas:
O SSL reduz significativamente a dependência de conjuntos de dados rotulados dispendiosos, democratizando o desenvolvimento de modelos de IA poderosos. Ferramentas como o PyTorch e TensorFlowjuntamente com plataformas como o Ultralytics HUB, fornecem ambientes para aproveitar as técnicas de SSL para criar e implantar soluções de IA de ponta.