Descobre como a IA generativa cria conteúdos originais como texto, imagens e áudio, transformando as indústrias com aplicações inovadoras.
A Inteligência Artificial Generativa (IA) representa um ramo significativo no domínio mais vasto da inteligência artificial (IA), centrando-se especificamente na criação de sistemas capazes de gerar conteúdos totalmente novos e originais. Este conteúdo pode abranger várias modalidades, incluindo texto, imagens, áudio, código e até dados sintéticos. Ao contrário dos modelos de IA discriminativos, que são treinados para classificar ou fazer previsões com base nos dados de entrada (como identificar objectos numa imagem utilizando a deteção de objectos), os modelos generativos aprendem os padrões, estruturas e distribuições de probabilidade subjacentes num conjunto de dados de treino. Em seguida, utiliza este conhecimento adquirido para produzir novos resultados que imitam as caraterísticas dos dados originais. As recentes descobertas, particularmente impulsionadas por arquitecturas como os transformadores generativos pré-treinados (GPT) e os modelos de difusão, permitiram a criação de conteúdos extraordinariamente realistas e complexos, ultrapassando os limites da criatividade das máquinas.
A ideia central por trás da maioria dos modelos generativos é aprender uma representação da distribuição dos dados. Uma vez aprendida esta distribuição, o modelo pode fazer uma amostragem da mesma para gerar novos pontos de dados estatisticamente semelhantes aos dados em que foi treinado. Isto envolve arquitecturas complexas de redes neuronais (NN) e técnicas de formação sofisticadas. Algumas arquitecturas proeminentes incluem:
Embora ambos sejam subcampos da IA, a IA generativa e a visão computacional (CV) têm objectivos fundamentalmente diferentes. A CV centra-se em permitir que as máquinas interpretem e compreendam a informação visual do mundo, realizando tarefas como a classificação de imagens, a deteção de objectos e a segmentação de instâncias. A IA generativa, pelo contrário, centra-se na criação de novos conteúdos visuais (ou outros).
As principais diferenças destacadas durante debates como os do YOLO Vision 2024 incluem:
Apesar destas diferenças, os domínios estão cada vez mais interligados. A IA generativa está a revelar-se valiosa para a CV ao gerar dados sintéticos de alta qualidade. Estes dados sintéticos podem aumentar os conjuntos de dados do mundo real, ajudando a treinar modelos de CV mais robustos e precisos, especialmente para cenários em que os dados reais são escassos ou difíceis de obter, como nas simulações de condução autónoma ou na imagiologia de doenças raras(IA nos cuidados de saúde).
A IA generativa está a transformar numerosas indústrias:
O rápido avanço da IA generativa também traz desafios. Garantir a utilização ética destas poderosas ferramentas é fundamental, especialmente no que diz respeito a deepfakes, desinformação, direitos de propriedade intelectual e preconceitos inerentes aprendidos com os dados de treino. Para resolver estes problemas, é necessário um desenvolvimento cuidadoso do modelo, métodos de deteção robustos e orientações claras delineadas nos princípios da ética da IA. Além disso, os importantes recursos computacionais necessários suscitam preocupações ambientais e de acessibilidade. Plataformas como o Ultralytics HUB têm como objetivo simplificar os fluxos de trabalho e reduzir potencialmente os obstáculos à entrada em determinadas tarefas de IA.