Glosario

Incrustaciones

Aprende qué son las incrustaciones y cómo potencian la IA capturando relaciones semánticas en los datos para la PNL, las recomendaciones y la visión por ordenador.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

En el ámbito del aprendizaje automático (AM) y la inteligencia artificial (IA), las incrustaciones son una técnica fundamental para representar datos complejos -como palabras, frases, imágenes u otros elementos- como vectores numéricos densos en un espacio multidimensional. Esta transformación se aprende a partir de los datos, lo que permite a los algoritmos captar el significado semántico, el contexto o las características esenciales de la entrada. La principal ventaja es que los elementos considerados similares a partir de los datos de entrenamiento se asignan a puntos cercanos en este "espacio de incrustación", lo que permite a las máquinas comprender relaciones y patrones complejos con mucha más eficacia que las representaciones dispersas tradicionales, como la codificación de un solo punto.

¿Qué son las incrustaciones?

Las incrustaciones son representaciones vectoriales aprendidas, de dimensiones relativamente bajas, de variables discretas (como palabras) u objetos complejos (como imágenes o perfiles de usuario). A diferencia de métodos como la codificación de una sola vez, que crean vectores dispersos de muy alta dimensión en los que cada dimensión corresponde a un único elemento y carece de información inherente sobre las relaciones, las incrustaciones son vectores densos (normalmente con decenas o miles de dimensiones) en los que cada dimensión contribuye a representar las características del elemento. Lo más importante es que la posición de estos vectores en el espacio de incrustación capta las relaciones semánticas. Por ejemplo, en las incrustaciones de palabras, las palabras con significados similares o utilizadas en contextos similares, como "rey" y "reina" o "caminar" y "correr", tendrán vectores matemáticamente próximos (por ejemplo, utilizando la similitud del coseno). Esta proximidad refleja la similitud semántica aprendida de los datos.

Cómo funcionan las incrustaciones

Las incrustaciones suelen generarse utilizando modelos de redes neuronales (RN ) entrenados en grandes conjuntos de datos mediante técnicas como el aprendizaje autosupervisado. Por ejemplo, una técnica habitual de incrustación de palabras, ejemplificada por Word2Vec, consiste en entrenar un modelo para predecir una palabra basándose en las palabras que la rodean (su contexto) dentro de un corpus de texto masivo. Durante este proceso de entrenamiento, la red ajusta sus parámetros internos, incluidos los vectores de incrustación de cada palabra, para minimizar los errores de predicción mediante métodos como la retropropagación. Los vectores resultantes codifican implícitamente información sintáctica y semántica. El número de dimensiones del espacio de incrustación es un hiperparámetro crítico, que influye en la capacidad del modelo para captar detalles frente a su coste computacional y el riesgo de sobreajuste. La visualización de estos espacios de datos de alta dimensión suele requerir técnicas de reducción de la dimensionalidad como t-SNE o PCA, que pueden explorarse con herramientas como el ProyectorTensorFlow .

Aplicaciones de las incrustaciones

Las incrustaciones son componentes cruciales en muchos sistemas modernos de IA de diversos ámbitos:

  • Procesamiento del Lenguaje Natural (PLN): Las incrustaciones representan palabras, frases o documentos enteros. Los modelos como las arquitecturas BERT y Transformer dependen en gran medida de las incrustaciones para comprender los matices del lenguaje en tareas como la traducción automática, el análisis de sentimientos, la respuesta a preguntas y la potenciación de una búsqueda semántica eficaz. Ejemplo: Un chatbot de atención al cliente utiliza incrustaciones de frases para encontrar la respuesta más relevante en su base de conocimientos, aunque la consulta del usuario no utilice las palabras clave exactas.
  • Sistemas de recomendación: Las incrustaciones pueden representar usuarios y elementos (como películas, productos o artículos). Aprendiendo incrustaciones de modo que los usuarios y los artículos que les gustan estén próximos en el espacio de incrustación, los sistemas pueden recomendar nuevos artículos similares a aquellos con los que un usuario ha interactuado previamente o que han gustado a usuarios similares(filtrado colaborativo). Empresas como Netflix y Amazon lo utilizan ampliamente.
  • Visión por ordenador (VC): Las imágenes o los parches de imágenes pueden convertirse en incrustaciones que capturan características visuales. Esto es fundamental para tareas como la recuperación de imágenes (encontrar imágenes visualmente similares), la clasificación de imágenes, y sirve de base para tareas más complejas como la detección de objetos y la segmentación de imágenes realizadas por modelos como Ultralytics YOLO. Ejemplo: Una plataforma de comercio electrónico utiliza incrustaciones de imágenes para permitir a los usuarios subir una foto de una prenda de ropa y encontrar productos similares en su catálogo. Plataformas como Ultralytics HUB facilitan el entrenamiento y despliegue de tales modelos.
  • Análisis de grafos: Las incrustaciones pueden representar nodos y aristas en grafos, capturando la estructura de la red y las relaciones entre nodos para tareas como la predicción de enlaces o la detección de comunidades, a menudo utilizando Redes Neuronales de Grafos (GNN).

Incrustaciones vs. Conceptos relacionados

Es útil distinguir las incrustaciones de los términos relacionados:

  • Incrustaciones vs. Extracción de rasgos: Las incrustaciones son una forma sofisticada, a menudo automatizada, de extracción de características que se consigue mediante el aprendizaje profundo. Mientras que la ingeniería de características tradicional puede implicar la definición manual de características (por ejemplo, histogramas de color para imágenes), las incrustaciones aprenden características relevantes directamente de los datos durante el entrenamiento.
  • Incrustaciones vs. Búsqueda vectorial / Bases de datos vectoriales: Las incrustaciones son las representaciones vectoriales de los elementos de datos. La búsqueda vectorial es el proceso de consultar una colección de incrustaciones para encontrar las más similares (cercanas) a un vector de consulta, a menudo utilizando algoritmos de Vecino Próximo Aproximado (RNA ) para mayor eficacia. Las bases de datos vectoriales (como Pinecone o Milvus) son bases de datos especializadas optimizadas para almacenar, indexar y realizar búsquedas vectoriales rápidas en grandes volúmenes de incrustaciones.

Las incrustaciones proporcionan una potente forma de representar datos para los modelos de aprendizaje automático, permitiéndoles comprender similitudes semánticas y patrones complejos en diversos tipos de datos, desde texto a imágenes. Son una tecnología fundamental que impulsa los avances en numerosas aplicaciones de IA y forman parte integral de las capacidades de los marcos modernos de ML como PyTorch y TensorFlow.

Leer todo
OSZAR »