Glosario

Ingeniería rápida

Domina el arte de la ingeniería rápida para guiar modelos de IA como los LLM para obtener resultados precisos y de alta calidad en contenidos, atención al cliente y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La ingeniería de instrucciones es el arte y la ciencia de elaborar instrucciones eficaces para guiar a los modelos de Inteligencia Artificial (IA), especialmente a los Modelos de Lenguaje Amplio (LLM), hacia la generación de los resultados deseados. Implica comprender cómo interpretan las instrucciones estos modelos y diseñar iterativamente instrucciones que sean claras, específicas y proporcionen suficiente contexto para obtener respuestas precisas, relevantes y útiles. A medida que los modelos de IA se integran más en diversas herramientas y flujos de trabajo, dominar la ingeniería de instrucciones es crucial para maximizar su potencial y garantizar un rendimiento fiable en tareas que van desde la simple respuesta a preguntas hasta la compleja generación de textos creativos.

Cómo funciona Prompt Engineering

La ingeniería de prontitud eficaz suele ser un proceso iterativo. Comienza con el análisis de los requisitos de la tarea y la comprensión de las capacidades y limitaciones del modelo de IA objetivo. A continuación, el ingeniero diseña una instrucción inicial, la prueba, evalúa el resultado y la refina en función de los resultados. Este perfeccionamiento puede consistir en añadir instrucciones más específicas, proporcionar ejemplos(aprendizaje de pocos disparos), definir el formato de salida deseado (por ejemplo, JSON), establecer restricciones o ajustar el tono. Las técnicas clave suelen basarse en principios del Procesamiento del Lenguaje Natural (PLN ) y requieren una cuidadosa consideración de cómo afecta la redacción al comportamiento del modelo, influido por sus datos de entrenamiento y su arquitectura, como el modelo Transformer descrito en el famoso artículo "Attention Is All You Need" (La atención es todo lo que necesitas ).

Técnicas clave de incitación

En la ingeniería rápida se suelen emplear varias estrategias:

  • Indicación de tiro por cero: Pedir directamente al modelo que realice una tarea sin proporcionar ejemplos previos en la propia indicación. Se basa en el conocimiento preexistente del modelo, adquirido durante el entrenamiento. Véase Aprendizaje sin intervención.
  • Petición de pocos ejemplos: Incluir un pequeño número de ejemplos (pares de entrada-salida) directamente dentro del prompt para guiar al modelo en la tarea y el formato deseados.
  • Estimulación de la cadena de pensamiento (CoT): Animar al modelo a "pensar paso a paso" incitándole a desglosar su proceso de razonamiento antes de dar la respuesta final, suele mejorar el rendimiento en tareas complejas.
  • Instrucción de rol: Indicar al modelo que adopte un personaje o rol concreto (por ejemplo, "Actúa como un desarrollador experto Python ") para adaptar su estilo de respuesta y su contenido.
  • Especificar la estructura de salida: Definir claramente el formato deseado para la salida, como solicitar una lista numerada, una tabla o código formateado en un lenguaje específico. Recursos como la Guía de ingeniería de instrucciones de OpenAI ofrecen las mejores prácticas.

Aplicaciones en el mundo real

Una ingeniería rápida es fundamental para el éxito del despliegue de muchas aplicaciones de IA:

  1. Automatización del Servicio de Atención al Cliente: Diseño de instrucciones para que los chatbots y los asistentes virtuales gestionen las consultas de los clientes con precisión, mantengan una voz de marca específica y escalen adecuadamente los problemas complejos. Las empresas utilizan estas técnicas para mejorar la experiencia del cliente, como se ve en plataformas como Zendesk AI.
  2. Creación y resumen de contenidos: Creación de indicaciones para herramientas de IA Generativa (como las desarrolladas por Cohere o Anthropic) para generar textos de marketing, escribir correos electrónicos, resumir documentos largos(resumen de texto), o incluso generar fragmentos de código utilizando herramientas como GitHub Copilot.

Otras aplicaciones incluyen motores de búsqueda semántica, herramientas educativas interactivas y sofisticados análisis de datos mediante interfaces de lenguaje natural.

Ingeniería Prompt vs. Conceptos afines

Es útil diferenciar la ingeniería rápida de los términos relacionados:

  • Enriquecimiento del aviso: Se centra en aumentar automáticamente la instrucción inicial de un usuario con contexto adicional (p. ej., de una base de conocimientos mediante RAG) antes de que llegue al LLM. La ingeniería de instrucciones es la elaboración manual de las instrucciones básicas.
  • Ajuste de indicaciones: Una técnica de ajuste fino eficiente de los parámetros (PEFT ) en la que se añaden a la entrada del modelo y se optimizan incrustaciones aprendibles (indicaciones suaves), en lugar de elaborar indicaciones textuales.
  • Ajuste fino: Consiste en actualizar los pesos reales del modelo entrenándolo más en un conjunto de datos concreto, adaptando el modelo en sí y no sólo la entrada de datos.

Aunque distintas, estas técnicas pueden ser complementarias. Por ejemplo, un prompt base bien diseñado podría enriquecerse automáticamente con datos recuperados antes de ser procesado por un modelo afinado. Los marcos como LangChain suelen integrar estos distintos enfoques.

Relevancia en la visión por ordenador

Tradicionalmente menos prominente en la Visión por Computador (VC ) en comparación con la PNL, la ingeniería de promptables está adquiriendo cada vez más relevancia con el auge de los modelos multimodales y los sistemas de visión promptables. Modelos como CLIP, YOLO o YOLOE pueden realizar tareas como la detección de objetos o la segmentación de imágenes basándose en descripciones de texto. Elaborar instrucciones de texto eficaces (por ejemplo, "detecta todos los "coches rojos" pero ignora los "camiones") es una forma de ingeniería de instrucciones crucial para guiar estos Modelos de Lenguaje de Visión. Plataformas como Ultralytics HUB facilitan la interacción con varios modelos, entre ellos Ultralytics YOLO modelos como YOLOv8 y YOLO11en los que la definición de tareas a través de interfaces puede beneficiarse de los principios de la ingeniería rápida, especialmente a medida que los modelos adquieren más capacidades interactivas.

Leer todo
OSZAR »