Glosario

Asistente virtual

Descubre cómo los asistentes virtuales potenciados por IA utilizan PNL, ML y TTS para automatizar tareas, mejorar la productividad y transformar sectores.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Un Asistente Virtual (AV) es un agente de software basado en Inteligencia Artificial (IA) diseñado para entender órdenes en lenguaje natural (voz o texto) y realizar tareas para un usuario. Estas tareas pueden ir desde acciones sencillas, como establecer recordatorios o reproducir música, hasta operaciones más complejas, como gestionar horarios, controlar dispositivos domésticos inteligentes o proporcionar información recuperada de diversas fuentes. Las VA dependen en gran medida de tecnologías como el Procesamiento del Lenguaje Natural (PLN), el Reconocimiento del Habla y el Aprendizaje Automático (AM) para interpretar las peticiones de los usuarios, aprender sus preferencias y mejorar sus respuestas con el tiempo. Algunos ejemplos populares son Amazon Alexa, Siri de Apple y Google Assistant.

Tecnologías básicas

Los asistentes virtuales integran varias tecnologías clave de IA para funcionar:

  • Procesamiento del Lenguaje Natural (PLN): Permite a la VA comprender el significado que hay detrás del texto del usuario o de las palabras habladas, incluyendo la intención y las entidades. Esto implica técnicas que van desde la tokenización básica hasta el modelado complejo del lenguaje.
  • Reconocimiento del habla: Convierte el lenguaje hablado en texto legible por máquina, formando la entrada para los componentes de PNL. Los avances en el Aprendizaje Profundo (AD ) han mejorado significativamente la precisión de estos sistemas.
  • Gestión del Diálogo: Gestiona el flujo de la conversación, mantiene el contexto entre turnos, hace preguntas aclaratorias y determina la acción o respuesta adecuada. Los sistemas modernos suelen aprovechar sofisticados modelos de secuencia a secuencia.
  • Aprendizaje Automático (AM): Se utiliza para varios aspectos, como mejorar la precisión de la PNL, personalizar las experiencias de los usuarios basándose en interacciones anteriores(Sistema de Recomendación), y aprender nuevas habilidades o estrategias de ejecución de tareas.

Relevancia en IA y ML

Los Asistentes Virtuales son una importante área de aplicación que impulsa la investigación y el desarrollo de la IA conversacional, los Grandes Modelos Lingüísticos (LLM) y la interacción persona-ordenador (HCI). Requieren una integración sofisticada de múltiples capacidades de IA y grandes cantidades de Datos de Entrenamiento para funcionar eficazmente. La necesidad de asistentes más naturales, conscientes del contexto y proactivos impulsa la innovación en áreas como la personalización y la comprensión de la intención del usuario con mayor precisión. Aunque se basan principalmente en el lenguaje, las futuras VAs podrían integrar la Visión por Ordenador (CV), utilizando potencialmente modelos como Ultralytics YOLO para tareas como la Detección de Objetos para comprender el contexto visual, tendiendo un puente entre los asistentes digitales y el mundo físico, quizás ayudando a la IA en entornos sanitarios o aplicaciones de automoción. Plataformas como Ultralytics HUB facilitan la formación y el despliegue de modelos de IA, incluyendo opciones de formación en la nube, que podrían convertirse en componentes de estos sistemas avanzados. Abordar los problemas éticos de la IA, como la privacidad de los datos y el sesgo algorítmico, también es crucial en su desarrollo, exigiendo más transparencia en la IA.

Aplicaciones en el mundo real

Los asistentes virtuales están integrados en numerosos dispositivos y plataformas:

  • Teléfonos y altavoces inteligentes: Proporcionan control manos libres, responden preguntas, reproducen contenido multimedia (por ejemplo, Siri en iPhone, Alexa en dispositivos Echo).
  • Automatización del Servicio de Atención al Cliente: Gestión de las consultas iniciales de los clientes, enrutamiento de llamadas, prestación de asistencia a través de sitios web o aplicaciones, a veces utilizando sistemas avanzados como Google Duplex para tareas como la reserva de citas.
  • Mejora de la productividad: Gestionar calendarios, establecer recordatorios, enviar correos electrónicos o mensajes e integrarse con el software del lugar de trabajo. Herramientas como Microsoft Copilot pretenden ayudar en diversas tareas laborales.
  • Accesibilidad: Ayudar a los usuarios con discapacidad mediante la interacción por voz con la tecnología y la información.

Asistente virtual vs. Chatbot

Aunque tanto los Asistentes Virtuales como los Chatbots entablan conversaciones, difieren en su alcance y capacidad:

  • Alcance: Las VAs suelen tener una gama más amplia de funciones, a menudo integradas en sistemas operativos (iOS, Android) o ecosistemas de hardware, lo que les permite realizar acciones en distintas aplicaciones y controlar la configuración del dispositivo. Los chatbots suelen ser más especializados, diseñados para tareas conversacionales específicas dentro de un contexto concreto, como una web de atención al cliente o una app de mensajería.
  • Ejecución de tareas: Las VAs suelen estar diseñadas para realizar tareas que van más allá de la conversación, como controlar dispositivos domésticos inteligentes, gestionar información personal o interactuar con otro software. Los chatbots se centran principalmente en interacciones conversacionales, proporcionando información o guiando a los usuarios a través de flujos de trabajo específicos (por ejemplo, respondiendo a preguntas frecuentes, solución de problemas sencillos).
  • Integración: Las VA suelen actuar como nodos centrales para interactuar con varios servicios y dispositivos, mientras que los chatbots suelen estar integrados en una única aplicación o sitio web.

Las líneas pueden difuminarse, especialmente a medida que los chatbots se vuelven más sofisticados utilizando tecnologías como los LLM, pero la distinción fundamental radica en la amplitud de las tareas y las capacidades de integración que suelen asociarse a las VA. El desarrollo de ambos se basa en los avances analizados en los completos tutorialesUltralytics .

Leer todo
OSZAR »