Del mensaje a la acción: así operan los agentes especializados en un asistente de IA multi-agente
Actualmente, los asistentes conversacionales basados en IA agéntica ya no solo responden a consultas informativas en lenguaje natural –lo que fue su función inicial–, sino que también pueden realizar operaciones o ejecutar tareas siguiendo las indicaciones del usuario o cliente. Esta evolución es clave para muchas empresas, ya que abre la puerta a un nuevo modelo de relación con el cliente y hace que éste pueda realizar sus gestiones de una forma más fácil e intuitiva.
En un artículo anterior describimos el papel del agente de triaje o agente clasificador, componente central y “centro de decisiones” del asistente de IA. Su función principal es clasificar la consulta del cliente y derivarla al agente más adecuado, pero también puede pedir aclaraciones cuando necesita más información (función de clarificación) o redirigir la conversación cuando la consulta escapa del ámbito bancario (función de fallback). Como ya vimos, este paso intermedio de triaje es el que permite construir un asistente de IA multi-agente más eficiente y escalable.
Ahora pondremos el foco en los agentes especializados que forman parte de Blue: agentes de IA expertos en resolver tareas concretas y que se activan una vez el agente de triaje ha podido identificar con precisión la operativa bancaria que desea realizar el cliente.
Antes de profundizar en el funcionamiento de estos agentes de IA, es importante recordar que, para nuestro asistente, una operativa bancaria es cualquier proceso que requiere acceder a información específica del cliente. Hacer un pago móvil o consultar el saldo disponible en la cuenta son ejemplos de operativas bancarias para el asistente de IA.
La función de los agentes de IA especializados
Un cliente envía un mensaje a través de Blue. Inmediatamente, el agente de triaje trata de identificar la consulta del cliente y clasificarla como una operativa concreta o como una petición de información. En el caso de tratarse de una consulta operativa, el agente de triaje deriva el mensaje y toda la información recabada al agente de IA correspondiente.
Para poder resolver las diferentes operativas bancarias, el asistente Blue cuenta con una arquitectura modular basada en agentes especializados. Cada uno de estos agentes está diseñado para gestionar una de las más de 150 operativas disponibles en el sistema. Es decir, existen tantos agentes especializados como operativas disponibles.
Estos agentes específicos también interactúan con el cliente para recopilar información adicional cuando sea necesario, verificar el contexto y, en última instancia, ejecutar o facilitar la operativa correspondiente.
Cabe destacar que el sistema conversacional basado en un gran modelo de lenguaje (LLM) tiene como responsabilidad principal la recogida de la información necesaria para llevar a cabo cada operativa. Sin embargo, no es éste sistema el que ejecuta la operación directamente. En realidad, la información estructurada se transfiere a otro sistema independiente que primero la muestra al cliente de manera visual, clara y adaptada al entorno de la app, y posteriormente la ejecuta. Esto garantiza una experiencia más cómoda e intuitiva para el usuario.
Adicionalmente, para las operativas que afecten directamente al dinero del cliente —como efectuar transferencias u otros pagos—, el proceso incluye siempre un paso final de confirmación explícita, de forma similar a lo que ocurre al realizar este tipo de operativas desde su apartado específico en la app móvil de BBVA. Así, el cliente tiene que ratificar la decisión final antes de que cualquier operación se complete, reforzando la seguridad y transparencia del proceso.
El propósito final de los agentes especializados es ofrecer a los clientes la posibilidad de gestionar tareas sin salir del entorno conversacional. Aunque esto es ya una posibilidad para muchas operativas bancarias en Blue, hay otras que requieren algunos pasos adicionales. A continuación describimos los principales tipos de agentes especializados, según su comportamiento y la respuesta que ofrecen al cliente.
Las operativas end-to-end (E2E): resolviendo tareas sin salir del asistente
Las operativas end-to-end (E2E) son aquellas que se realizan íntegramente desde el entorno conversacional, es decir, sin redirigir al cliente fuera del chat. Para ejecutar este tipo de operativas contamos con los agentes más sofisticados, que integran tanto lógica de negocio como capacidades de interacción contextual. Cada uno de estos agentes especializados cuenta con tres elementos clave:
| Prompt de comportamiento |
| Define el rol y las instrucciones del agente, incluyendo cuándo pedir aclaraciones, gestionar excepciones y finalizar la operativa. |
| Entidades |
| Datos que el cliente debe proporcionar para completar la operación. Algunas son obligatorias (ej. el importe en un Bizum/pago instantáneo), otras opcionales (ej. el concepto del envío). |
| Herramientas (tools) |
|
Funciones que el LLM puede invocar para ejecutar la operativa. Las principales herramientas son:
|
| Prompt de comportamiento |
| Define el rol y las instrucciones del agente, incluyendo cuándo pedir aclaraciones, gestionar excepciones y finalizar la operativa. |
| Entidades |
| Datos que el cliente debe proporcionar para completar la operación. Algunas son obligatorias (ej. el importe en un Bizum/pago instantáneo), otras opcionales (ej. el concepto del envío). |
| Herramientas (tools) |
|
Funciones que el LLM puede invocar para ejecutar la operativa. Las principales herramientas son:
|
El agente permanece en la conversación hasta que puede invocar la herramienta de finalización o cuando detecta un cambio de intención que requiere reencaminar el flujo.
Caso de uso E2E: la operativa Bizum
El agente de IA especializado en Bizum (pago móvil instantáneo) es uno de los más utilizados, especialmente en España. Permite al cliente seleccionar el contacto al que se enviará el pago y ejecutar la operativa sin salir del chat. Para reforzar la seguridad y transparencia del proceso, en su tramo final el asistente muestra la información del pago que se va a realizar y muestra un botón donde el cliente debe hacer click para confirmar la operación.
Uno de los principales retos a los que nos enfrentamos con el agente de Bizum fue trabajar con las agendas de contactos de los clientes, que pueden variar mucho en tamaño. Enviar una agenda muy extensa a un LLM puede generar problemas de tiempo de respuesta, coste computacional y rendimiento. Por esta razón, hemos incorporado un proceso previo de filtrado de contactos sobre toda la agenda del cliente, que se activa antes de que tome acción el agente especializado en Bizum.
Primero, el cliente realiza una consulta que incluye información básica sobre el destinatario del Bizum. Con esta información, se llama a otro LLM para generar una query SQL, con la que filtramos la agenda y obtenemos un subconjunto de contactos –aquellos que están más relacionados con la información aportada por el cliente–.
A continuación, el agente especializado en Bizum conversa con el cliente para obtener el contacto definitivo, la cantidad de dinero a enviar y, opcionalmente, el concepto.
Este enfoque es altamente escalable y permite ofrecer una experiencia fluida independientemente del tamaño de la agenda del cliente. Está ya disponible para todos los clientes y está dando resultados muy positivos.
Agentes de IA especializados que derivan a otras zonas de la app de BBVA
No todas las operativas están aún habilitadas para resolución conversacional completa. Para aquellas en las que no se ha implementado lógica end-to-end (E2E), los agentes especializados fueron diseñados para proponer una solución: proporcionar un enlace que redirige al cliente a la sección correspondiente de la aplicación, donde podrá finalizar su gestión.
Agentes de IA especializados para operativas vinculadas a producto
Dentro de estos agentes de IA, observamos una primera categoría de operativas vinculadas a producto. En estos casos, es necesario identificar previamente el producto sobre el que se quiere actuar –por ejemplo, qué tarjeta se desea apagar–. Para ello, el agente inicia una breve conversación con el cliente utilizando las mismas tools de clarificación, finalización y cambio que en las operativas end-to-end. Una vez identificado el producto, se muestra el enlace correspondiente a la operativa solicitada.
Agentes de IA especializados para operativas sin producto asociado
Se trata de aquellas operativas en las que no es necesario que el agente especializado identifique ningún producto para continuar con el proceso. Una vez detectada la intención del cliente, el agente presenta directamente el enlace que permite completar la gestión fuera del canal conversacional. Esto ocurre, por ejemplo, cuando el cliente traslada su intención de contratar un producto nuevo a través de Blue, como puede ser una hipoteca o un préstamo. En estos casos aún no existe ningún producto sobre el que se pueda realizar una operativa –debido a que la operativa es, de hecho, contratar el producto–.
El futuro de los asistentes de IA: hacia una cobertura 100% conversacional
El asistente de IA de BBVA, Blue, es capaz de realizar operativas bancarias guiado por el cliente. En este artículo nos hemos centrado en los diferentes tipos de agentes especializados en operativas, con especial atención al agente de Bizum, por ser uno de los más utilizados por nuestros clientes.
La principal ventaja de esta arquitectura modular basada en agentes de IA especializados radica en su capacidad para realizar más de 150 operativas bancarias de forma precisa y ágil, muchas de las cuales se pueden resolver sin necesidad de salir del entorno conversacional. La intención a futuro es migrar progresivamente todos los agentes a un formato end-to-end, de manera que cada vez más operativas puedan resolverse íntegramente desde el propio chat. Esto no solo mejora la experiencia del usuario al eliminar redirecciones, sino que también ofrece una interacción más fluida y personalizada.

