¡Importante! Pasos para crear un agente

GPTBots es una plataforma de desarrollo de aplicaciones de IA (agentes) con la que se puede crear cualquier agente adaptado a sus necesidades sin necesidad de programar.

GPTBots es sencillo y fácil de usar. Por lo tanto, el mayor reto para los usuarios es: ¿cómo crear un agente utilizable que satisfaga sus necesidades?

Por ello, el proceso de reflexión es crucial.

En este artículo se describe, paso a paso, cómo reflexionar y crear su propio agente.

Proceso de reflexión

El enfoque para diseñar un agente suele ser similar al de diseñar un producto.

Sin embargo, se recomienda tratar al agente como si fuera una persona. Esto ayuda a proyectar mejor los problemas de la vida real en el agente para que los resuelva.

Escenario

En primer lugar, se debe determinar el escenario, es decir, ¿qué problemas se desea que este agente resuelva?

Suele utilizarse el método «5W1H» para describir un escenario:

Where, When, Who, Why, How, What

Por ejemplo:

En casa (Where), mientras compra en línea (When), el comprador (Who) quiere consultar al servicio de atención al cliente de la tienda en línea (What) mediante una llamada (How) porque no sabe cómo devolver un producto (Why).

Este es un escenario de usuario típico para un agente de atención al cliente de comercio electrónico.

Se puede utilizar como referencia para enumerar varios escenarios para el agente, como:

No saber cómo devolver un producto
No saber cómo obtener un reembolso
No saber cómo cambiar un producto
No saber cómo presentar una reclamación
Cómo usar el producto
Otros métodos de contacto de la plataforma
...

Por lo general, no se recomienda que un agente resuelva una gama demasiado amplia de problemas. Cuanto más verticales o centrados sean los escenarios del agente, con mayor eficacia podrá resolver los problemas.

Al igual que las personas, necesita «especializarse en un campo concreto».

En el ejemplo anterior, los escenarios enumerados están relacionados con la «atención al cliente de comercio electrónico», lo que ayuda a establecer claramente la imagen de un representante de atención al cliente de comercio electrónico.

Al mismo tiempo, es preferible no incluir escenarios no relacionados con la «atención al cliente de comercio electrónico», como «recomendaciones de préstamos» y «recomendaciones de productos», en este agente.

Posicionamiento

Después de enumerar los escenarios, se puede definir un posicionamiento claro para el agente.

En el ejemplo anterior, se trata de un agente de «atención al cliente de comercio electrónico» que puede responder a algunas preguntas de los usuarios sobre la plataforma de comercio electrónico y gestionar tareas como devoluciones y cambios.

Recursos

Una vez que el posicionamiento es claro, se debe empezar a preparar algunos recursos que el agente utilizará, principalmente en dos categorías: conocimiento y herramientas.

Conocimiento

El conocimiento, como indica su nombre, es lo que el agente necesita aprender y comprender, por lo general algunos documentos.

Incluso las personas necesitan aprender el conocimiento de negocio correspondiente antes de gestionar tareas de trabajo. Con el agente sucede lo mismo.

El agente responderá a las preguntas del usuario en función del conocimiento que tenga.

Por ejemplo, el proceso de devoluciones y cambios de una determinada plataforma de comercio electrónico. Si no se proporciona este conocimiento al agente, el agente no sabrá cómo responder. En casos extremos, incluso puede producir «alucinaciones» y dar respuestas aleatorias.

Se deben preparar estos documentos de conocimiento en función de los escenarios y el posicionamiento del agente.

Por ejemplo, si se desea que el agente pueda responder a preguntas sobre devoluciones y cambios en la plataforma de comercio electrónico, se deben preparar documentos relevantes sobre las normas y reglamentos de devoluciones y cambios de la plataforma de comercio electrónico.

Herramientas

Las herramientas son los instrumentos necesarios para que un agente ejecute tareas.

Para un agente, las herramientas son esencialmente «API». Al proporcionar API al agente como herramientas, el agente puede invocar esas API en el momento adecuado para realizar determinadas tareas.

Por ejemplo, si un usuario de una plataforma de comercio electrónico desea devolver un producto, el desarrollador del agente puede proporcionar al agente la API de devoluciones. A continuación, cuando el usuario quiera devolver un producto, el agente podrá invocar esa API y completar directamente el proceso de devolución para el usuario.

Se deben preparar estas herramientas (API) en función del escenario y el posicionamiento del agente, como API de devoluciones, API de cambios, API de envío de tickets, etc.

Diseño

Tras aclarar las ideas y preparar los recursos, se puede pasar a la fase formal de diseño del agente.

Prompt de identidad: posicionar el agente

Redactar un prompt de identidad razonable es el primer paso para crear un agente excelente.

En el prompt de identidad, se debe definir el rol, las habilidades, las tareas, las restricciones, etc. del agente, para que comprenda claramente sus responsabilidades y rinda mejor.

Más información: How to Write Effective and Powerful Identity Prompts

Asignación de contexto: permitir que los agentes gestionen la información adecuada dentro de un espacio limitado

El agente se basa en un modelo de lenguaje de gran tamaño (LLM), y la longitud de contexto de un LLM representa la cantidad de información que puede gestionar, que es limitada.

Al igual que la capacidad de distintas personas para leer artículos: algunas pueden leer una gran cantidad de artículos en poco tiempo y aun así comprender y procesar el contenido y la información, mientras que otras solo pueden leer una pequeña cantidad de artículos en el mismo tiempo y quizá ni siquiera puedan procesarlos.

La longitud de contexto de un LLM es similar a la cantidad de artículos que una persona puede leer y procesar en poco tiempo.

Por lo tanto, dentro de un contexto limitado, proporcionar información adecuada al LLM y minimizar la información irrelevante puede ayudar al LLM a producir mejores resultados.

Más información: How to Reasonably Allocate LLM Context

Base de conocimiento: enseñar conocimiento al agente

Cargar los documentos de conocimiento preparados en la base de conocimiento para que, cuando los usuarios hagan preguntas, el agente utilice primero la consulta del usuario para buscar dentro de la base de conocimiento, encuentre contenido del documento semánticamente relacionado con la pregunta como referencia y, después, el LLM lo resuma y proporcione una respuesta al usuario.

Sin embargo, cargar documentos de conocimiento en la base de conocimiento del agente no necesariamente es la mejor forma de utilizar el conocimiento; esto está relacionado con el marco de trabajo RAG y con la manera en que el LLM gestiona las tareas. Puede consultar este artículo para diseñar el método que mejor se adapte a su escenario:

Más información: How to Operate the Knowledge Base

Herramientas: permitir que los agentes ejecuten tareas

En el módulo de herramientas, se pueden empaquetar las API preparadas como herramientas y añadirlas al agente, lo que permite al agente ejecutar esas API.

Más información: How to Create Tools

Al mismo tiempo, GPTBots también proporciona una gran cantidad de OpenTools listas para usar, que se pueden añadir directamente al agente según sus necesidades sin necesidad de desarrollo adicional.

Flow: adecuado para agentes con procesos complejos

Si se necesita diseñar una lógica de agente bastante compleja, que implique numerosos pasos, procesos o juicios condicionales, Flow será una excelente opción. Permite configurar libremente el flujo de trabajo del agente en un lienzo mediante arrastrar y soltar.

Más información: About Flow

Memoria: permitir que el agente gestione tareas de forma continua

Al igual que en las conversaciones entre personas, es necesario saber de qué se habló antes para continuar el tema anterior y mantener la conversación.

La memoria de un agente funciona de forma similar.

Se puede determinar si usar memoria y cómo utilizarla en función del escenario de servicio del agente. Por ejemplo:

Si el agente implica muchas rondas de conversación para resolver un problema (como debates en profundidad), se puede habilitar la «memoria a largo plazo».
Si el agente puede resolver el problema en solo unas pocas rondas de conversación (como consultas en línea), se puede habilitar solo la «memoria a corto plazo» sin necesidad de la «memoria a largo plazo».
Si la tarea principal del agente se puede completar de una sola vez (como redactar un correo electrónico), entonces no es necesario habilitar ninguna memoria.

Al mismo tiempo, también se pueden proporcionar atributos del usuario al agente como memoria, lo que permite al agente comprender cierta información sobre el usuario para ofrecer mejores servicios personalizados.

Por ejemplo, para un agente de servicio de habitaciones de hotel, cuando el agente interactúa con un huésped, debe haber obtenido previamente el nombre del huésped, el número de habitación y otros datos mediante los atributos del usuario. Por lo tanto, si el huésped solicita la entrega de comida a través del agente en ese momento, el agente no necesita volver a preguntar el nombre del huésped y el número de habitación. Solo necesita preguntar qué tipo de servicio requiere el huésped, ya que el agente sabe a qué habitación debe entregar la comida.

Más información: About Memory and User Attributes

Uso tras la publicación: dónde se utilizan los agentes

Se puede evaluar dónde es necesario integrar el agente en función de su caso de uso específico para atender a los usuarios.

Integrarlo donde estén los usuarios.

Más información: Agent Integration

Ejemplos

Si, tras leer el contenido anterior, todavía no se entiende del todo cómo diseñar un agente, también se han preparado numerosos ejemplos.

Solo es necesario seleccionar cualquier plantilla al crear un agente. Se puede consultar los parámetros ya configurados en la plantilla para comprender mejor y reflexionar sobre cómo diseñar un agente. Esta es una muy buena forma de aprendizaje.