logo
Desarrollo
Buscar
Visión general

Visión general

MultiAgent es un potente sistema de múltiples agentes diseñado para coordinar varios agentes que trabajan conjuntamente para completar tareas complejas. El proceso de creación y configuración de MultiAgent es ágil y eficiente, y utiliza un enfoque Planner-Executor-Reviewer para la ejecución de tareas. Las organizaciones pueden personalizar sus equipos de agentes de IA en función de distintos escenarios empresariales, lo que mejora de forma significativa la eficiencia y la flexibilidad de las aplicaciones de IA dentro de la empresa. La plataforma incluye diversos agentes de IA preconfigurados, entre ellos AI Coder IDE, Browser Use y Computer Use. Estos agentes están listos para usarse desde el primer momento, sin necesidad de una configuración compleja.

El funcionamiento de MultiAgent es el siguiente:

loading...
flowchart LR

 subgraph P["Planner"]
    direction TB
        P1["Task Clarification
        Identify and clarify user instruction intent"]
        P2["Planner
        Generate high-quality Task Todo List"]
        P3["Action
        Dynamically generate Action List for Tasks"]
  end
 subgraph R["Runner"]
    direction TB
        T(["Task-1"])
        T2(["Task-2"])
        T3(["Task..."])
    direction LR
        A3["Action1"]
        A4["Action2"]
        A5["Action3"]
        A6["Action4"]
  end
 subgraph Rev["Reviewer"]
    direction TB
        RV["Enterprise Custom Review Standards"]
        D1{"Human
        Takeover Needed?"}
        D2{"Full Task
        Update Required?"}
        D3{"Pending Tasks
        Need Update?"}
        D4{"Current Task
        Need Re-execution?"}
        End(["Continue Task Execution"])
  end
    H2["Human User Takeover"]
    H1["User Issues Task"]
    P1 --> P2
    P2 --> P3
    P -- Serial --> T & T2 & T3
    T -- Parallel --> A3 & A4
    A6 -- Task Execution Complete --> RV
    RV -- Not Pass --> D4
    D4 -- N --> D3
    D4 -. Y .-> T
    D3 -. Y .-> P
    D3 -- N --> D2
    D2 -- N --> D1
    D2 -. Y .-> P
    D1 -- Y --> H2
    D1 -- N --> End
    A4 -- Serial --> A5
    A5 -- Serial --> A6
    RV -- Pass --> NT["Start Next Task"]
    H1 -- Submit Task Instruction --> P

     H1:::human
     H2:::human
     P1:::planner
     P2:::planner
     P3:::planner
     T:::runner
     T2:::runner
     T3:::runner
     A3:::runner
     A3:::Peach
     A4:::runner
     A4:::Peach
     A5:::runner
     A5:::Peach
     A6:::runner
     A6:::Peach
     RV:::reviewer
     D1:::decision
     D2:::decision
     D3:::decision
     D4:::decision
     End:::reviewer
     NT:::reviewer
    classDef human fill:#e3f2fd,stroke:#90caf9,stroke-width:2px
    classDef planner fill:#e8f5e9,stroke:#81c784,stroke-width:2px
    classDef runner fill:#fffde7,stroke:#ffe082,stroke-width:2px
    classDef reviewer fill:#ede7f6,stroke:#b39ddb,stroke-width:2px
    classDef decision fill:#fce4ec,stroke:#ec407a,stroke-width:2px,stroke-dasharray:4 2
    classDef Peach stroke-width:1px, stroke-dasharray:none, stroke:#FBB35A, fill:#FFEFDB, color:#8F632D

Funcionalidades clave

  • Creación de equipos de agentes de IA personalizados: la plataforma MultiAgent permite a las empresas ensamblar de forma flexible equipos de agentes de IA en función de necesidades empresariales específicas, lo que mejora considerablemente la flexibilidad de las aplicaciones de IA dentro de las organizaciones.
  • Amplia variedad de agentes de IA preconfigurados: la plataforma incluye diversos agentes de IA integrados listos para usar, como AI Coder IDE, Browser Use y Computer Use.
  • Compatibilidad con roles en múltiples escenarios: proporciona roles de agentes de IA que abarcan múltiples dominios, incluidos desarrollo, producto, pruebas, algoritmos, datos y marketing, para satisfacer las necesidades de distintos departamentos empresariales.
  • Amplio alcance de aplicación: MultiAgent puede aplicarse a diversos escenarios empresariales, como investigación en profundidad, análisis de hallazgos de datos, generación de documentación de licitación y generación de detalles de cuentas financieras.
  • Eficiente y fácil de usar: uso sencillo que mejora en gran medida la eficiencia del trabajo. Por ejemplo, se puede ensamblar un equipo de agentes de análisis de datos con IA en cuestión de minutos.

Creación y configuración

Crear un sistema MultiAgent es sencillo, similar a configurar un único agente. Los aspectos clave incluyen:

  • Configuración global: de forma predeterminada, la configuración global está contraída. Aquí se pueden configurar la memoria, las capacidades de entrada/salida y otros módulos como base de conocimientos, base de datos, registros y hallazgos, en línea con la funcionalidad de un agente único.
  • Adición de nodos: se pueden añadir varios agentes al lienzo de MultiAgent haciendo clic en "Add Node". Los tipos de agente disponibles incluyen:
    • Agentes preconfigurados: agentes listos para usar creados por GPTBots con capacidades predefinidas, como Online Search y Browser Use.
    • Agentes de plantilla: agentes que requieren configuración por parte del usuario para definir sus roles y capacidades.
  • Integración de agentes: para crear un equipo MultiAgent, basta con seleccionar los agentes deseados, añadirlos al lienzo y conectarlos con líneas. Esto vincula sus capacidades para la ejecución colaborativa de tareas.

Introducción a los agentes

Planner Agent

El Planner es el agente principal de MultiAgent, responsable de la aclaración de requisitos, la planificación de tareas, la generación de tareas de ejecución y la revisión de la calidad de finalización de las tareas. Se recomienda elegir la versión de modelo más capaz, aunque la selección de un modelo de inferencia puede incrementar significativamente el tiempo de ejecución.
El Planner admite mecanismos de control de tareas personalizados, como el ajuste dinámico de tareas, las opciones de toma de control por parte del usuario y la configuración de límites máximos de reintentos para tareas individuales, con el fin de evitar un consumo excesivo de tokens.
El Planner también puede configurarse con capacidades de memoria, herramientas, base de conocimientos y base de datos para mejorar la funcionalidad.

Computer Use Agent

El Computer Use Agent admite prompts de identidad personalizados y límites máximos configurables de iteraciones por tarea para evitar un consumo excesivo de tokens. También admite la funcionalidad de toma de control por parte del usuario, lo que permite que los usuarios humanos asuman el control y operen el ordenador de forma remota cuando el agente no puede avanzar adecuadamente con las tareas.
Computer Use se ejecuta en un entorno Linux aislado (sandbox) y puede utilizar aplicaciones del ordenador, sistemas de archivos y comandos del sistema para completar tareas.

Browser Use Agent

Se ejecuta en un entorno de navegador aislado (sandbox) para la ejecución de tareas basadas en el navegador. Requiere una capacidad LLM baja y puede utilizarse independientemente de si el LLM admite reconocimiento de imágenes.

Coder IDE Agent

Completa tareas mediante generación de código y se ejecuta en un entorno CLI aislado (sandbox). Destaca en la búsqueda, la ejecución de API, la generación de páginas web y la creación de documentación.

Online Search Agent

Online Search dispone de capacidades autónomas para recuperar y obtener el contenido de páginas URL, lo que lo hace especialmente útil en escenarios de búsqueda y recopilación de información en línea.

Proceso de ejecución

El proceso de finalización de tareas de MultiAgent sigue estos pasos:

  1. Entrada de tareas: se introducen descripciones de tareas y se envían. El Planner determina si se debe ejecutar directamente o si se requiere una aclaración.
  2. Generación de la lista de tareas: una vez que las instrucciones están claras, el Planner genera una lista de tareas para que el usuario la confirme antes de la ejecución automática.
  3. Ejecución dinámica: durante la ejecución, el Planner genera dinámicamente listas de acciones para cada tarea. Tras completar cada tarea, el Planner evalúa la calidad y decide si debe ajustar o actualizar la lista de tareas.
  4. Finalización de tareas: al completar todas las tareas, MultiAgent resume y proporciona los resultados finales. Si es necesario, se pueden realizar preguntas de seguimiento para actualizar los resultados de las tareas.

Buenas prácticas

  • Descripción de capacidades: garantizar descripciones de capacidades precisas y detalladas para cada agente con el fin de ayudar al Planner a lograr una asignación eficiente de tareas.
  • Optimización del modelo: elegir modelos para el Planner que equilibren rendimiento y velocidad, evitando retrasos por un razonamiento excesivo.
  • Mecanismos de control: establecer límites de iteración adecuados y opciones de toma de control por parte del usuario para optimizar el consumo de recursos y la fiabilidad de las tareas.