概要

MultiAgentは、複数のエージェントが協力して複雑なタスクを遂行するための強力なマルチエージェントシステムです。MultiAgentの作成と設定プロセスはシンプルかつ効率的で、Planner-Executor-Reviewer方式でタスクを実行します。企業は様々なビジネスシーンに応じてAIエージェントチームをカスタマイズでき、企業におけるAI活用の効率性と柔軟性を大幅に向上させることができます。プラットフォームには、AI Coder IDE、Browser Use、Computer Useなど、多様な事前設定済みAIエージェントが組み込まれています。これらのエージェントは設定不要ですぐに使用できます。
MultiAgentの動作の仕組みは以下の通りです：

flowchart LR

 subgraph P["Planner"]
    direction TB
        P1["タスクの明確化
        ユーザー指示の意図を理解し明確化"]
        P2["Planner
        高品質なタスクTodoリストの生成"]
        P3["Action
        タスクに対する動的アクションリストの生成"]
  end
 subgraph R["Runner"]
    direction TB
        T(["Task-1"])
        T2(["Task-2"])
        T3(["Task..."])
    direction LR
        A3["Action1"]
        A4["Action2"]
        A5["Action3"]
        A6["Action4"]
  end
 subgraph Rev["Reviewer"]
    direction TB
        RV["企業カスタム審査基準"]
        D1{"人間による
        引継ぎが必要か"}
        D2{"タスクの
        全量更新が必要か"}
        D3{"未実行タスクの
        更新が必要か"}
        D4{"現在完了したタスクの
        再実行が必要か"}
        End(["タスクの実行を継続する"])
  end
    H2["人間ユーザーによる引継ぎ"]
    H1["ユーザーからのタスク発行"]
    P1 --> P2
    P2 --> P3
    P -- 直列 --> T & T2 & T3
    T -- 並列 --> A3 & A4
    A6 -- タスク実行完了 --> RV
    RV -- 不合格 --> D4
    D4 -- N --> D3
    D4 -. Y .-> T
    D3 -. Y .-> P
    D3 -- N --> D2
    D2 -- N --> D1
    D2 -. Y .-> P
    D1 -- Y --> H2
    D1 -- N --> End
    A4 -- 直列 --> A5
    A5 -- 直列 --> A6
    RV -- 合格 --> NT["次のタスクの実行開始"]
    H1 -- タスク指示の提出 --> P

     H1:::human
     H2:::human
     P1:::planner
     P2:::planner
     P3:::planner
     T:::runner
     T2:::runner
     T3:::runner
     A3:::runner
     A3:::Peach
     A4:::runner
     A4:::Peach
     A5:::runner
     A5:::Peach
     A6:::runner
     A6:::Peach
     RV:::reviewer
     D1:::decision
     D2:::decision
     D3:::decision
     D4:::decision
     End:::reviewer
     NT:::reviewer
    classDef human fill:#e3f2fd,stroke:#90caf9,stroke-width:2px
    classDef planner fill:#e8f5e9,stroke:#81c784,stroke-width:2px
    classDef runner fill:#fffde7,stroke:#ffe082,stroke-width:2px
    classDef reviewer fill:#ede7f6,stroke:#b39ddb,stroke-width:2px
    classDef decision fill:#fce4ec,stroke:#ec407a,stroke-width:2px,stroke-dasharray:4 2
    classDef Peach stroke-width:1px, stroke-dasharray:none, stroke:#FBB35A, fill:#FFEFDB, color:#8F632D

主な特長

カスタマイズ可能なAIエージェントチーム構築：Multi-Agentプラットフォームでは、企業が具体的なビジネスニーズに応じて柔軟にAIエージェントチームを構築できるため、企業におけるAI活用の柔軟性が大幅に向上します。
豊富な事前設定済みAIエージェント：プラットフォームには、AI Coder IDE、Browser Use、Computer Useなど、すぐに使用できる多様なAIエージェントが組み込まれています。
多様な役割のサポート：開発、プロダクト、テスト、アルゴリズム、データ、マーケティングなど、様々な分野のAIエージェント役割を提供し、企業の各部門のニーズに対応します。
幅広い適用範囲：Multi-Agentは、詳細な研究、データ分析、入札書作成、財務明細生成など、多様なビジネスシーンで活用できます。
効率的で使いやすい：操作が簡単で、作業効率を大幅に向上させます。例えば、AIデータ分析エージェントチームを数分で構築できます。

作成と設定

MultiAgentシステムの作成は、単一のエージェントと同様に非常に簡単です。主な側面は以下の通りです：

グローバル設定：デフォルトでは、グローバル設定は折りたたまれています。ここでメモリー、入出力機能、ナレッジベース、データベース、ログ、インサイトなどのモジュールを設定でき、これらの機能は単一のエージェントと同じです。
ノードの追加：ユーザーは「ノード追加」をクリックして、様々なエージェントをMultiAgentキャンバスに追加できます。利用可能なエージェントタイプには以下があります：
事前設定済みエージェント：GPTBotsが事前に構築したエージェントで、Online SearchやBrowser Useなどの事前定義された機能を持ち、すぐに使用できます。
テンプレートエージェント：ユーザーが役割と機能を定義するために設定する必要があるエージェントです。
エージェントの統合：MultiAgentチームを構築するには、必要なエージェントを選択してキャンバスに追加し、線で接続するだけです。これにより、それらの機能がリンクされ、協調的なタスク実行が可能になります。

エージェントの概要

プランナーエージェント

「プランナー」はMultiAgentの中核となるエージェントで、要件の明確化、タスク計画、実行タスクの生成、タスク完了の品質レビューなどの重要な作業を担当します。そのため、最も強力なモデルバージョンを選択することをお勧めしますが、推論モデルを選択すると実行時間が大幅に長くなる可能性があります。
プランナーはタスクの動的調整、ユーザーによる引き継ぎの可否、トークン消費を抑えるための単一タスクの最大実行回数制限など、カスタマイズ可能なタスク制御メカニズムをサポートしています。
また、プランナーにメモリー、ツール、ナレッジベース、データベースなどの機能を設定して、より多くの能力を持たせることもできます。

Computer Use エージェント

Computer Use エージェントはカスタムアイデンティティプロンプトをサポートし、トークンの過剰消費を防ぐためにタスクの最大反復回数を設定できます。また、エージェントがタスクを正しく進められない場合に人間のユーザーに引き継ぎを要求し、コンピュータをリモート制御できるユーザー引き継ぎ機能もサポートしています。
Computer Useはサンドボックス環境のLinuxシステムで動作し、コンピュータ上のアプリケーション、ファイルシステム、システムコマンドなどのツールを使用してタスクを完了できます。

Browser Use エージェント

サンドボックス環境のブラウザで動作し、ブラウザ環境でタスクを実行できます。LLMの能力要件が低く、LLMが画像認識をサポートしているかどうかに関係なく使用できます。

Coder IDE エージェント

コード生成によってタスクを完了します。AI Coder IDEはサンドボックスCLI環境で動作し、検索、API実行、Webページやドキュメントの生成などを得意としています。

Online Search エージェント

Online Searchは自律的に検索を行いURLページコンテンツを取得する能力を持っているため、情報ネットワーク検出シナリオで非常に有用です。

実行フロー

MultiAgentによるタスク完了のプロセスは以下の通りです：

タスク入力：ユーザーがタスクの説明を入力して送信します。プランナーは説明に基づいて、タスクを直接実行するか、ユーザーに明確化を求めるかを判断します。
タスクリストの生成：タスク指示が明確になったら、プランナーはまずタスクリストを生成し、ユーザーの確認後に自動実行を開始します。
動的実行：実行中、プランナーは各タスクに対してアクションリストを動的に生成します。各タスクが完了すると、プランナーは完了品質を評価し、タスクリストの調整または更新の必要性を判断します。
タスク完了：すべてのタスクが完了すると、MultiAgentは結果をまとめて提供します。必要に応じて、ユーザーは追加の質問をして結果を更新できます。

ベストプラクティス

能力の説明：各エージェントの能力説明を正確かつ詳細に記述し、プランナーが効率的にタスクを割り当てられるようにします。
モデルの最適化：プランナーには性能と速度のバランスの取れたモデルを選択し、過度な推論による遅延を避けます。
制御メカニズム：反復回数の上限とユーザー引き継ぎを適切に設定し、リソース消費とタスクの信頼性を最適化します。