logo
Development
検索
ナレッジの取得

ナレッジの取得

ナレッジベースとはエージェントのプライベートなナレッジを集めたものです。ナレッジ取得ノードはユーザーの入力に基づいた特定のナレッジベースからの検索を可能にし、最も関連性が高い(最も類似性が高い)ナレッジブロックを探し出し、その結果を一覧として戻します。

ノードの設定

image.png

  • 検索範囲:この設定でどのナレッジベースから検索を行うのかを決定できます。複数のナレッジベースからの検索も可能です。探し出すべきナレッジは、始めに定義したワークフローのナレッジベースにて指定する必要があります。

  • クエリ:これは検索のためのキーワードです。システムはこのクエリを用いて指定されたナレッジベースから最も関連性の高いナレッジブロックを探し出します。

  • ナレッジ関連性:検索結果として得たナレッジブロックの最低限の関連性(類似性スコア)を定義します。この閾値より低いスコアのブロックは除外されます。

  • リコール数:検索結果として得るナレッジブロックの最大数を、その類似性スコアの降順で指定します。

  • 検索ウェイト

    • 意味的検索:単語や文章の中にある関係性を人間が解釈するのと同じように理解します。言葉の意味や異なる言語間のクエリが必要な場合に推奨されます。
    • キーワード検索:精確なキーワードに基づいて全文を検索します。名前や専門用語、略語が含まれる情報を探す場合に理想的です。
    • 混合検索:意味的検索とキーワード検索の両方の利点を活かし、検索結果を総合的にランキングします。
  • リランクモデル:取得した文章の断片をその関連性や品質に基づき再度ランキングし、回答の精度を向上させます。高品質の結果を求めるシチュエーション(例:テクニカルサポート、プロフェッショナル向けのQ&Aなど)においてはこれを使用することが推奨されます。

    • リランク無効: ナレッジの関連性に基づいてソートされた初回のベクトル取得結果をそのまま出力します。

    • リランク有効:リランクモデルは初回の結果を再評価し、文脈上最も適当なドキュメントが優先されるように整理します。

ノードの出力

image.png

出力結果はoutput_listという名称の固定配列で、関連性の高い順(降順)で並べられた取得されたナレッジブロックが含まれます。各項目には以下の情報が含まれます。

  • doc_id:ナレッジブロックが含まれるドキュメントのID。

  • doc_name:元となったドキュメントの名前。

  • chunk_id:ナレッジブロックのID。

  • chunk_content:ナレッジブロックの内容。

  • similarity_score:そのブロックとクエリの間の関連性のスコア。