logo
Development
検索
データの追加

データの追加

データテーブルが作成された後、そこにデータを追加することができます。追加するデータは構造化データまたは非構造化データにすることができます。企業のデータのタイプに応じて、追加する方法を選べます。
image-20241011144756364

非構造化データ

GPTBotsは、LLMを通じて非構造化データファイル(PDF、Word、Excel、テキストファイルなど)からのエンティティ(要素)の抽出をサポートし、データベースに構造化データをインポートして高速なデータ入力と管理を実現します。データを追加する具体的な手順は以下のとおりです:

  1. "データ追加"ボタンをクリックし、非構造化のドキュメントデータを選択し、データ追加のページに移動します。

    image-20241114201140426

  2. "ローカルドキュメント"または"Google Drive"を選択して、インポートする非構造化データファイルを選びます。対応するファイルタイプはPDF、Word、Excel、テキストファイルなどです。各ファイルは10Kトークンまでとなり、それを超える部分は削除されます。
    image-20241114201214636

  3. "次へ"をクリックして、ドキュメントエンティティ(要素)抽出ページに進みます。"認識サービス"、"データ抽出方法"、"抽出フィールド名"などの情報が表示されます。
    image-20241114201244139

    • 認識サービス: アップロードされたナレッジドキュメントがPDF形式の場合、"通常の認識"または"高度な認識"のいずれかをPDFファイル解析に使用することができます。通常の認識サービスは早く解析を行い、追加のコストは発生しません。一方、高度な認識サービスは解析の品質が高い反面、速度が遅く、追加のコストがかかります。
    • データ抽出方法: GPTBotsでは2つのデータ抽出方法をサポートしています。"ドキュメントごとに1つのデータのみを抽出する"は、各ドキュメントからデータテーブルの1つのフィールド値を抽出することを意味し、"ドキュメントごとに複数のデータを抽出する"は、各ドキュメントからデータテーブルの複数のフィールド値を抽出することを意味します。
    • 抽出フィールド名: データテーブルの全フィールド名が表示されます。これらは抽出の対象となるフィールドです。
  4. "保存"ボタンをクリックして、データ追加作業を完了します。提出したドキュメントはタスクキューに送られ、処理が完了すると、抽出したデータはデータテーブルに追加されます。"現在のタスク"では、タスクの進行状況と使用されたクレジットを確認できます。
    image-20241012104210783

構造化データ

テンプレートのインポート

フィールドをデータテーブルに作成したら、テンプレートをインポートすることでデータベースに構造化データを迅速に追加することができます。また、具体的な手順は以下のとおりです:

  1. データテーブルのページから、構造化テンプレートデータをクリックし、データ追加ページにアクセスします。

    image-20241114201404296

  2. "テンプレートのインポート"を選択し、template.csvファイルをダウンロードします。フォーマットに従ってデータを記入し、その後、CSVテンプレートファイルをアップロードします。
    image-20241114201430741

  3. "次へ"をクリックしてデータインポートページに移動し、「保存」ボタンをクリックしてデータ追加作業を完了します。

  4. テンプレートファイル内のデータ解析とインポートタスクが完了した後、データテーブルのページで追加されたデータを表示できます。

APIを使用した追加

フィールドをデータテーブルに作成したら、APIを通じてデータベースに構造化データを追加することができます。
Add Table Data API