Visión general

Para satisfacer las diversas necesidades de los clientes en distintos escenarios de negocio, GPTBots ofrece una variedad de LLM y modelos especializados para adaptarse a distintos contextos de negocio. Estos modelos cuentan con capacidades (análisis y generación de texto, imágenes, audio y archivos) y características diferenciadas, y el precio del servicio varía en función de las capacidades de cada modelo.
Los tipos de servicios de modelos proporcionados por GPTBots son los siguientes:

LLM: Admite múltiples versiones de modelos LLM de diversos proveedores, como OpenAI, Claude, Gemini, ChatGLM, Llama y otros modelos comerciales/de código abierto de uso común.
Modelos de embeddings (embeddings): Admite múltiples modelos de embeddings, como OpenAI, BGE, BCE y otros modelos comerciales/de código abierto de uso común. No obstante, en la versión SaaS solo se admite un modelo de embeddings para ofrecer un mejor servicio, aunque pueden coexistir múltiples dimensiones vectoriales.
Modelos de reordenación (rerank): Admite múltiples modelos de reordenación, como Jina, BGE, BCE y otros modelos comerciales/de código abierto de uso común.
Modelos de audio: Admite múltiples modelos de audio, como OpenAI, Minimax y otros modelos comerciales/de código abierto de uso común.

Definición de términos

Para facilitar a los usuarios de negocio la gestión y el uso de los servicios de modelos, GPTBots abstrae los servicios desde la perspectiva de marca del modelo y versión del modelo y define los siguientes conceptos:
Model Vendor: El nombre de la empresa que desarrolla el modelo de gran tamaño, como OpenAI, Anthropic, MistralAI, Ali, ZhiPu, Tencent, etc.
Model Name: El nombre de marca del modelo de gran tamaño, como GPT, Claude, Gemini, ChatGLM, Llama, etc.
Model Version: Las versiones del modelo de gran tamaño con distintos perfiles de capacidad, como GPT-4o, GPT-o1-mini, Gemini-1.5-pro, etc.
Deployment Method: Los servicios de API del modelo proporcionados por el proveedor original son despliegues oficiales, mientras que los proporcionados por proveedores de plataformas de computación de terceros son despliegues abiertos.
API Protocol: La especificación de protocolo de la plataforma de servicios de computación que ejecuta el modelo de gran tamaño, como OpenAI (GPT), Amazon Bedrock (Claude), together.ai (Llama) y el estándar de protocolo de OpenAI, relativamente universal.
API KEY: Se refiere a la configuración de autenticación al invocar la API del servicio de modelos. Los proveedores de servicios de modelos suelen imponer límites de frecuencia y facturación independiente para diferentes API KEY.

Configuración del servicio de modelos

GPTBots ofrece dos formas de configurar los servicios de modelos: usar la Platform KEY para configurar los servicios de modelos y usar la Self-Owned KEY para configurar los servicios de modelos. Las empresas pueden elegir el método que mejor se adapte a sus necesidades.
Al configurar los servicios de modelos, GPTBots admite la configuración simultánea de múltiples protocolos de API de modelos y múltiples API KEY para una «marca del modelo/versión del modelo» especificada. Al invocar servicios de modelos, GPTBots rota automáticamente entre diferentes API KEY para lograr alta disponibilidad y alta concurrencia de los servicios de modelos.
models-configuration

Uso de Platform KEY para invocar servicios de modelos

Las empresas no necesitan registrar cuentas ni adquirir servicios de distintos proveedores de servicios de modelos. Pueden utilizar directamente la Platform KEY de GPTBots para invocar servicios de modelos. Las empresas pueden consultar datos detallados de tokens de las invocaciones de servicios de modelos en «GPTBots Platform - Organization - Usage» y consumir los créditos correspondientes en GPTBots. Para consultar precios detallados, puede consultarse Precios del servicio.

Uso de Self-Owned KEY para invocar servicios de modelos

Las empresas pueden alojar sus Self-Owned KEYs registrados y activados de distintos proveedores de servicios de modelos en la plataforma GPTBots, pagando las tarifas correspondientes directamente a los proveedores de servicios de modelos. Las empresas pueden consultar los datos de tokens consumidos por las invocaciones de servicios de modelos en «GPTBots Platform - Organization - Usage» y consumir una pequeña cantidad de créditos de uso del servicio de canal en GPTBots. Para consultar precios detallados, puede consultarse Precios del servicio.

Lista de servicios de modelos

GPTBots añadirá continuamente servicios de modelos adecuados para escenarios de negocio. Si el servicio de modelos requerido por la empresa no está en la lista, póngase en contacto con nosotros; se evaluará y probará el modelo para ofrecer compatibilidad. A continuación se enumeran los servicios de modelos actualmente admitidos y sus capacidades:

LLM

Modelos de la serie GPT de OpenAI: GPT es una serie de modelos de lenguaje de gran escala desarrollada por OpenAI, que incluye GPT-3.5, GPT-4o, GPT-o1, entre otros.

Proveedor/Marca del modelo	Versión del modelo	Límite de contexto	Límite de generación	Complemento (plugin)	Entrada de imagen	Entrada de audio	Entrada de archivo	Salida de texto	Salida de audio
OpenAI/GPT	GPT-4o	128k	8k	✓	✓	✗	✗	✓	✗
OpenAI/GPT	GPT-4o-audio	128k	8k	✓	✓	✓	✗	✓	✓
OpenAI/GPT	GPT-4o-mini	128k	8k	✓	✓	✗	✗	✓	✗
OpenAI/GPT	GPT-o1	128k	8k	✗	✓	✗	✗	✓	✗
OpenAI/GPT	GPT-o1-mini	128k	8k	✗	✓	✗	✗	✓	✗
OpenAI/GPT	GPT-3.5-turbo	16k	4k	✓	✗	✗	✗	✓	✗

Modelos de la serie Claude de Anthropic: Claude es una serie de modelos de lenguaje de gran escala desarrollada por Anthropic, que incluye versiones como Opus, Sonnet y Haiku.

Proveedor/Marca del modelo	Versión del modelo	Límite de contexto	Límite de generación	Complemento (plugin)	Entrada de imagen	Entrada de audio	Entrada de archivo	Salida de texto	Salida de audio
Anthropic/Claude	Claude-3-opus	200k	4k	✓	✓	✗	✗	✓	✗
Anthropic/Claude	Claude-3.5-sonnet	200k	8k	✓	✓	✗	✓	✓	✗
Anthropic/Claude	Claude-3.5-haiku	200k	8k	✓	✓	✗	✗	✓	✗

Modelos de la serie Gemini de Google: Gemini es una serie de modelos de lenguaje de gran escala desarrollada por Google, que incluye versiones como Pro y Flash.

Proveedor/Marca del modelo	Versión del modelo	Límite de contexto	Límite de generación	Complemento (plugin)	Entrada de imagen	Entrada de audio	Entrada de archivo	Salida de texto	Salida de audio
Google/Gemini	Gemini-1.5-pro	1M	8k	✓	✓	✓	✓	✓	✗
Google/Gemini	Gemini-1.5-flash	1M	8k	✓	✓	✓	✓	✓	✗