Cohere Embed English Light 3
O modelo cohere.embed-english-light-v3.0
transforma cada frase, sentença ou parágrafo que você insere em uma matriz.
Você pode usar os modelos de incorporação para encontrar similaridade em frases semelhantes em contexto ou categoria. As incorporações são normalmente armazenadas em um banco de dados vetorial. As incorporações são usadas principalmente para pesquisas semânticas em que a função de pesquisa se concentra no significado do texto que está pesquisando, em vez de encontrar resultados com base em palavras-chave.
Disponível nesta região
- Centro-Oeste dos EUA (Chicago)
Principais Recursos
- Use os modelos Cohere Embed English para gerar incorporações de texto a partir de documentos em inglês.
- Os modelos leves são menores e mais rápidos que os modelos originais.
- O modelo cria um vetor 384-dimensional para cada incorporação.
- No máximo 96 frases por execução.
- Máximo de 512 tokens para cada entrada.
Cluster de IA Dedicado para o Modelo
Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.
Modelo Base | Cluster de Ajuste | Cluster de Hosts | Informações da Página de Preços | Aumento do Limite do Cluster de Solicitações |
---|---|---|---|---|
|
Não disponível para ajuste fino |
|
|
|
-
O modelo Cohere Embed English Light 3 tem opções de cluster de IA dedicadas e sob demanda. Para a opção sob demanda, você não precisa de clusters e pode acessar o modelo no playground da Console ou por meio da API.
-
Se você não tiver limites de cluster suficientes em sua tenancy para hospedar um modelo Incorporado em um cluster de IA dedicado, solicite o limite
dedicated-unit-embed-cohere-count
para aumentar em 1.
Datas de Liberação e Baixa
Modelo | Data de Liberação | Data de Aposentadoria Sob Demanda | Data de Baixa do Modo Dedicado |
---|---|---|---|
cohere.embed-english-light-v3.0
|
2,024-2-7 | 2,026-1-22 | cohere.embed-v4.0
|
Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.
Incorporando Parâmetro de Modelo
Ao usar os modelos de incorporação, você pode obter uma saída diferente alterando o parâmetro a seguir.
- Truncar
-
Se os tokens de início ou de fim em uma sentença serão truncados, quando essa sentença exceder o número máximo de tokens permitidos. Por exemplo, uma sentença tem 516 tokens, mas o tamanho máximo do token é 512. Se você optar por truncar o final, os últimos 4 tokens dessa instrução serão cortados.