Pagando por Clusters de IA Dedicados
Você obtém os seguintes benefícios para usar clusters de IA dedicados na OCI Generative AI:
- Preços previsíveis que não flutuam com a demanda.
- Ótimo para ajustar ou hospedar modelos.
- Compromisso mínimo de hospedagem: 744 unidades-horas por cluster de hospedagem.
- Compromisso mínimo de ajuste: 1 unidade por hora por tarefa de ajuste. (Dependendo do modelo, o ajuste fino requer pelo menos 2 unidades para ser executado).
Para descobrir quais modelos estão disponíveis para ajuste fino, consulte Correspondendo Modelos Base a Clusters.
Os exemplos a seguir calculam o custo do cluster de IA dedicado na OCI Generative AI. Para calcular o custo de inferência sob demanda, consulte Pagando por Inferência Sob Demanda.
Combinando Modelos com Preços de Unidade de Cluster Dedicado
Se você estiver hospedando modelos básicos ou ajustando-os em clusters de IA dedicados, será cobrado pela hora da unidade em vez da transação. Nesse caso, consulte a tabela a seguir para calcular o custo do cluster de IA dedicado para os modelos de chat.
Alguns modelos básicos pré-treinados da OCI Generative AI suportados para o modo de serviço dedicado agora estão obsoletos e serão descontinuados no máximo 6 meses após o lançamento do 1º modelo de substituição. Você pode hospedar um modelo base ou ajustar um modelo base e hospedar o modelo ajustado em um cluster de IA dedicado (modo de serviço dedicado) até que o modelo base seja retirado. Para datas de desativação do modo de serviço dedicado, consulte Desativando os Modelos.
Modelos de Chat
Modelo Base | Cluster de Ajuste | Host Cluster | Informações da Página de Preço | Solicitar Aumento do Limite do Cluster |
---|---|---|---|---|
|
Não disponível para ajuste fino |
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
|
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
|
|
|
|
|
Não disponível para ajuste fino |
|
|
|
|
|
|
|
|
Você deve solicitar um aumento de limite para usar os seguintes recursos:
Família Meta Llama
-
Para hospedar um modelo Meta Llama 4 Maverick, solicite que
dedicated-unit-llama2-70-count
aumente em 4. -
Para hospedar um modelo Meta Llama 4 Scout, solicite que
dedicated-unit-llama2-70-count
aumente em 2. -
Para hospedar um modelo Meta Llama 3.3 (70B), solicite que
dedicated-unit-llama2-70-count
aumente em 2. -
Para ajustar um modelo Meta Llama 3.3 (70B), solicite que
dedicated-unit-llama2-70-count
aumente em 4. -
Para hospedar um modelo Meta Llama 3.2 11B Vision , solicite
dedicated-unit-llama2-70-count
para aumentar em 1. -
Para hospedar um modelo Meta Llama 3.2 90B Vision , solicite
dedicated-unit-llama2-70-count
para aumentar em 2. -
Para hospedar um modelo Meta Llama 3.1 (70B), solicite que
dedicated-unit-llama2-70-count
aumente em 2. -
Para ajustar um modelo Meta Llama 3.1 (70B), solicite que
dedicated-unit-llama2-70-count
aumente em 4. -
Para hospedar um modelo Meta Llama 3.1 (405B), solicite que
dedicated-unit-llama2-70-count
aumente em 4.
Família do Comando Cohere
-
Para hospedar um modelo Cohere Command A, solicite que
dedicated-unit-large-cohere-count
aumente em 1. -
Para hospedar um modelo Cohere Command R (obsoleto), solicite ao
dedicated-unit-small-cohere-count
que aumente em 1. -
Para ajustar um modelo Cohere Command R (deprecated), você deve solicitar
dedicated-unit-small-cohere-count
aumente em 8. -
Para hospedar um modelo Cohere Command R 08-2024, solicite que
dedicated-unit-small-cohere-count
aumente em 1. -
Para ajustar um modelo Cohere Command R 08-2024, solicite que
dedicated-unit-small-cohere-count
aumente em 8. -
Para hospedar um modelo Cohere Command R+ (obsoleto), você deve solicitar que
dedicated-unit-large-cohere-count
aumente em 2. -
Para hospedar um modelo Cohere Command R+ 08-2024, solicite que
dedicated-unit-large-cohere-count
aumente em 2.
Referências: Limites de Serviço para IA Generativa e Solicitar Aumento do Limite do Cluster
Para geração de texto, resumo e modelos de incorporação de texto, consulte as tabelas em Correspondendo Modelos Base a Clusters.
Hospedagem de um Modelo Básico - Exemplo 1
John deseja hospedar uma instância do modelo Command R+ 08-2024 (cohere.command-r-plus-08-2024
) na infraestrutura dedicada. John exclui o cluster após 40 dias e quer saber o custo do cluster. Para hospedar um modelo cohere.command-r-plus-08-2024
, John primeiro precisa identificar o tamanho da unidade que pode hospedar o modelo cohere.command-r-plus-08-2024
. O tamanho da unidade para o modelo cohere.command-r-plus-08-2024
é uma unidade Large Cohere V2_2. Consulte correspondência de modelos base a clusters.
John precisa de no mínimo uma unidade Large Cohere V2_2 para hospedar o modelo cohere.command-r-plus-08-2024
. Veja a seguir as etapas para calcular o custo de um cluster de hospedagem com uma unidade Large Cohere V2_2.
Hospedagem de um Modelo Básico - Exemplo 2
Alice deseja hospedar uma instância do modelo Command R 08-2024 (cohere.command-r-08-2024
) em uma infraestrutura dedicada. Para hospedar um modelo cohere.command-r-08-2024
, o Alice primeiro precisa identificar o tamanho da unidade que pode hospedar o modelo Command R 08-2024. O tamanho da unidade para Command R 08-2024 é uma unidade Small Cohere V2. Consulte correspondência de modelos base a clusters.
Alice decide comprar três unidades de Small Cohere V2 para lidar com um volume de chamada maior para o modelo do que uma única unidade forneceria. O Alice planeja excluir o cluster após cinco dias. Aqui estão as etapas para calcular o custo de um cluster de hospedagem com três unidades Small Cohere V2 por cinco dias.
Ajustando e Hospedando um Exemplo de Modelo
Bob deseja ajustar um modelo Command R 08-2024 (cohere.command-r-08-2024
). Bob cria um cluster de IA dedicado de ajuste com o valor predefinido de oito unidades Small Cohere V2. Bob cria um modelo personalizado no cluster de IA dedicado de ajuste e ajusta o modelo básico Command R 08-2024 com dados de treinamento. O trabalho de ajuste fino leva 5 horas para ser concluído. Bob cria um cluster de ajuste fino a cada semana.
Para hospedar um modelo cohere.command-r-08-2024
, Bob precisa identificar o tamanho da unidade que pode hospedar o modelo cohere.command-r-08-2024
. O tamanho da unidade para o modelo cohere.command-r-08-2024
é uma unidade Small Cohere V2. Consulte correspondência de modelos base a clusters. Bob pode hospedar até 50 modelos ajustados em um único cluster de hospedagem. Aqui estão as etapas para calcular o custo mensal para ajuste fino e hospedagem dos modelos.
Além de calcular o preço, você pode estimar o custo selecionando a categoria IA e Machine Learning e carregando o estimador de custos para a OCI Generative AI.