オンデマンド推論に対する支払

OCI生成AIのオンデマンド推論にコミットすると、次のメリットが得られます。

  • 生成AIの使用を開始するための障壁が少ない。
  • 使用可能なすべての生成AI基盤モデルにアクセスします。
  • モデルの実験と評価に最適です。
  • トランザクションのPay as you goです。詳細は、次のノートを参照してください。
ノート

オンデマンド推論では、次の文字長に従って支払います。

  • チャット: プロンプトの長さ(文字数) +レスポンスの長さ(文字数)
  • テキスト埋込み: 入力長(文字)

「価格設定」ページで、1 character1 transactionとして計算されます。

基盤モデルをホストする場合、または専用AIクラスタでそれらを微調整する場合は、トランザクションではなく単位時間で課金されます。この場合、専用AIクラスタのコストを計算する方法を学習するには、専用AIクラスタへの支払を参照してください。

モデルのオンデマンド価格への照合

価格設定ページには、推論にプレイグラウンド、APIまたはCLIを使用する場合の10,000件のオンデマンド・トランザクションの価格が表示されます。

「事前トレーニング済モデル」ページに移動し、操作するモデルを選択します。「オンデマンド・モード」セクションで、モデルの「価格設定ページ情報」を見つけます。次に、この項の例を確認して、入力文字と出力文字の数に基づいてコストを計算する方法を学習します。

チャットの例

Paulは、次のプロンプト(220 characters long)を使用してmeta.llama-3.3-70b-instructモデルをコールします。

サラウンド・サウンドを記録できるUSB接続コンパクト・マイク用の製品ピッチを生成します。マイクは、音楽や会話の録音に最も役立ちます。マイクは、ポッドキャストの記録にも役立ちます。

モデルからのレスポンスは2,205 characters longです。ポールはこの電話の費用を知りたい。ここでは、コストを計算するステップを示します。

  1. プロンプト+レスポンスの長さ(文字)を計算します。

    プロンプトの長さ(220文字)とモデル・レスポンスの長さ(2,205文字)を合計します。

    prompt + response length = 220 + 2,205 = 2,425 characters
  2. トランザクション数を計算します。

    10,000トランザクションの価格がリストされます。

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    2,425 characters = 2,425 transactions
  3. AIの価格設定に移動し、「OCI生成AI」「Oracle Cloud Infrastructure Generative AI - Large Meta」<Large-Meta-unit-price>を見つけます。
    Paulは、生成AIのAI価格設定ページの生成AI OCI - 大型メタ製品と一致するmeta.llama-3.3-70b-instructモデルを使用します。
  4. 1,838文字の価格を計算します。
    price = (2,425 transactions )/ (10,000 transactions) x $<Large-Meta-unit-price>
ヒント

価格の計算に加えて、AIおよび機械学習カテゴリを選択し、OCI生成AIのコスト見積りをロードすることで、コストを推定できます。

テキスト埋込みの例

Ginaは、顧客契約を新しいセマンティック検索アプリケーションの埋込みに変換しています。平均して、Ginaは毎時16の文書を取り込みます。各ドキュメントの長さは約1,000 charactersです。Ginaは、これらの埋込みを生成するための月次請求の見積を取得したいと考えています。ここでは、コストを計算するステップを示します。

  1. 入力長(文字数)を計算します。

    各時間の入力文字の長さを合計します。

    input character length for 16 documents = 16 x 1,000 = 16,000 characters per hour
  2. AIの価格設定に移動し、「OCI生成AI」「Oracle Cloud Infrastructure Generative AI - Embed Cohere」で、<Embed-Cohere-unit-price>を見つけます。
    Ginaは、生成AIの「AI価格設定」ページの「Oracle Cloud Infrastructure Generative AI - Embed Cohere」製品と一致するcohere.embed-v4.0モデルを使用しています。
  3. 1時間当たりのトランザクション数を計算します。

    Ginaは1時間あたり16,000文字を取り込みます。10,000トランザクションの価格がリストされます。

    10,000 transactions = 10,000 characters, so 1 transaction = 1 character
    16,000 characters = 16,000 transactions
  4. Ginaが毎時取り込む16,000文字の時給を見つけます。
    hourly price = 
    (16,000 transactions ) / (10,000 transactions) x $<Embed-Cohere-unit-price>
  5. 年間最長月の月額料金を検索
    One month = 31 x 24 hours = 744 hours
    monthly price = 744 hours x hourly price