エンドポイントを作成する

OCI生成AIのホスティング専用AIクラスタで、カスタム・モデルまたは事前トレーニング済モデルのパブリック・エンドポイントまたはプライベート・エンドポイントを作成します。

重要

モデルをプライベート・エンドポイントに追加するには、まずプライベート・エンドポイントを作成してから、次のタスクを実行します。
  • 「エンドポイント」リスト・ページで、「エンドポイントの作成」を選択します。リスト・ページの検索に関するヘルプが必要な場合は、「エンドポイントのリスト」を参照してください。

    エンドポイント情報

    1. エンドポイントを作成するコンパートメントを選択します。デフォルト・コンパートメントはリスト・ページと同じです。ただし、作業する権限がある任意のコンパートメントを選択できます。
      ヒント

      エンドポイントは、モデルと同じコンパートメントに作成することをお薦めします。
    2. (オプション)エンドポイントの名前を入力します。名前は、文字またはアンダースコアで開始し、その後に文字、数字、ハイフンまたはアンダースコアを続けます。長さは1から255文字です。名前を入力しない場合、後で変更できる名前が生成されます。
      生成された名前の形式はgenerativeaiendpoint<timestamp>です。例: generativeaiendpoint20250531235319
    3. (オプション)モデルの説明を入力します。

    ホスティング構成

    1. エンドポイントを追加するモデルをホストするコンパートメントを選択します。
    2. エンドポイントを追加するモデルを選択します。このモデルには、カスタム・モデルまたは作業中のリージョンで使用可能なすぐに使用できる事前トレーニング済基礎モデルがあります。
    3. 選択したモデルに複数のバージョンがある場合は、モデル・バージョンを選択します。
      すぐに使用できる事前トレーニング済基礎モデルの場合、このフィールドはモデルを選択したときに移入されます。
    4. 次のいずれかのアクションを実行して、ホスティング専用AIクラスタを選択します:
      • リストから専用AIクラスタを選択します。数分前にクラスタを作成した場合は、そのクラスタがアクティブになるまで待ちます。このクラスタに関連付けられているベース・モデルが、エンドポイントを追加するモデルのベース・モデルと一致していることを確認します。
      • 「新しい専用AIクラスタの作成」を選択し、次のステップを実行します:
        1. (オプション)名前と説明を入力します。
        2. ホストするモデルのベース・モデルと一致するベース・モデルを選択します。
        3. 1つのモデル・レプリカをエンドポイントに追加します。クラスタを作成する場合、エンドポイントに少なくとも1つのユニットが必要です。既存のクラスタでは、その同じユニットを使用して新しいエンドポイントをホストできます。各インスタンスは、すべてのアクティブなエンドポイントをホストします。クラスタのインスタンス数を増やすと、クラスタでホストされているすべてのアクティブ・エンドポイントでサポートされているRPMの数が増加します。
        4. ホスティング専用AIクラスタのコミットメント・ユニット時間を読み、コミットメントに同意するチェック・ボックスを選択します。
        5. (オプション)「タグの追加」を選択し、この専用AIクラスタにタグを割り当てます。リソース・タグを参照してください。
        6. 「作成」を選択し、クラスタがアクティブになるまで待機します。
        7. 「専用AIクラスタ」リストから、作成した専用AIクラスタを選択してください。

    ネットワーキング・リソース

    次のいずれかのオプションを選択します。
    • パブリック・エンドポイント
    • プライベート・エンドポイント: このオプションを選択した場合は、プライベート・エンドポイントのコンパートメント、使用するプライベート・エンドポイントの順に選択します。

    ガードレール

    1. 次のガードレールを有効にするかどうかを選択します。
      • コンテンツ・モデレーション
        • オフ: コンテンツ・モデレーションを適用せず、明示的なコンテンツを出力します。
        • ブロック: コンテンツ・モデレーションの識別および適用に役立ちます。
        • 通知: コンテンツ・モデレーションは適用しませんが、モデレーションが必要なコンテンツがモデルによって検出された場合にユーザーに通知することを目的としています。
      • プロンプト・インジェクション(PI)保護
        • オフ: PI保護を適用せず、無制限入力を許可します。
        • ブロック: プロンプト・インジェクションを識別して保護するのに役立ちます。
        • 通知: PI保護を適用しないでください。ただし、PI保護が必要なコンテンツがモデルで検出された場合にユーザーに通知することを目的としています。
      • 個人識別可能情報(PII)保護
        • オフ: PII保護を適用しないでください。かわりに、データ・エクスポージャ制限なしでコンテンツを出力します。
        • ブロック: 個人データの応答からの削除など、PIIの識別と保護に役立ちます。
        • 通知: PII保護を適用しないでください。ただし、モデルでPII保護が必要なコンテンツが検出された場合にユーザーに通知します。
    2. (オプション)「タグの追加」を選択し、このエンドポイントにタグを割り当てます。リソース・タグを参照してください。
    3. 「作成」を選択します。
      エンドポイントの状態を追跡できるエンドポイントの詳細ページが表示されます。
    4. エンドポイントがアクティブになったら、「プレイグラウンドで表示」を選択して、このエンドポイントからモデルの使用を開始します。
  • エンドポイントを作成するには、endpoint createコマンドと必要なパラメータを使用します:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    CLIコマンドのパラメータおよび値の完全なリストは、CLIコマンド・リファレンスを参照してください。

    ノート

    事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているモデル名を正確に使用できます。このOCIモデル名は、生成AIの事前トレーニング済基本モデルのモデルの詳細ページにも表示されます。
  • CreateEndpoint操作を実行してエンドポイントを作成します。

    ノート

    事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているモデル名を正確に使用できます。このOCIモデル名は、生成AIの事前トレーニング済基本モデルのモデルの詳細ページにも表示されます。