プライベート・エンドポイントへのモデルの追加

カスタム・モデルまたは事前トレーニング済モデルを持つエンドポイントをOCI生成AIのプライベート・エンドポイントにアタッチする方法について学習します。

1つ以上のエンドポイントをプライベート・エンドポイントにアタッチできます。

  • エンドポイントの作成

    1. 「プライベート・エンドポイント」リスト・ページで、操作するプライベート・エンドポイントを選択します。プライベート・エンドポイントのリスト・ページの検索に関するヘルプが必要な場合は、プライベート・エンドポイントのリストを参照してください。
    2. 「エンドポイント」を選択し、「エンドポイントの作成」を選択します。

    エンドポイント情報

    1. エンドポイントを作成するコンパートメントを選択します。デフォルト・コンパートメントはリスト・ページと同じです。ただし、作業する権限がある任意のコンパートメントを選択できます。
      ヒント

      エンドポイントは、モデルと同じコンパートメントに作成することをお薦めします。
    2. (オプション)エンドポイントの名前を入力します。名前は文字またはアンダースコアで開始し、その後に文字、数字、ハイフンまたはアンダースコアが続きます。長さは1文字から255文字です。名前を入力しないと、後で変更できる名前が生成されます。
      生成された名前の形式はgenerativeaiendpoint<timestamp>です。例: generativeaiendpoint20250531235319
    3. (オプション)モデルの説明を入力します。

    ホスティング構成

    1. エンドポイントを追加するモデルをホストするコンパートメントを選択します。
    2. エンドポイントを追加するモデルを選択します。このモデルには、カスタム・モデルまたは作業中のリージョンで使用可能なすぐに使用できる事前トレーニング済基礎モデルがあります。
    3. 選択したモデルに複数のバージョンがある場合は、モデル・バージョンを選択します。
      すぐに使用できる事前トレーニング済基礎モデルの場合、このフィールドはモデルを選択したときに移入されます。
    4. 次のいずれかのアクションを実行して、ホスティング専用AIクラスタを選択します:
      • リストから専用AIクラスタを選択します。数分前にクラスタを作成した場合は、そのクラスタがアクティブになるまで待ちます。このクラスタに関連付けられているベース・モデルが、エンドポイントを追加するモデルのベース・モデルと一致していることを確認します。
      • 「新しい専用AIクラスタの作成」を選択し、次のステップを実行します:
        1. (オプション)名前と説明を入力します。
        2. ホストするモデルのベース・モデルと一致するベース・モデルを選択します。
        3. 1つのモデル・レプリカをエンドポイントに追加します。クラスタを作成する場合、エンドポイントに少なくとも1つのユニットが必要です。既存のクラスタでは、同じユニットを使用して新しいエンドポイントをホストできます。各インスタンスは、すべてのアクティブなエンドポイントをホストします。クラスタのインスタンス数を増やすと、クラスタでホストされているすべてのアクティブなエンドポイントでサポートされるRPMの数が増えます。
        4. コミットメントに同意するには、ホスティング専用AIクラスタのコミットメント単位時間を確認し、チェック・ボックスを選択します。
        5. (オプション)「タグの追加」を選択し、この専用AIクラスタにタグを割り当てます。リソース・タグを参照してください。
        6. 「作成」を選択し、クラスタがアクティブになるまで待機します。
        7. 「専用AIクラスタ」リストから、作成した専用AIクラスタを選択してください。

    ネットワーキング・リソース

    プライベート・エンドポイントが事前選択されています。

    ガードレール

    1. 次のガードレールを有効にするかどうかを選択します。
      • コンテンツ・モデレーション
        • オフ: コンテンツ・モデレーションを適用せず、明示的なコンテンツを出力します。
        • ブロック: コンテンツ・モデレーションの識別および適用に役立ちます。
        • 通知: コンテンツ・モデレーションは適用しないでください。ただし、モデレーションが必要なコンテンツがモデルによって検出された場合にユーザーに通知することを目的としています。
      • プロンプト・インジェクション(PI)保護
        • オフ: PI保護を適用せず、無制限入力を許可します。
        • ブロック: プロンプト・インジェクションの識別と保護に役立ちます。
        • 通知: PI保護を適用しないでください。ただし、モデルがPI保護が必要なコンテンツを検出した場合にユーザーに通知することを目指しています。
      • 個人識別可能情報(PII)保護
        • オフ: PII保護を適用せず、データ露出制限なしでコンテンツを出力します。
        • ブロック: 回答から個人データを削除するなど、PIIを特定して保護するのに役立ちます。
        • 通知: PII保護を適用しないでください。ただし、モデルがPII保護が必要なコンテンツを検出した場合にユーザーに通知することを目指しています。
    2. (オプション)「タグの追加」を選択し、このエンドポイントにタグを割り当てます。リソース・タグを参照してください。
    3. 「作成」を選択します。
      エンドポイントの状態を追跡できるエンドポイントの詳細ページが表示されます。
  • エンドポイントを作成するには、endpoint createコマンドと必要なパラメータを使用します:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    CLIコマンドのパラメータおよび値の完全なリストは、CLIコマンド・リファレンスを参照してください。

    ノート

    事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているモデル名を正確に使用できます。このOCIモデル名は、生成AIの事前トレーニング済基本モデルのモデルの詳細ページにも表示されます。
  • CreateEndpoint操作を実行してエンドポイントを作成します。

    ノート

    事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているモデル名を正確に使用できます。このOCIモデル名は、生成AIの事前トレーニング済基本モデルのモデルの詳細ページにも表示されます。