エンドポイントを作成する

OCI生成AIのホスティング専用AIクラスタで、カスタム、事前トレーニング済またはインポート済モデルのエンドポイントを作成します。

重要

モデルをプライベート・エンドポイントに追加するには、まずプライベート・エンドポイントを作成してから、モデルをアタッチするステップについてこのページに戻ります。

プライベート・エンドポイントは、事前トレーニング済およびカスタム・モデルのみをサポートします。インポートされたモデルはサポートされていません。

「エンドポイント」リスト・ページで、「エンドポイントの作成」を選択します。リスト・ページの検索に関するヘルプが必要な場合は、「エンドポイントのリスト」を参照してください。
エンドポイント情報
エンドポイントを作成するコンパートメントを選択します。デフォルト・コンパートメントはリスト・ページと同じです。ただし、作業する権限がある任意のコンパートメントを選択できます。

ヒント

エンドポイントは、モデルと同じコンパートメントに作成することをお薦めします。

(オプション)エンドポイントの名前を入力します。名前は、文字またはアンダースコアで開始し、その後に文字、数字、ハイフンまたはアンダースコアを続けます。長さは1から255文字です。名前を入力しない場合、後で変更できる名前が生成されます。
生成された名前の形式はgenerativeaiendpoint<timestamp>です。例: generativeaiendpoint20250531235319

(オプション)モデルの説明を入力します。
ホスティング構成
エンドポイントを追加するモデルをホストするコンパートメントを選択します。
エンドポイントを追加するモデルを選択します。このモデルには、カスタム・モデル、インポート済モデル、または作業中のリージョンで使用可能なすぐに使用できる事前トレーニング済基礎モデルがあります。
選択したモデルに複数のバージョンがある場合は、モデル・バージョンを選択します。
すぐに使用できる事前トレーニング済基礎モデルの場合、このフィールドはモデルを選択したときに移入されます。

次のいずれかのアクションを実行して、ホスティング専用AIクラスタを選択します:

リストから専用AIクラスタを選択します。数分前にクラスタを作成した場合は、そのクラスタがアクティブになるまで待ちます。

「新しい専用AIクラスタの作成」を選択し、次のステップを実行します:

(オプション)名前と説明を入力します。

「ベース・モデル」で、次のいずれかを選択します:

ホスティングしている事前トレーニング済の基本モデル。

基礎モデルからファインチューニングされたカスタム・モデルを使用する場合は、トレーニングされた元の基盤(ベース)モデルを選択します。

インポートされたモデルを使用する場合は、そのインポートされたモデルを選択します。

インポートされたモデルを選択した場合は、このガイドに基づいて推奨される単位サイズを選択します。

モデル・レプリカの場合、エンドポイントに少なくとも1つのユニットが必要です。

ホスティング専用AIクラスタのコミットメント・ユニット時間を読み、コミットメントに同意するチェック・ボックスを選択します。

(オプション)「タグの追加」を選択し、この専用AIクラスタにタグを割り当てます。リソース・タグを参照してください。

「作成」を選択し、クラスタがアクティブになるまで待機します。

「専用AIクラスタ」リストから、作成した専用AIクラスタを選択してください。
ネットワーキング・リソース(事前トレーニング済およびカスタム・モデル用)
次のいずれかのオプションを選択します。

パブリック・エンドポイント

プライベート・エンドポイント: このオプションを選択した場合は、プライベート・エンドポイントのコンパートメント、使用するプライベート・エンドポイントの順に選択します。(インポートされたモデルには使用できません。)

デフォルトでは、インポートされたモデルにはパブリック・エンドポイントがあります。
ガードレール(事前トレーニング済およびカスタム・モデル用)
ノート

ガードレールは、インポートされたモデルには使用できません。
次のガードレールを有効にするかどうかを選択します。

コンテンツ・モデレーション

オフ: コンテンツ・モデレーションを適用せず、明示的なコンテンツを出力します。

ブロック: コンテンツ・モデレーションの識別および適用に役立ちます。

通知: コンテンツ・モデレーションは適用しませんが、モデレーションが必要なコンテンツがモデルによって検出された場合にユーザーに通知することを目的としています。

プロンプト・インジェクション(PI)保護

オフ: PI保護を適用せず、無制限入力を許可します。

ブロック: プロンプト・インジェクションを識別して保護するのに役立ちます。

通知: PI保護を適用しないでください。ただし、PI保護が必要なコンテンツがモデルで検出された場合にユーザーに通知することを目的としています。

個人識別可能情報(PII)保護

オフ: PII保護を適用しないでください。かわりに、データ・エクスポージャ制限なしでコンテンツを出力します。

ブロック: 個人データの応答からの削除など、PIIの識別と保護に役立ちます。

通知: PII保護を適用しないでください。ただし、モデルでPII保護が必要なコンテンツが検出された場合にユーザーに通知します。

(オプション)「タグの追加」を選択し、このエンドポイントにタグを割り当てます。リソース・タグを参照してください。
「作成」を選択します。
エンドポイントの状態を追跡できるエンドポイントの詳細ページが表示されます。

エンドポイントがアクティブになったら、「プレイグラウンドで表示」を選択して、このエンドポイントからモデルの使用を開始します。
エンドポイントを作成するには、endpoint createコマンドと必要なパラメータを使用します:
```
oci generative-ai endpoint create 
--model-id <model-OCID>
--compartment-id <compartment-OCID> 
--dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
[OPTIONS]
```
CLIコマンドのパラメータおよび値の完全なリストは、CLIコマンド・リファレンスを参照してください。

ノート

事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているモデル名を正確に使用できます。このOCIモデル名は、生成AIの事前トレーニング済基本モデルのモデルの詳細ページにも表示されます。
CreateEndpoint操作を実行してエンドポイントを作成します。

ノート

事前トレーニング済モデルの場合、OCIDのかわりに、コンソールのプレイグラウンドにリストされているモデル名を正確に使用できます。このOCIモデル名は、生成AIの事前トレーニング済基本モデルのモデルの詳細ページにも表示されます。

Oracle Cloud Infrastructureドキュメント

エンドポイントを作成する

エンドポイント情報

ホスティング構成

ネットワーキング・リソース(事前トレーニング済およびカスタム・モデル用)

ガードレール(事前トレーニング済およびカスタム・モデル用)