自動スケーリングを使用したモデル・デプロイメントの作成
コンピュートおよびロード・バランサの自動スケーリングが構成されたモデル・デプロイメントを作成する方法について学習します。
モデル・デプロイメントでより高度なオプションとメトリックを使用して自動スケーリングを設定するために、カスタム・スケーリング・メトリック・タイプを使用することを検討してください。
自動スケーリングが機能するために必要なポリシーが追加されていることを確認します。
モデル・デプロイメントは、コンソール、OCI CLIまたはデータ・サイエンスAPIを使用して作成および実行できます。
モデル・デプロイメントを作成するには、oci data-science model-deployment createコマンドと必要なパラメータを使用します:
oci data-science model-deployment create --required-param-name variable-name ... [OPTIONS]たとえば、次を使用してデプロイメントを作成します。次の例で、このモデル・デプロイメントのJSON構成ファイルを使用します:oci data-science model-deployment create \ --compartment-id <MODEL_DEPLOYMENT_COMPARTMENT_OCID> \ --model-deployment-configuration-details file://<MODEL_DEPLOYMENT_CONFIGURATION_FILE> \ --project-id <PROJECT_OCID> \ --display-name <MODEL_DEPLOYMENT_NAME>{ "deploymentType": "SINGLE_MODEL", "modelConfigurationDetails": { "modelId": "ocid1.datasciencemodel....", "instanceConfiguration": { "instanceShapeName": "VM.Standard.E4.Flex", "modelDeploymentInstanceShapeConfigDetails": { "ocpus": 1, "memoryInGBs": 16 } }, "scalingPolicy": { "policyType": "AUTOSCALING", "coolDownInSeconds": 600, "isEnabled": true, "autoScalingPolicies": [ { "autoScalingPolicyType": "THRESHOLD", "initialInstanceCount": 1, "maximumInstanceCount": 2, "minimumInstanceCount": 1, "rules": [ { "metricExpressionRuleType": "PREDEFINED_EXPRESSION", "metricType": "CPU_UTILIZATION", "scaleInConfiguration": { "scalingConfigurationType": "THRESHOLD", "threshold": "10" }, "scaleOutConfiguration": { "scalingConfigurationType": "THRESHOLD", "threshold": "65" } } ] } ] }, "bandwidthMbps": 10, "maximumBandwidthMbps": 20 } }CLIコマンドのパラメータおよび値の完全なリストは、CLIコマンド・リファレンスを参照してください。
CreateModelDeployment操作を使用して、モデル・デプロイメントを作成します。