OKEクラスタ・アドオンの管理
Compute Cloud@Customerでは、クラスタ・アドオンは、Kubernetesクラスタにデプロイすることを選択できるコンポーネントです。クラスタ・アドオンは、Kubernetesのコア機能を拡張し、クラスタの管理性とパフォーマンスを向上させます。この項では、サポートされている次のアドオンのインストールおよび管理方法について説明します。
KubernetesでのWebLogicサーバーおよびFusion Middlewareインフラストラクチャ・ドメインの実行をサポートするWebLogic Kubernetes Operatorアドオン。WebLogic Kubernetes Operatorの詳細は、https://github.com/oracle/weblogic-kubernetes-operatorにあるパブリック・ドキュメントを参照してください。
Kubernetes用データベース・オペレータ・アドオン(OraOperator)は、開発者、データベース管理者、DevOpsおよびGitOpsチームがOracleデータベースのデプロイおよび管理にかかる時間と複雑さを軽減するのに役立ちます。詳細は、公開ドキュメント(https://github.com/oracle/oracle-database-operator/tree/main)を参照してください。
- NVIDIA GPUプラグイン・アドオンは、Kubernetes用のNVIDIAデバイス・プラグインを管理するための便利な方法です。Kubernetes用のNVIDIAデバイス・プラグインは、各ワーカー・ノードにNVIDIA GPUの数を公開し、それらのGPUの健全性を追跡するためのKubernetesデバイス・プラグイン・フレームワークのNVIDIA実装です。Kubernetes用のNVIDIAデバイス・プラグインの詳細は、https://github.com/NVIDIA/k8s-device-pluginを参照してください。
証明書マネージャ・アドオン(cert-managerとも呼ばれる)は、リソース・タイプとして証明書および証明書発行者をKubernetesクラスタに追加します。また、証明書マネージャーは、これらの証明書を取得、使用、および更新するプロセスを簡素化します。詳細は、https://github.com/cert-manager/cert-managerを参照してください。
アドオンの前提条件
アドオンをインストールする前に、次の要件を確認してください。
Oracle Database Operatorアドオン
データベース・オペレータは、既存のクラスタでのみ有効にできます。
データベース・オペレータ・アドオンを使用する前に、証明書マネージャ・アドオンがインストールされ、有効化され、ACTIVE状態である必要があります。既存のクラスタのアドオンのインストールを参照してください。
Nvidia GPUプラグインアドオン
- クラスタとノード・プールの両方に、Kubernetesバージョン1.29.14以上が必要です
- GPUノード・プールを作成する前に、Nvidia GPUプラグインを有効にします。
ノード・プールがGPUまたは非GPUとして作成された後は、そのタイプを切り替えることはできません。
ユース・ケースに必要な適切なベース・イメージを使用します。
ベース・イメージ
ユースケース
nvcr.io/nvidia/cuda:12.9.0-runtime-ubi9
またはランタイム環境と同じ事前構築済みのAIアプリケーションのデプロイ
nvcr.io/nvidia/cuda:12.9.0-devel-ubi9
または開発環境と同等ネイティブのCUDA/C++コードを使用してAIを開発、コンパイルまたはトレーニングします。
すべてのワーカー・ノードには、デフォルトのブロック・ボリューム・サイズ50 GBが付属していますが、必要なベース・イメージとともに使用すると、GPUアプリケーションがディスク領域を使い果たす可能性があります。GPUアプリケーションで永続ボリューム・クレームを使用してください。
意図しないスケジューリングを回避するために、GPUノードはデフォルトで損なわれます。これがないと、GPUが不要な場合でも、ポッドをGPUノードにスケジュールできます。これは、GPUリソースを明示的にリクエストし、テイントを許容するポッドのみがGPUノードでスケジュールされることを意味します。
NVIDIAのデバイス・プラグイン・ポッドがスケジュールされ、NVIDIA GPUハードウェアを持つノードでのみ実行されるようにするために、GPUノードにはデフォルトでラベルが付けられます。OKEコントローラは、次のノード・ラベルが
"nvidia.com/gpu": "true"
のGPUノードにラベルを付けます。
WebLogic Kubernetes Operatorアドオン
WebLogic Kubernetes Operatorアドオンのデプロイを参照してください。