Oracle Linuxプラットフォーム・イメージに含まれないGPUドライバ

Compute Cloud@Customerで提供されるOracle Linux 8またはOracle Linux 9プラットフォーム・イメージには、GPUドライバは含まれません。GPUインスタンスを作成する場合は、GPUドライバを手動でインストールする必要があります。

詳細

Compute Cloud@CustomerインストールにGPUを含むコンピュート・ノードが含まれている場合は、専用シェイプを選択してアクセスできます。GPUシェイプは、Oracle Linux 8またはOracle Linux 9プラットフォーム・イメージに基づいてコンピュート・インスタンス用に選択できます。現在のイメージ・バージョンにはGPUドライバは含まれていません。インスタンスOSは割り当てられたGPUを検出しますが、それを使用するには、必要なドライバをインストールするためにNVIDIA開発者サイトのCUDA Toolkitが必要です。

ノート

大規模なダウンロードおよびローカル・リポジトリのインストールには、大量のディスク領域が必要です。デフォルトの50GBブート・ボリュームは、Oracle Linux 9では不十分で、Oracle Linux 8では十分な大きさしかありません。ブート・ボリューム・サイズを60GB以上に増やし、それに応じてファイル・システムを拡張することをお薦めします。

回避方法

インスタンスの作成後、インスタンスにログインし、CUDA Toolkitをインストールします。使用しているバージョンのOracle Linuxの手順に従います。

Oracle Linux 9インスタンスへのGPUドライバのインストール
  1. インスタンスのコマンドラインから、OS用のCUDA Toolkit rpmをダウンロードしてインストールします。

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel9-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Oracle Linux 9 EPEL yumリポジトリを有効にします。dkmsパッケージをインストールします。

    $ sudo yum-config-manager --enable ol9_developer_EPEL
    $ sudo dnf install dkms
  3. GPUドライバをインストールします。

    $ sudo dnf install cuda-12-8
  4. NVIDIAシステム管理インタフェースを使用してインストールを確認します。

    $ nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+
Oracle Linux 8インスタンスへのGPUドライバのインストール
  1. インスタンスのコマンドラインから、OS用のCUDA Toolkit rpmをダウンロードしてインストールします。

    $ wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo rpm -i cuda-repo-rhel8-12-8-local-12.8.0_570.86.10-1.x86_64.rpm
    $ sudo dnf clean all
    $ sudo dnf install cuda-toolkit-12-8
  2. Oracle Linux 8 EPEL yumリポジトリを有効にします。dkmsパッケージをインストールします。

    $ sudo yum-config-manager --enable ol8_developer_EPEL
    $ sudo dnf install dkms
  3. GPUドライバをインストールします。

    $ sudo dnf install cuda-12-8
  4. NVIDIAカーネルモジュールをインストールします。

    $ sudo scl enable gcc-toolset-13 bash
    # dkms install nvidia-open -v 570.86.10

    カーネル・モジュールのビルド中にこのmakeエラーが発生した場合は、無視しても問題ありません。

    Cleaning build area...(bad exit status: 2)
    Failed command:
    make -C /lib/modules/5.15.0-206.153.7.el8uek.x86_64/build M=/var/lib/dkms/nvidia-open/570.86.10/build clean
  5. NVIDIAシステム管理インタフェースを使用してインストールを確認します。

    # nvidia-smi
    +-----------------------------------------------------------------------------------------+
    | NVIDIA-SMI 570.86.10              Driver Version: 570.86.10      CUDA Version: 12.8     |
    |-----------------------------------------+------------------------+----------------------+
    | GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
    |                                         |                        |               MIG M. |
    |=========================================+========================+======================|
    |   0  NVIDIA L40S                    Off |   00000000:00:05.0 Off |                    0 |
    | N/A   26C    P8             23W /  350W |       1MiB /  46068MiB |      0%      Default |
    |                                         |                        |                  N/A |
    +-----------------------------------------+------------------------+----------------------+
    
    +-----------------------------------------------------------------------------------------+
    | Processes:                                                                              |
    |  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
    |        ID   ID                                                               Usage      |
    |=========================================================================================|
    |  No running processes found                                                             |
    +-----------------------------------------------------------------------------------------+