微調整
ファインチューニングとは、事前トレーニング済モデルを取得し、ドメイン固有のデータセットでさらにトレーニングして、その知識を向上させ、そのドメインでより適切なレスポンスを提供するプロセスです。
AIクイック・アクションでモデルを微調整すると、それを行うためのデータ・サイエンス・ジョブが作成されます。AIクイック・アクションで基盤モデルを微調整するためのファインチューニング・ジョブを作成するために、データ・サイエンス・ジョブを使用するために必要なポリシーが必要です。ファインチューニング・ジョブを作成するときに、データセットを選択してベース・モデルをトレーニングできます。モデル・エクスプローラでタグReady to Fine Tune
を持つ基本モデルをファインチューニングできます。オブジェクト・ストレージからデータセットを選択するか、作業中のノートブックのストレージからデータセットをアップロードできます。ノートブックからデータセットをアップロードすると、ファインチューニング・モデルが保存されるオブジェクト・ストレージ・バケットに保存されます。したがって、ノートブック・セッションでファイルをオブジェクト・ストレージに書き込むようにするポリシーが必要です。データセットはJSONL形式である必要があり、必要な'prompt'および'completion'列を含める必要があります。オプションで、カテゴリ列を含めることができます。同じ名前のデータセット・ファイルがバケットにすでに存在する場合、そのファイルは新しいファイルに置き換えられます。ファインチューニングするには、データセットに少なくとも100レコードが含まれている必要があります。
データセットの割合をモデル検証用に設定するオプションがあります。モデル・バージョン・セットは、相互に関連するモデルのセットをグループ化する方法です。既存のモデル・バージョン・セットを選択して、ファインチューニング・モデルを配置したり、新しいモデルを作成できます。バージョニングを有効にする必要があるオブジェクト・ストレージ・バケットにファインチューニング・モデルを保存できます。
モデル情報、データセット、モデル・バージョン・セット、およびファインチューニング・モデルの保存場所を入力した後、ファインチューニング・ジョブのコンピュート・インフラストラクチャおよびネットワーキングを選択できます。オプションで、ファインチューニング・ジョブを監視するようにロギングを設定できます。ジョブのエラーをトラブルシューティングするために、ロギングをお薦めします。ロギングを設定するには、必要なポリシーが必要です。複数のGPUカードを使用したシングルノード・トレーニングおよびトレーニングがサポートされています。モデル、エポックおよび学習レートをファインチューニングするためのパラメータを指定できます。
ジョブの作成前に、ファインチューニング・ジョブに設定した構成およびパラメータを確認できます。
AIクイック処理CLIコマンドのパラメータおよび値の完全なリストは、AIクイック処理CLIを参照してください。
このタスクはAPIを使用して実行できません。