Meta Llama 3.2 11B Vision

meta.llama-3.2-11b-vision-instructモデルは、テキストおよびイメージの理解機能を提供し、専用ホスティングに使用できます。Llama 3.2 90B Visionと比較して、Llama 3.2 11B Visionは、よりコンパクトな形式で堅牢なマルチモーダル機能を提供します。

これらのリージョンで使用可能

ブラジル東部(サンパウロ)(専用AIクラスタのみ)
英国南部(ロンドン)(専用AIクラスタのみ)
日本中央部(大阪)(専用AIクラスタのみ)
米国中西部(シカゴ)(専用AIクラスタのみ)

このモデルへのアクセス

コンソール、APIおよびCLIを介してこのモデルにアクセスします:

主な機能

主な特徴

マルチモーダル・サポート:テキストおよびイメージを入力し、テキスト出力を取得します。
モデル・サイズ:モデルには110億個のパラメータがあります。
コンテキスト長: 128,000トークン(最大プロンプト+レスポンス長: 各実行の128,000トークン)
多言語サポート:英語、フランス語、ドイツ語、ヒンディー語、イタリア語、ポルトガル語、スペイン語、タイ語

マルチモーダルサポートによるビジョン機能について

イメージを送信し、イメージに関する質問をして、次のようなテキスト出力を取得します。

高度な画像キャプション
イメージの詳細な説明。
イメージに関する質問への回答。
イメージ内のチャートおよびグラフに関する情報。

詳細

プレイグラウンドで、次のイメージとテキストを追加するには、チャットをクリアして前の会話のコンテキストを失うようにするチャットをクリアする必要があります。
「イメージとテキスト」オプションでサポートされている言語は英語のみです。
テキストのみのオプションでサポートされている多言語オプション。
コンソールで、5MB以下の.pngまたは.jpgイメージを入力します。
APIの場合は、実行ごとにbase64エンコード・イメージを入力します。512 x 512イメージは、約1,610トークンに変換されます。

オンデマンドモード

meta.llama-3.2-11b-vision-instructモデルは、オンデマンド・モードでは使用できません。

モデルの専用AIクラスタ

リストされた任意のリージョンの専用AIクラスタを介してモデルに到達するには、専用AIクラスタにそのモデルのエンドポイントを作成する必要があります。このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。


ベース・モデル	ファインチューニング・クラスタ	ホスティング・クラスタ	価格設定ページ情報	クラスタ制限の引上げをリクエスト
モデル名: Meta Llama 3.2 11B Vision OCIモデル名: `meta.llama-3.2-11b-vision-instruct`	ファインチューニングに使用できません	単位サイズ: Small Generic V2 必須単位: 1	価格設定ページの製品名: Large Meta - Dedicated ホスティングの場合、単価を乗算します: x(0.5)	制限名: `dedicated-unit-llama2-70-count` ホスティングの場合、リクエスト制限の引上げ単位:1

ヒント

専用AIクラスタでMeta Llama 3.2 11B Visionモデルをホストするための十分なクラスタ制限がテナンシにない場合は、dedicated-unit-llama2-70-count制限を1増やすようにリクエストします。

クラスタのエンドポイント・ルール

専用AIクラスタは、最大50個のエンドポイントを保持できます。
これらのエンドポイントを使用して、同じベース・モデルまたは同じバージョンのカスタム・モデルのいずれかを指し示す別名を作成しますが、両方のタイプは作成しません。
同じモデルの複数のエンドポイントにより、異なるユーザーまたは目的に簡単に割り当てることができます。


ホスト・クラスタ・ユニット・サイズ	エンドポイント・ルール
Small Generic V2	ベース・モデル: 複数のエンドポイントで`meta.llama-3.2-11b-vision-instruct`⁇ モデルを実行するには、Small Generic V2クラスタで必要な数のエンドポイントを作成します(単位サイズ)。カスタム・モデル: `meta.llama-3.2-11b-vision-instruct`を微調整できないため、そのベースから構築されたカスタム・モデルを作成してホストすることはできません。

ヒント

ホスティング・クラスタでサポートされるコール・ボリュームを増やすには、専用AIクラスタを編集してインスタンス数を増やします。専用AIクラスタの更新を参照してください。
クラスタ当たり50を超えるエンドポイントの場合、制限endpoint-per-dedicated-unit-countの引上げをリクエストします。サービス制限の引上げのリクエストおよび生成AIのサービス制限を参照してください。

クラスタ・パフォーマンス・ベンチマーク

様々なユースケースについて、Meta Llama 3.2 11B Visionクラスタのパフォーマンス・ベンチマークを確認します。

リリース日と除・売却日


モデル	リリース日	オンデマンド処分日	専用モード除・売却日
`meta.llama-3.2-11b-vision-instruct`	2024-11-14	このモデルではオンデマンド・モードは使用できません。	最初の交換モデルのリリースから少なくとも6か月後。

重要

すべてのモデル・タイム・ラインおよびリタイア詳細のリストは、モデルのリタイアを参照してください。

モデル・パラメータ

モデル・レスポンスを変更するには、プレイグラウンドまたはAPIで次のパラメータの値を変更できます。

最大出力トークン

各レスポンスに対してモデルで生成するトークンの上限数。トークンごとに4文字を推定します。チャット・モデルを要求するため、レスポンスはプロンプトに依存し、各レスポンスは必ずしも最大割当てトークンを使用するわけではありません。

温度

出力テキストの生成に使用されるランダム性のレベル。

ヒント

温度の設定を0で開始し、出力を改良のためにプロンプトを再生成するときに温度を上げます高温は、幻覚や事実上誤った情報をもたらす可能性があります。

上位p

次のトークンで考慮する上位トークンの累積確率を制御するサンプリング方法。確率にpに0から1までの小数を割り当てます。たとえば、上位75パーセントを考慮するには、0.75と入力します。すべてのトークンを考慮するには、pを1に設定します。

上位k

top kの最も可能性の高いトークンからモデルが次のトークンをランダムに選択するサンプリング・メソッド。kの値が大きいほど、ランダムな出力が生成され、出力テキストがより自然になります。kのデフォルト値は、Cohere Commandモデルの場合は0、Meta Llamaモデルの場合は-1です。これは、モデルがすべてのトークンを考慮し、このメソッドを使用しないことを意味します。

頻度ペナルティ

トークンが頻繁に表示される場合にトークンに割り当てられるペナルティ。高いペナルティにより、繰り返されるトークンが少なくなり、よりランダムな出力が生成されます。

Meta Llamaファミリ・モデルでは、このペナルティはプラスまたはマイナスになります。正の数は、モデルが新しいトークンを使用することを推奨し、負の数はモデルがトークンを繰り返すことを推奨します。無効にするには、0に設定します。

プレゼンス・ペナルティ

出力に表示されている各トークンにペナルティが割り当てられ、使用されていないトークンを使用した出力の生成を促します。

シード

トークンを確定的にサンプリングする最善の努力をするパラメータ。このパラメータに値が割り当てられると、大規模言語モデルは、リクエストに同じシードとパラメータを割り当てたときに、繰返しリクエストに対して同じ結果を返すことを目的としています。

許可される値は整数で、大きいシード値または小さいシード値を割り当てても結果には影響しません。シード・パラメータに番号を割り当てることは、リクエストを番号でタグ付けすることと似ています。大規模言語モデルは、連続するリクエストで同じ整数に対して同じトークンのセットを生成することを目的としています。この機能は、デバッグおよびテストに特に役立ちます。シード・パラメータにはAPIの最大値がなく、コンソールでは最大値は9999です。コンソールでシード値を空白のままにするか、APIでnullのままにすると、この機能は無効になります。

警告

OCI生成AIサービスのモデル更新によってシードが無効になる可能性があるため、シード・パラメータで長時間実行しても同じ結果が生成されない場合があります。

Oracle Cloud Infrastructureドキュメント