Cohere Embed 4 (New)
cohere.embed-v4.0
は、テキスト入力またはイメージからテキスト埋込みを作成できるマルチモーダル・モデルです。イメージ入力はコンソールで使用できないため、APIを使用する必要があります。APIの場合は、実行ごとにbase64エンコード・イメージを入力します。たとえば、512 x 512イメージは、約1,610トークンに変換されます。
これらのリージョンで使用可能
- ブラジル東部(サンパウロ)(専用AIクラスタのみ)
- ドイツ中央部(フランクフルト)(専用AIクラスタのみ)
- インド南部(ハイデラバード)(専用AIクラスタのみ)
- 日本中央部(大阪)
- サウジアラビア中央部(リヤド)
- UAE East (ドバイ) (専用AIクラスタのみ)
- 英国南部(ロンドン)(専用AIクラスタのみ)
- 米国中西部(シカゴ)
主な機能
- モード
- テキストとイメージの両方ではなく入力してください。
- イメージの埋込みを取得するには、1つのイメージのみが許可されます。同じ埋込みにテキストとイメージを組み合せることはできません。APIによるイメージ入力のみ。
- 入力と出力
- コンソールでは、各テキスト入力は512トークン未満で、実行当たり最大96入力である必要があります。
- SDKとAPIでは、すべての入力をまとめて、1回の実行で埋込み当たり最大128,000個のトークンを追加できます。
- モデルは、埋込みごとに1,536次元ベクトルを出力します。
- 言語のサポート
- テキスト:英語または多言語。
- イメージ:英語のみ。
モデルの専用AIクラスタ
リストされた任意のリージョンの専用AIクラスタを介してモデルに到達するには、専用AIクラスタにそのモデルのエンドポイントを作成する必要があります。このモデルに一致するクラスタユニットサイズについては、次の表を参照してください。
ベース・モデル | ファインチューニング・クラスタ | ホスティング・クラスタ | 価格設定ページ情報 | クラスタ制限の引上げをリクエスト |
---|---|---|---|---|
|
ファインチューニングに使用できません |
|
|
|
ヒント
-
専用AIクラスタで埋込みモデルをホストするための十分なクラスタ制限がテナンシにない場合は、
dedicated-unit-embed-cohere-count
制限を1増やすようにリクエストします。 - 様々なユースケースについて、Cohere Embed 4クラスタのパフォーマンス・ベンチマークを確認します。
リリース日と除・売却日
モデル | リリース日 | オンデマンド処分日 | 専用モード除・売却日 |
---|---|---|---|
cohere.embed-v4.0
|
2025-07-03 | 最初の交換モデルのリリースから少なくとも6か月後。 | 最初の交換モデルのリリースから少なくとも6か月後。 |
埋込モデル・パラメータ
埋込みモデルを使用する場合、次のパラメータを変更することで、別の出力を取得できます。
- 切捨て
-
文の開始トークンと終了トークンを切り捨てるかどうか(その文が許容されるトークンの最大数を超える場合)。たとえば、文には516個のトークンがありますが、最大トークン・サイズは512です。終了を切り捨てる場合、その文の最後の4つのトークンが切り捨てられます。