データ・エンティティの作業
データ・エンティティは、データ構造を表形式で表したものです。
これには、マッピングでソースまたはターゲットとして使用できるデータベース表またはビューが含まれます。これらは、ソースおよびターゲットのメタデータにすぎません。データ・フローの作成に使用されます。
次の2つの方法のいずれかで、新しく作成したプロジェクトにデータ・エンティティを追加できます:
「データ・エンティティ」ページに、新しく作成またはインポートしたすべてのデータ・エンティティとその詳細が表示されます。詳細は次のとおりです。
- データ・エンティティの名前
- 接続: データ・エンティティが作成された
- スキーマ: データ・エンティティが関連付けられている
- 選択したデータ・エンティティの横にある「アクション」アイコン(
)をクリックして、次の操作を実行します:
- 既存の詳細を編集するには、「編集」を選択します。
- 選択したデータ・エンティティをプレビューするには、「プレビュー」を選択します。データ・エンティティがOracleデータベースに属している場合、表の統計を表示することもできます。詳細は、「データ・エンティティの統計の表示」を参照してください。
- 「削除」を選択して、選択したデータ・エンティティを削除します。
- データ・エンティティをまとめて削除するには、「データ・エンティティ」ページで、各データ・エンティティのチェック・ボックスを選択して、「削除」をクリックします。
- 必要なデータ・エンティティを検索して、次のフィルタに基づいてその詳細を確認することもできます:
- データ・エンティティの名前
- データ・エンティティが作成された接続
- スキーマ: データ・エンティティが関連付けられている
- データ・エンティティに関連付けられているタグ
トピック
- データ・エンティティのインポート
データ・エンティティを作成する最も簡単な方法では、接続タイプ(Oracleデータベースなど)からその構造をインポートします。 - データ・エンティティの作成
Oracle Data Transformsインタフェースを使用して、データ・エンティティを手動で作成または更新することができます。 - データ・フロー・エディタでのデータ・エンティティの作成
ターゲット・データ・エンティティがすでに作成またはインポートしている場合は、そのデータ・エンティティを設計キャンバスにドラッグし、列マッピングおよびオプションを完了します。 - データ・エンティティの統計の表示
「プレビュー」タブには、各データ・エンティティの詳細な統計が表示されます。
親トピック: 「データ変換」ページ
データ・エンティティのインポート
データ・エンティティを作成する最も簡単な方法では、接続タイプ(Oracleデータベースなど)からその構造をインポートします。
既存のデータ・エンティティをインポートするには:
- ホームページの左側のペインで、「データ・エンティティ」タブをクリックします。
「データ・エンティティ」ページが表示されます。
- 「データ・エンティティのインポート」をクリックして、既存のデータ・エンティティをインポートします。
「データ・エンティティのインポート」ページ・スライドイン。インポートにOracle ERP Cloud Server接続を使用する予定の場合は、Oracle ERP Cloud Serverからのデータ・エンティティ定義のインポートを参照してください。
- 「接続」、「スキーマ」の順に選択して、最後に、インポートする「オブジェクトのタイプ」を選択します。
Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。
- [Oracle Business Intelligence Cloud Connector (BICC)接続の場合のみ]「収集用にインポートするオファリング」から、データ・ストアをインポートするオファリングを選択します。BICCパブリック・ビュー・オブジェクト(PVO)をインポートするには、オファリングを少なくとも1つ選択する必要があります。
ノート
選択したオブジェクトの数によっては、BICC PVOのインポートに長時間かかる場合があります。パフォーマンスを向上させるために、マスクを使用してインポートするPVOの数をフィルタおよび制限することをお薦めします。 - スキーマ内のすべてのオブジェクトをインポートしない場合は、「マスク」/フィルタを選択します。
「接続タイプ」に応じて、追加のインポート・オプションが表示されます。
ノート
Oracle Object Storage接続の場合、この値は大/小文字が区別されます。「バッチ類似ファイル」がTrue
に設定されている場合、マスクに一致し、同じ構造を持つすべてのファイルが1つのデータ・エンティティにグループ化されます。 - [Oracle Financials Cloud接続の場合のみ] 「リソース」セクションのリストから、インポートするアイテムを選択します。インポート・プロセスが完了すると、選択したリソースごとに表が作成されます。
- [RESTサーバー接続の場合のみ] 「リソース」セクションで、次を実行します:
- 「リソースURI」フィールドに、リソースのインポート元となるRESTサービスのURLを入力します。
- 「+」アイコンをクリックします
- 「名前」列に、リソースの識別子を入力します。
- 「操作URI」列に、リソースのURIを入力します。
- 「リソースのテスト」をクリックして、エントリが有効かどうかを確認します。
- 「開始」をクリックします。
ジョブが作成され、セッションを追跡するために対応するジョブIDが表示されます。ジョブIDをクリックすると、そのジョブの詳細が表示されます。
ジョブが正常に実行されると、選択したすべてのデータ・エンティティがインポートされます。「データ・エンティティ」ページの右隅にある「リフレッシュ」アイコン
をクリックすると、新しくインポートしたデータ・エンティティが表示されます。
親トピック: データ・エンティティの作業
データ・ エンティティの作成
Oracle Data Transformsインタフェースでデータ・エンティティを手動で作成または更新できます。
データ・エンティティは、データ・フローでソースとして使用される対応するオブジェクトをソース接続内に所有している必要があります。通常、インポート・プロセスで、これらのオブジェクトが調整されていることが確認されます。ただし、データ・エンティティを手動で作成または更新するときは、必ず、両方の定義が互いに調整されているかどうかを確認してください。
データ・エンティティをターゲットとして使用する場合は、ターゲット接続にそれがすでに存在している必要はなく、データ・フロー実行の一部として作成できます。
- ホームページの左側のペインで、「データ・エンティティ」タブをクリックします。
「データ・エンティティ」ページが表示されます。
- 「データ・エンティティの作成」をクリックして、新しいデータ・エンティティを作成します。
「データ・エンティティの作成」ページが表示されます。
- 「名前」テキスト・ボックスに、作成する新しいデータ・エンティティの名前を入力します。
- 「接続」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要な接続を選択します。
ノート
Oracle Financials Cloud接続のデータ・エンティティを手動で作成できないため、この接続はここにリストされません。データ・エンティティは、「データ・エンティティのインポート」ページを使用してOracle Financials Cloud RESTエンドポイントからのみインポートできます。「データ・エンティティのインポート」を参照してください。 - 「スキーマ」ドロップダウンで、選択した接続に対応するすべてのスキーマが2つのグループで表示されます。
- 「新規データベース・スキーマ」(以前にインポートしたことがないもの)と、
- 既存のデータベース・スキーマ(以前にインポートされて、データ・エンティティを置換する可能性があるもの)です。
「スキーマ」ドロップダウンで、必要なスキーマを選択します。
ノート
Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。 - 「タイプ」ドロップダウンで、データ・エンティティ・タイプを選択します。
- 表: 新しく作成したデータ・エンティティの表構造を定義するには、「+」アイコンをクリックして列を追加します。列ごとに、「名前」、「データ型」、「長さ」、「スケール」、「Null以外」などのパラメータを指定できます。セルをダブルクリックして、値を構成します。
行を削除するには、「x」アイコンをクリックします。表の行をソートするには、上矢印および下矢印をクリックします。
- インライン・ビュー: インライン・コードを使用してデータ・エンティティを作成するには、「問合せ」タブにSelect文を入力します。たとえば、
SELECT * FROM CUSTOMER
とします。「検証」をクリックします。「列」タブには、問合せが返す列の読取り専用リストが表示されます。「プレビュー」タブをクリックして、列データを確認します。
- 表: 新しく作成したデータ・エンティティの表構造を定義するには、「+」アイコンをクリックして列を追加します。列ごとに、「名前」、「データ型」、「長さ」、「スケール」、「Null以外」などのパラメータを指定できます。セルをダブルクリックして、値を構成します。
- 「タグ」テキスト・ボックスに、希望するタグを入力します。タグを使用して、「データ・エンティティ」ページに表示されるデータ・エンティティをフィルタできます。
- Oracle Object Storage接続の場合、このページには次のオプションが表示されます:
- 内容– インポートするデータが含まれているCSVファイルを選択します。列のデータ型や長さなど、プレビュー表に表示されるメタデータは、CSVファイルの最初の行に基づきます。CSVファイルにヘッダー行があることを確認してください。ヘッダーに使用できるのは英数字のみで、特殊文字は使用できません。
- ファイルのグループ化 - 複数のCSVファイルのデータのデータを1つのデータ・エンティティにグループ化する場合は、このチェック・ボックスを選択します。たとえば、Employee_Data1.csv、Employee_Data2.csvおよびEmployee_Data3.csvのデータを1つのデータ・エンティティにマージする場合などです。
Windowsを使用してCSVファイルをアップロードする場合は、最初にファイルをUnix形式に変換して、グループ化中に文字エンコーディングの問題を回避してください。
- リソース名– このオプションは「ファイルのグループ化」とともに使用します。ファイルの識別に使用する値を入力します。リソース名は正規表現である必要があります。リソース名にはワイルドカード文字としてアスタリスク(*)のみを使用できます。たとえば、
Employee_Data*.csv
です。
- Oracleデータベース接続の場合、データ・エンティティを機能グループとしてマークできます。「拡張オプション」を開き、「機能グループとして処理」チェック・ボックスを選択します。
- 「保存」をクリックします。
新しいデータ・エンティティが作成されます。
親トピック: データ・エンティティの操作
データ・フロー・エディタ内でのデータ・エンティティの作成
ターゲット・データ・エンティティをすでに作成またはインポートしている場合は、そのデータ・エンティティをデザイン・キャンバス上にドラッグし、列マッピングおよびオプションを完了します。
データ・フロー・エディタ内にエンティティの定義を作成するには、
- データ・エンティティをデザイン・キャンバスにドラッグします。
- コンポーネントを選択し、ターゲット・コンポーネントの右上隅にあるデータ・エンティティの追加アイコン
をクリックします。
- 「データ・エンティティの追加」ページが表示され、ターゲット・コンポーネントの次の詳細を構成できます:
「一般」タブ
- 「名前」テキスト・ボックスに、新規に作成したデータ・エンティティの名前を入力します。
- 「エンティティ・タイプ」ドロップダウンで、データ・エンティティ・タイプを選択します。
- 表
- MLモデル
このエンティティ・タイプを選択すると、ユーザー・インタフェースは次のように変更されます。
- 「接続タイプ」ドロップダウンには、オプションとしてOracleのみが表示されます。したがって、「接続」ドロップダウンには、作成したOracle接続のみがリストされます。
- データ・エンティティの追加ウィザードに「プロパティ」タブが表示され、学習のタイプ、関数、アルゴリズムを選択し、MLモデルを定義するパラメータを構成できます。MLモデル・データ・エンティティの作成と使用の詳細は、機械学習(ML)モデルの使用を参照してください。
- 「接続タイプ」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要な接続を選択します。「接続」ドロップダウンには、関連付けられた接続タイプを使用して作成した接続が移入されます。
- 「接続」ドロップダウンから、新しく作成したデータ・エンティティの追加元となるサーバー名を選択します。
- 「スキーマ」ドロップダウンで、選択した接続に対応するすべてのスキーマが2つのグループで表示されます。
- 「新規データベース・スキーマ」(以前にインポートしたことがないもの)と、
- 既存のデータベース・スキーマ(以前にインポートされて、データ・エンティティを置換する可能性があるもの)です。
ノート
Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。 - 「タグ」テキスト・ボックスに、希望するタグを入力します。タグを使用して、「データ・エンティティ」ページに表示されるデータ・エンティティをフィルタできます。
- Oracleデータベース接続の場合、データ・エンティティを機能グループとしてマークできます。「拡張オプション」を開き、「機能グループとして処理」チェック・ボックスを選択します。
- 「次へ」をクリックします。
「列」タブ
- 新しく作成したデータ・エンティティに新しい列を追加するには、
「列の追加」アイコンをクリックします。
表示されている表に新しい列が追加されます。
- この表には次の列が表示されます:
- 名前
- データ型 - セルをクリックして、必要なデータ型を構成します。
- スケール
- 長さ
- アクション - 作成した列を削除するには、クロス・アイコンをクリックします。
- 列を一括で削除するには、列を選択して
「削除」アイコンをクリックします。
- 必要な列詳細を検索するには、「検索」テキスト・ボックスに必要な列名を入力し、[Enter]を押します。必要な列の詳細が表示されます。
- 「次へ」をクリックします。
「データ・エンティティのプレビュー」タブ
作成したすべての列とその構成済の詳細のプレビューが表示されます。データ・エンティティがOracleデータベースに属している場合、表の統計を表示することもできます。詳細は、「データ・エンティティの統計の表示」を参照してください。
- 「保存」をクリックします。
新しいターゲット・データ・エンティティが作成されます。
- 右側のペインでプロパティ・パネルを展開すると、作成したコンポーネントの次の設定が表示されます:
- 一般 - コンポーネントの名前が、その接続およびスキーマの詳細とともに表示されます。
- 属性 - コンポーネントに関連付けられたすべての属性の詳細が表示されます。
- 列マッピング - 「自動マップ」をクリックすると、すべての列が自動的にマップされます。
- プレビュー - クリックすると、コンポーネントのプレビューが表示されます。
- オプション - 必要に応じてオプションを変更します。
親トピック: データ・エンティティの作業
データ・エンティティの統計の表示
「プレビュー」タブには、各データ・エンティティの詳細な統計が表示されます。
この機能を使用できるのは、Oracleデータベース表のみです。
- 「データ・エンティティ」リストで、データ・エンティティの横にある「アクション」アイコン(
)をクリックし、「プレビュー」をクリックします。「統計」タブを選択して、選択したデータ・エンティティの統計を表示します。
- 任意のデータ・フローで、ソースまたはターゲットのデータ・エンティティをクリックし、右側のペインで「プロパティ」パネルを開きます。「プレビュー」をクリックします。
統計データは次のように表示されます:
- データ・エンティティの行と列の合計数は、上部に表示されます。
- 統計パネルには、各列のサムネイル・グラフが、最小、最大、個別およびNULL値に関する情報とともに表示されます。
- ヒストグラムに基づいて、2つのタイプのサムネイル表現が表示されます:
- 棒グラフは、頻度ヒストグラムおよび上位頻度ヒストグラムのデータを表します。棒グラフには、表の行数について最初の上位10個の値が表示されます。
- 表には、ハイブリッド・ヒストグラムと高さ調整済ヒストグラムのデータがリストされます。表にはデータ全体が表示され、スクロール可能です。表には、値の範囲と各範囲内の行の割合が表示されます。
- 各サムネイルをクリックすると、新しいブラウザ・タブで列の統計を表示できます。
- 各チャートの詳細ビューには、ヒストグラムのタイプも表示されます。
親トピック: データ・エンティティの操作