ディレクトリへのParquetとしてのデータのエクスポート

問合せを指定して、表データをAutonomous DatabaseからParquetデータとしてディレクトリにエクスポートするステップを示します。

  1. Autonomous Databaseインスタンスに接続してください。

    詳細は、Autonomous Databaseへの接続を参照してください。

  2. ディレクトリの作成

    たとえば:

    CREATE DIRECTORY export_dir AS 'export_dir';
    詳細については、Autonomous Databaseでのディレクトリの作成を参照してください。
  3. DBMS_CLOUD.EXPORT_DATAを実行し、formatパラメータtypeに値jsonを指定して、結果をParquetファイルとしてディレクトリにエクスポートします。出力をディレクトリに送信する場合は、credentialパラメータを含めないでください。
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    ディレクトリ名が二重引用符で囲まれている場合、ディレクトリ名は大/小文字が区別されます。たとえば:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    パラメータの詳細は、「EXPORT_DATAプロシージャ」を参照してください。

    DBMS_CLOUD.EXPORT_DATAで使用できるformatパラメータの詳細は、EXPORT_DATAのDBMS_CLOUDパッケージ・フォーマット・オプションを参照してください。

    パラメータは次のとおりです。

    • file_uri_list: エクスポート・ファイルのカンマ区切りリストです。file_uri_listでは、ワイルドカードおよび置換文字の使用はサポートされていません。

    • format: 必要なtypeパラメータを指定します。有効な値は、datapumpjsonxmlcsvおよびparquetで、オプションで、ORACLE_DATAPUMPアクセス・ドライバを使用してエクスポートに指定できるオプションも定義します。

    • query: 必要なデータのみがエクスポートされるようにSELECT文を指定します。問合せによってダンプ・ファイルの内容が決定されます。

    パラメータの詳細は、「EXPORT_DATAプロシージャ」を参照してください。

DBMS_CLOUD.EXPORT_DATAを使用したエクスポートに関するノート:

  • 指定するqueryパラメータ値には、必要に応じて、結合や副問合せを含む問合せなどの拡張問合せを指定できます。

  • 出力ファイルを圧縮するには、formatパラメータをcompressionオプションとともに指定します。

  • Oracle型からParquet型へのマッピングの詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。

    次のタイプはサポートされていないか、DBMS_CLOUD.EXPORT_DATAを使用してParquetをエクスポートするためのサポートに制限があります:

    Oracleタイプ ノート

    BFILE

    サポートされていない

    BLOB

    サポートされていない

    DATE

    次の制限でサポート: DATE形式では、日付、月および年のみがサポートされます。時間、分および秒はサポートされていません。

    DATEをParquetにエクスポートする際のNLS形式の制限事項の詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。

    INTERVAL DAY TO SECOND

    サポートされ、内部で文字列として扱われます

    INTERVAL YEAR TO MONTH

    サポートされ、内部で文字列として扱われます

    LONG

    サポートされていない

    LONG RAW

    サポートされていない

    NUMBER

    次の制限でサポートされています。

    • 最大精度は38で、倍率は精度以下になります。
    • NUMBER型に精度およびスケールが指定されていない場合は、デフォルトで精度38およびスケール20が使用されます。
    • NUMBER型では負のスケールはサポートされていません。

    Object Types

    サポートされていない

    TIMESTAMP

    次の制限でサポートされています。

    • 精度が異なる複数の列がある場合は、最高精度が使用されます。
    • TIMESTAMP WITH TIME ZONE Oracleデータ型では、タイムスタンプのみが使用されます。

    TIMESTAMPをParquetにエクスポートする際のNLS形式の制限事項の詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。