クラウド・オブジェクト・ストレージへのParquetとしてのデータのエクスポート

問合せを指定して、表データをAutonomous Databaseからクラウド・オブジェクト・ストレージにParquetデータとしてエクスポートするステップを示します。

このエクスポート方法では、Autonomous Databaseでサポートされているすべてのクラウド・オブジェクト・ストアがサポートされ、Oracle Cloud Infrastructureリソース・プリンシパルを使用してOracle Cloud Infrastructure Object Storeにアクセスしたり、Amazonリソース名(ARN)を使用してAWS Simple Storage Service (S3)、Azure BLOBストレージまたはAzure Data Lake StorageにアクセスするためのAzureサービス・プリンシパル、またはGoogle Cloud Platform (GCP)リソースにアクセスするためのGoogleサービス・アカウントにアクセスできます。

  1. Autonomous Databaseインスタンスに接続してください。

    詳細は、Autonomous Databaseへの接続を参照してください。

  2. DBMS_CLOUD.CREATE_CREDENTIALを使用してクラウド・オブジェクト・ストレージ資格証明を格納します

    たとえば:

    BEGIN
      DBMS_CLOUD.CREATE_CREDENTIAL(
        credential_name => 'DEF_CRED_NAME',
        username => 'user1@example.com',
        password => 'password'
      );
    END;
    /

    usernameおよびpasswordに指定する値は、使用しているクラウド・オブジェクト・ストレージ・サービスによって異なります

    リソース・プリンシパル資格証明を有効にする場合、Oracle Cloud Infrastructureオブジェクト・ストアにアクセスするための資格証明の作成は必要ありません。詳細は、リソース・プリンシパルを使用したOracle Cloud Infrastructureリソースへのアクセスを参照してください。

  3. DBMS_CLOUD.EXPORT_DATAを実行し、formatパラメータtypeに値parquetを指定して、結果をクラウド・オブジェクト・ストレージにparquetファイルとしてエクスポートします。
    parquet出力ファイルを生成するには、file_uri_listパラメータに2つのオプションがあります:
    • file_uri_list値をクラウド・オブジェクト・ストレージ上の既存のバケットのURLに設定します。

    • file_uri_list値をクラウド・オブジェクト・ストレージ上の既存のバケットのURLに設定し、エクスポートされたparquetファイルのファイル名を生成する際に使用するファイル名接頭辞を含めます。

    file_uri_listにファイル名接頭辞を含めない場合、DBMS_CLOUD.EXPORT_DATAはファイル名接頭辞を指定します。詳細は、テキスト出力(CSV、JSON、ParquetまたはXML)のファイル・ネーミングを参照してください。

    たとえば、file_uri_listで指定されたファイル名接頭辞を持つDBMS_CLOUD.EXPORT_DATAを次に示します。

    BEGIN
      DBMS_CLOUD.EXPORT_DATA(
        credential_name => 'DEF_CRED_NAME',
        file_uri_list   => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname/o/dept_export',
        query           => 'SELECT * FROM DEPT',
        format          => JSON_OBJECT('type' value 'parquet', 'compression' value 'snappy'));
    END;
    /

    この例では、namespace-stringはOracle Cloud Infrastructureオブジェクト・ストレージ・ネームスペースで、bucketnameはバケット名です。詳細は、オブジェクト・ストレージ・ネームスペースの理解を参照してください。

    パラメータの詳細は、「EXPORT_DATAプロシージャ」を参照してください。

    DBMS_CLOUD.EXPORT_DATAで使用できるformatパラメータの詳細は、EXPORT_DATAのDBMS_CLOUDパッケージ・フォーマット・オプションを参照してください。

DBMS_CLOUD.EXPORT_DATAを使用したエクスポートに関するノート:

  • 指定するqueryパラメータ値には、必要に応じて、結合や副問合せを含む問合せなどの拡張問合せを指定できます。

  • 出力ファイルを圧縮するには、formatパラメータをcompressionオプションとともに指定します。type parquetのデフォルトのcompressionsnappyです。

  • エクスポートするファイルが不要になった場合は、DBMS_CLOUD.DELETE_OBJECTプロシージャを使用するか、ネイティブのクラウド・オブジェクト・ストレージ・コマンドを使用してファイルを削除します。

  • Oracle型からParquet型へのマッピングの詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。

    次のタイプはサポートされていないか、DBMS_CLOUD.EXPORT_DATAを使用してParquetをエクスポートするためのサポートに制限があります:

    Oracleタイプ ノート

    BFILE

    サポートされていない

    BLOB

    サポートされていない

    DATE

    次の制限でサポート: DATE形式では、日付、月および年のみがサポートされます。時間、分および秒はサポートされていません。

    DATEをParquetにエクスポートする際のNLS形式の制限事項の詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。

    INTERVAL DAY TO SECOND

    サポートされ、内部で文字列として扱われます

    INTERVAL YEAR TO MONTH

    サポートされ、内部で文字列として扱われます

    LONG

    サポートされていない

    LONG RAW

    サポートされていない

    NUMBER

    次の制限でサポートされています。

    • 最大精度は38で、倍率は精度以下になります。
    • NUMBER型に精度およびスケールが指定されていない場合は、デフォルトで精度38およびスケール20が使用されます。
    • NUMBER型では負のスケールはサポートされていません。

    Object Types

    サポートされていない

    TIMESTAMP

    次の制限でサポートされています。

    • 精度が異なる複数の列がある場合は、最高精度が使用されます。
    • TIMESTAMP WITH TIME ZONE Oracleデータ型では、タイムスタンプのみが使用されます。

    TIMESTAMPをParquetにエクスポートする際のNLS形式の制限事項の詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。