このページは機械翻訳したものです。

PostgreSQLからGoogle BigQueryへのデータのレプリケート

OCI GoldenGateを使用して、PostgreSQLからGoogle BigQueryにデータをレプリケートする方法について学習します。

開始する前に

このクイックスタートを正常に完了するには、次が必要です:

環境設定: PostgreSQL

このクイックスタートの環境を設定するには:
  1. PostgreSQLをインストールするには、次のコマンドを実行します。
    1. PostgreSQLサーバーをインストールします。
      sudo yum install postgresql-server
    2. postgresql-contribモジュールをインストールして、このSQL例外を回避します。
      sudo yum install postgresql-contrib
    3. 新しいPostgreSQLデータベース・クラスタを作成します。
      sudo postgresql-setup --initdb
    4. postgresql.serviceを有効にします。
      sudo systemctl enable postgresql.service
    5. postgresql.serviceを起動します。
      sudo systemctl start postgresql.service
  2. デフォルトでは、PostgreSQLはローカル接続のみを許可します。PostgreSQLへのリモート接続を許可します
    1. /var/lib/pgsql/data/postgresql.confで、レプリケーション用にデータベースを準備します。
    2. listen_addresses = 'localhost'を見つけてコメント解除し、localhostをアスタリスク(*)に変更します。
      listen_addresses = '*'
    3. 次のパラメータを次のように設定します。
      • wal_level = logical
      • max_replication_slots = 1
      • max_wal_senders = 1
      • track_commit_timestamp = on
      ノート

      /var/lib/pgsql/data/pg_hba.confを構成して、Oracle GoldenGateホストからの接続を許可するようにクライアント認証が設定されていることを確認します。たとえば、次を追加します:
      #Allow connections from remote hosts
      host    all    all    0.0.0.0/0    md5
      詳細については、The pg_hba.conf Fileを参照してください。
    4. PostgreSQLサーバーを再起動します。
      sudo systemctl restart postgresql.service
  3. Oracle Cloud Computeを使用してPostgreSQLをホストする場合は、ポート5432を開きます。
    sudo firewall-cmd --permanent --add-port=5432/tcp
    sudo firewall-cmd --reload
    sudo firewall-cmd --list-all
  4. VCNのセキュリティ・リストでポート5432を開きます。
  5. PostgreSQLに接続します
    > sudo su - postgres
    > psql
    ノート

    または、前述の例が機能しない場合は、sudo su - postgres psqlを入力できます。
  6. PostgreSQLを設定します。
    1. seedSRCOCIGGLL_PostgreSQL.sqlをダウンロードして実行し、データベースを設定してサンプル・データをロードします。
    2. 次のコマンドを実行してユーザーを設定します(<password>を実際のパスワードに置き換えてください)。
      create user ggadmin with password '<password>';
      alter user ggadmin with SUPERUSER;
      GRANT ALL PRIVILEGES ON DATABASE ociggll TO ggadmin;

タスク1: OCI GoldenGateリソースの作成

  1. ソースPostgreSQLデータベースのデプロイメントを作成します
  2. ターゲットGoogle BigQueryのビッグ・データ・デプロイメントを作成します
  3. ターゲットGoogle BigQueryへの接続を作成します。
  4. ソースPostgreSQLデータベースへの接続を作成します。
    1. 「タイプ」で、PostgreSQLサーバーを選択していることを確認します。
    2. 「データベース名」に、ociggllと入力します。
    3. 「ホスト」に、PostgreSQLが実行されるコンピュート・インスタンスのパブリックIPを入力します。
    4. 「ポート」に、5432と入力します。
    5. 「ユーザー名」に、ggadminと入力します。
    6. 「パスワード」に、パスワードを入力します。
    7. 「セキュリティ・プロトコル」で、「プレーン」を選択します。
  5. GoldenGateへの接続を作成し、この接続をソースPostgreSQLデプロイメントに割り当てます
  6. ソースPostgreSQLデプロイメントにソース接続を割り当てます。
  7. ターゲット・ビッグ・データ・デプロイメントにターゲット接続を割り当てます

タスク2: サマリー・ロギングの有効化

サマリー・ロギングの有効化の手順:
  1. PostgreSQL GoldenGateデプロイメント・コンソールを起動します:
    1. 「デプロイメント」ページから、PostgreSQLデプロイメントを選択してその詳細を表示します。
    2. PostgreSQLデプロイメントの詳細ページで、「コンソールの起動」をクリックします。
    3. デプロイメント・コンソールのサインイン・ページで、タスク1のステップ1で指定したGoldenGate管理資格証明を入力します。
      ノート

      デプロイメントの作成時にIAMが資格証明ストアとして選択されていない場合は、サインインが必要です。
  2. GoldenGate 23aiで、左側のナビゲーションの「DB接続」、ソースのPostgreSQLデータベース、「Trandata」の順にクリックします。
  3. 「TRANDATA」ページの「TRANDATA情報」の横にある「TRANDATAの追加」(プラス・アイコン)をクリックします。
  4. 「Trandata」パネルで、「スキーマ名」src_ociggll.*と入力し、「送信」をクリックします。
    ノート

    検索フィールドを使用してsrc_ociggllを検索し、表が追加されたことを確認します。

タスク3: Extractの作成

  1. Change Data Capture Extractを追加します。
    1. 左側のナビゲーションで、「抽出」をクリックします。
    2. 「抽出」ページで、「抽出の追加」(プラス・アイコン)をクリックし、次のようにフィールドに入力します:
      • 「抽出情報」ページで:
        1. 「Extractタイプ」で、「変更データ取得Extract」を選択します。
        2. 「プロセス名」に、Extractの名前(ECDCなど)を入力します。
        3. 「次へ」をクリックします
      • 「抽出オプション」ページ:
        1. 「ソース資格証明」で、「ドメイン」ドロップダウンから「Oracle GoldenGate」を選択します
        2. 「別名」ドロップダウンから、ソースPostgreSQLデータベースを選択します。
        3. 「Extract Trail Name」に、2文字のトレイル名(C1など)を入力します。
        4. 「次へ」をクリックします
      • 「Extractパラメータ」ページで、MAP *.*, TARGET *.*;を次に置き換えます:
        TABLE SRC_OCIGGLL.*;
    3. 「作成および実行」をクリックします。
  2. 初期ロードExtractを追加します。
    1. 「抽出」ページで、「抽出の追加」をクリックし、次のように「抽出の追加」フォームに入力します:
      • 「抽出情報」ページで:
        1. 「Extract」タイプで、「初期ロードExtract」を選択します。
        2. 「プロセス名」に、EILなどの名前を入力します。
        3. 「次へ」をクリックします
      • 「抽出オプション」ページ:
        1. 「ソース資格証明」で、「ドメイン」ドロップダウンから「Oracle GoldenGate」を選択します。
        2. 「別名」ドロップダウンからPostgreSQLデータベースを選択します。
        3. 「抽出証跡名」に、2文字の証跡名(I1など)を入力します。
        4. 「次へ」をクリックします
      • 「Extractパラメータ」ページで、テキスト領域の内容を次のように置き換えます。
        EXTRACT EIL
        USERIDALIAS PostgreSQL_Compute, DOMAIN OracleGoldenGate
        EXTFILE I1, PURGE
        TABLE src_ociggll.*;
        ノート

        続行する前に、USERIDALIASの前にSOURCEDBパラメータを削除してください。
    2. 「作成および実行」をクリックします。
「Extract」ページに戻り、Extractの開始を確認できます。

タスク4: Change Data CaptureDistribution Pathの作成

Change Data CaptureDistribution Pathを作成するには、次の手順を実行します。

  1. Oracle Cloudコンソールの「デプロイメント」ページで、ターゲット・ビッグ・データ・デプロイメントを選択します。
  2. 「デプロイメントの詳細」ページで、「コンソールの起動」をクリックします。タスク1のステップ2で作成した管理ユーザーの詳細を使用してログインします。
  3. IAM資格証明ストアを使用している場合は、「Distribution Pathの作成」ステップに進みます。GoldenGate資格証明ストアを使用する場合は、ソースGoldenGateがターゲットGoldenGateへの接続に使用するユーザーを作成します。
    1. ナビゲーション・メニューで、「ユーザー管理」をクリックします。
    2. 「新規ユーザーの追加」(プラス・アイコン)をクリックし、次のようにフィールドに入力して、「送信」をクリックします:
      • 「ユーザー名」に、ggsnetと入力します。
      • 「ロール」で、「演算子」を選択します。
      • 確認のためにパスワードを2回入力します。
  4. ソースのPostgreSQLデプロイメント・コンソールで、前のステップで作成されたユーザーのパス接続を作成します。
    1. ナビゲーション・メニューで、「パス接続」をクリックします。
    2. 「パス接続の追加」(プラス・アイコン)をクリックし、次のようにフィールドに入力して、「送信」をクリックします:
      • 「資格証明別名」に、dpuserと入力します。
      • 「ユーザーID」に、ggsnetと入力します
      • 「パスワード」に、前のステップで使用したものと同じパスワードを入力します。
  5. Distribution Pathの追加」をクリックします。
  6. 「パスの追加」フォームに次のように入力します。
    1. 「パス情報」ページで:
      1. 「パス名」に、名前を入力します。
      2. 「次へ」をクリックします
    2. 「ソース・オプション」ページ:
      1. 「ソース」 Extractで、Integrated Extract (ECDC))を選択します。
      2. 「トレイル名」で、Integrated Extractトレイル・ファイル(C1)を選択します。
      3. 「次へ」をクリックします
    3. 「ターゲット・オプション」ページ:
      1. 「ターゲット」で、「wss」を選択します。
      2. 「ターゲット・ホスト」に、ターゲット・デプロイメント・コンソールのURLを入力します(これは、デプロイメントの詳細ページでhttps://または後続のスラッシュなしで確認できます)。
      3. 「ポート番号」に、443と入力します。
      4. 「トレイル名」に、C1と入力します。
      5. 「ターゲット認証方式」で、「ユーザーID別名」を選択します。
      6. 「ドメイン」に、ドメイン名を入力します。
      7. 「別名」に、別名を入力します。
    4. 「パスの作成および実行」をクリックします。
  7. ターゲット・ビッグ・データ・デプロイメント・コンソールで、Receiver Serviceをクリックして、作成されたReceiver Pathを確認します。

タスク5: Replicatの追加

  1. ターゲット・ビッグ・データ・デプロイメント・コンソールのナビゲーション・メニューで、Replicatsをクリックし、Replicatの追加」(プラス・アイコン)をクリックします。
  2. Replicatsページで、Replicatの追加」(プラス・アイコン)をクリックし、次のようにReplicatの追加」フォームに入力します:
    1. Replicatの「情報」ページで、次の手順を実行します。
      1. Replicatタイプで、ParallelまたはCoordinated Replicatを選択します。
      2. 「プロセス名」に、名前(RCDCなど)を入力します。
      3. 「次へ」をクリックします
    2. Replicatオプション・ページで、次の手順を実行します。
      1. Replicatトレイル名」に、タスク3からトレイルの名前(C1)を入力します。
      2. 「ターゲット資格証明」で、Google Big Query接続の「ドメイン」および「別名」を選択します。
      3. 「使用可能なステージングの場所」で、ドロップダウンから「Google Cloud Storage」を選択します。
      4. 「ステージング別名を使用」で、ドロップダウンから「Google Cloud Storage接続」を選択します。
    3. 「パラメータ・ファイル」ページで、次のマッピングを追加し、「次」をクリックします。
      MAP *.*, TARGET *.*;
    4. 「プロパティ・ファイル」ページで、必要に応じて必要なプロパティを構成します。#TODOとマークされているものを探し、「次」をクリックします。
      変更を検討する必要があるプロパティには次が含まれます:
      • gg.eventhandler.gcs.bucketMappingTemplate: ステージング記憶域として使用されるバケットの名前を指定します
  3. 「作成および実行」をクリックします。

    Replicatsページに戻り、Replicatの詳細を確認できます。

タスク6: Change Data Captureの確認

ソースPostgreSQLデータベースの更新を実行して、Google BigQueryへのレプリケーションを確認します。
  1. 次のスクリプトを実行して、PostgreSQLデータベースへの挿入を実行します:
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  2. ソースのPostgreSQLデプロイメント・コンソールで、Extract名(EDCD)を選択し、「統計」をクリックします。src_ociggll.src_cityに10個の挿入があることを確認します。
    ノート

    Extractで挿入が取得されなかった場合は、EDCD Extractを再起動します。
  3. ターゲットのビッグ・データ・デプロイメント・コンソールで、Replicat名を選択し、その「詳細」を表示し、「統計」を選択して挿入数を確認します。