ワークフローの作成および管理

Apache Hue UIを使用してワークフローを作成します。スケジューラ・リストを使用して、バンドル、コーディネータまたはワークフローを作成します。Sparkジョブの場合は、Sparkアクションを使用します。次のタスクは、Sparkアクション・ウィジェットと、HDFS内のSparkジョブおよび場所の詳細を示しています。表示されるオプション・リストは、Sparkジョブに追加のSparkパラメータを提供することです。HAクラスタの場合、Ranger関連のXML情報を指定する必要があります。詳細は後述します。
  1. Hueにサインインします。
  2. スクリプト・ファイルを作成し、Hueにアップロードします。
  3. 左端のナビゲーション・メニューで、「スケジューラ」を選択します。
  4. 「ワークフロー」を選択し、「自分のワークフロー」をクリックしてワークフローを作成します。
  5. Sparkプログラム・アイコンを選択して、Sparkアクションを「ここにアクションをドロップ」領域にドラッグします。
  6. 「Jar/py name」ドロップダウンからJarファイルまたはPythonファイルを選択します。
  7. 「FILES」ドロップダウンからワークフローを選択します。
  8. HA環境でHiveを接続するには、歯車アイコンを選択し、「資格証明」を選択します。
  9. 「hcat」を選択します。
  10. 保存アイコンを選択します。
  11. フォルダ構造からワークフローを選択し、送信アイコンを選択します。