メイン・コンテンツにスキップ
ワークフローの作成および管理
Apache Hue UIを使用してワークフローを作成します。スケジューラ・リストを使用して、バンドル、コーディネータまたはワークフローを作成します。Sparkジョブの場合は、Sparkアクションを使用します。次のタスクは、Sparkアクション・ウィジェットと、HDFS内のSparkジョブおよび場所の詳細を示しています。表示されるオプション・リストは、Sparkジョブに追加のSparkパラメータを提供することです。HAクラスタの場合、Ranger関連のXML情報を指定する必要があります。詳細は後述します。
-
Hueにサインインします。
-
スクリプト・ファイルを作成し、Hueにアップロードします。
-
左端のナビゲーション・メニューで、「スケジューラ」を選択します。
-
「ワークフロー」を選択し、「自分のワークフロー」をクリックしてワークフローを作成します。
-
Sparkプログラム・アイコンを選択して、Sparkアクションを「ここにアクションをドロップ」領域にドラッグします。
-
「Jar/py name」ドロップダウンからJarファイルまたはPythonファイルを選択します。
-
「FILES」ドロップダウンからワークフローを選択します。
-
HA環境でHiveを接続するには、歯車アイコンを選択し、「資格証明」を選択します。
-
「hcat」を選択します。
-
保存アイコンを選択します。
-
フォルダ構造からワークフローを選択し、送信アイコンを選択します。