カスタム Spark クラスター

Spark Submit 実行構成で、AWS EMR または Dataproc をリモートサーバーとして使用してアプリケーションを実行できます。これらのオプションに加え、独自のカスタム Spark クラスターを設定することもできます。リモートサーバーへ接続するための SSH 構成を設定し、必要に応じて Spark History サーバーや SFTP 接続の設定も行えます。

カスタム Spark クラスターの作成

「ビッグデータツール」ウィンドウで「」をクリックし、「カスタム Spark クラスター」を選択します。
表示されたウィンドウの最初のステップで、SSH 構成を選択して次へをクリックします。この SSH 構成は、spark-submit がインストールされているサーバーへの接続に使用されます。
IDE で Spark ジョブをモニタリングしたい場合は、ウィザードの次のステップで Spark history サーバーへの接続を確立するためのパラメーターを指定してください。独自のパラメーターを指定するか、デフォルト設定を使用してください。これにより、SSH トンネリングを使用して localhost:18080 へ接続が作成されます。
それ以外の場合は、 Spark 履歴サーバーへの接続は必要ありませんを選択します。
Spark クラスターへの SFTP 接続が必要な場合は、ウィザードの次のステップでその設定を指定してください。
それ以外の場合は、ドライバーノードへの SFTP 接続は必要ありませんを選択します。

Spark 履歴と SFTP 接続の両方を設定している場合は、ビッグデータツールツールウィンドウのカスタム Spark クラスターで使用できるようになります。

これで、このクラスターを Spark Submit 実行構成のリモートターゲットとして選択できるようになりました。この実行構成を起動すると、アプリケーション出力のリンクをクリックして、サービスツールウィンドウで Spark ジョブを開くことができます。

2026 年 5 月 22 日