DataGrip 2026.1 Help

カスタム Spark クラスター

Spark Submit 実行構成で、AWS EMR または Dataproc をリモートサーバーとして使用してアプリケーションを実行できます。 これらのオプションに加え、独自のカスタム Spark クラスターを設定することもできます。リモートサーバーへ接続するための SSH 構成を設定し、必要に応じて Spark History サーバーや SFTP 接続の設定も行えます。

カスタム Spark クラスターの作成

  1. ビッグデータツール 」ウィンドウで「接続を追加 」をクリックし、「カスタム Spark クラスター 」を選択します。

  2. 表示されたウィンドウの最初のステップで、SSH 構成を選択して 次へ をクリックします。 この SSH 構成は、spark-submit がインストールされているサーバーへの接続に使用されます。

    Spark Submit を選択
  3. IDE で Spark ジョブをモニタリングしたい場合は、ウィザードの次のステップで Spark history サーバーへの接続を確立するためのパラメーターを指定してください。 独自のパラメーターを指定するか、デフォルト設定を使用してください。これにより、SSH トンネリングを使用して localhost:18080 へ接続が作成されます。

    それ以外の場合は、 Spark 履歴サーバーへの接続は必要ありません を選択します。

    Spark Submit を選択
  4. Spark クラスターへの SFTP 接続が必要な場合は、ウィザードの次のステップでその設定を指定してください。

    それ以外の場合は、 ドライバーノードへの SFTP 接続は必要ありません を選択します。

    Spark Submit を選択

Spark 履歴と SFTP 接続の両方を設定している場合は、 ビッグデータツール ツールウィンドウの カスタム Spark クラスター で使用できるようになります。

Spark Submit を選択

これで、このクラスターを Spark Submit 実行構成のリモートターゲットとして選択できるようになりました。 この実行構成を起動すると、アプリケーション出力のリンクをクリックして、 サービス ツールウィンドウで Spark ジョブを開くことができます。

2026 年 5 月 22 日