はじめに
Apache Sparkは、オープンソースの分散型汎用クラスターコンピューティングフレームワークです。Sparkは、クラスター全体を暗黙的なデータ並列性とフォールトトレランスでプログラミングするためのインターフェースを提供します。 Simba Spark JDBCドライバーを使用すると、SQLとHiveQLを使ってApache Sparkに直接アクセスし、Sparkベースのデータでビジネスインテリジェンス(BI)、分析、レポート作成が可能になります。DomoのSimba Spark JDBCコネクターを使用すると、SQLとHiveQLを使ってApache Sparkに直接アクセスでき、効率が向上します。 Simba Spark JDBC は「データベース」コネクターであるため、クエリを使用してデータベースからデータを取得します。Data Centerでは、ウィンドウ上部のツールバーで [データベース] をクリックすることで、このコネクターやほかのデータベースコネクターのページにアクセスできます。 Simba Spark サーバーには、Data Centerから接続します。このトピックでは、 Simba Spark JDBC コネクターのユーザーインターフェースに固有のフィールドとメニューについて説明します。DataSetの追加、更新スケジュールの設定、DataSet情報の編集に関する一般的な情報については、「 コネクターを使用してDataSetを追加する 」を参照してください。必要条件
Simba Sparkデータベースに接続してDataSetを作成するには、以下の情報が必要です。- データベースサーバーのホスト名またはIPアドレス
- Sparkデータベースのポート番号
- Sparkデータベースの名前
- Sparkアカウントのログインに使用するユーザー名とパスワード
- HTTPパス
Simba Spark データベースに接続する
このセクションでは、 Simba Spark JDBC コネクターページの [認証情報] および [詳細] ペインについて説明します。このページのほかのペインの項目である [スケジュール設定] や [DataSetに名前を付け、説明を入力] に関しては、ほとんどのタイプのコネクターで共通しています。詳細については「 コネクターを使用してDataSetを追加する 」を参照してください。[認証情報] ペイン
このペインには、データベースに接続する認証情報の入力フィールドが含まれています。以下の表で、各フィールドについて説明します。フィールド | 説明 |
|---|---|
JDBC Driver | 使用するJDBCドライバーを選択します。 |
Server Hostname | データベースサーバーのホスト名またはIPアドレスを入力します。 |
Port | データベースのポート番号を入力します。 |
Database | データベース名を入力します。 |
Username | Sparkアカウントのログインに使用するユーザー名を入力します。 |
Password | Sparkアカウントへのログインに使用するパスワードを入力します。 |
| HTTP Path | HTTPパスを入力します。 |
[詳細]ペイン
このペインでクエリを作成して、データベースからデータを取得します。メニュー | 説明 |
|---|---|
HiveQL Query | ここにHiveQLクエリを入力します。 |
| Database Tables | データベーステーブルを選択します。 |
| Table Columns | 表の列を選択します。 |
| Fetch Size | メモリパフォーマンスのフェッチサイズを入力します。フェッチサイズが指定されていない場合、デフォルト値が使用されます。「メモリー不足」エラーが発生した場合、フェッチサイズを小さくしてください。 |