はじめに
Amazon Redshiftは、ホスト型Data Warehouseプロジェクトで、大型クラウドコンピューティングプラットフォームであるAmazon Web Servicesの一部です。Redshiftは、列型DBMS原理で保存された大規模なDataSet上の解析ワークロードを取り扱うことができます。Amazon Redshift Upsertコネクターで、マージ(アップサート)オプションを使用することにより、データを表に反映できます。 Amazon Redshift Upsertのアカウントには、Data Centerから接続します。このトピックでは、Amazon Redshift Upsertコネクターのインターフェースに固有のフィールドとメニューについて説明します。DataSetの追加とDataSet情報の編集に関する一般的な情報については、「 データコネクターを使ってDataSetを追加する 」を参照してください。必要条件
Amazon Redshift Upsert DataSetの作成を開始できるように、Amazon Redshiftに接続するには、以下が必要です。- JDBCドライバー
- Redshiftデータベースのホスト名
- Redshiftデータベースのデータベース名
- Redshiftのユーザー名とパスワード
- Redshiftデータベースのポート番号
- 証明書の形式これは、[証明書]フィールドに入力した内容と一致している必要があります。
- CA証明書用テキスト、または証明書がある場所のURLを入力します。デフォルトでは、証明書は必要ありません。
ホワイトリスト化
Redshiftデータベースに接続する前に、接続先となるデータベースサーバーのポートでIPアドレスをいくつかホワイトリストに登録する必要があります。IPアドレスの詳細なリストは、「 コネクターのIPアドレスをホワイトリスト化する 」を参照してください。Amazon Redshift Upsertアカウントに接続する
このセクションでは、Amazon Redshift Upsertコネクターページの [認証情報] および [詳細] ペインのオプションについて説明します。このページのほかのペインの項目にある [スケジュール設定] や [DataSetの名前を付け説明を入力] に関しては、ほとんどのタイプのコネクターで共通しています。詳細については、「 データコネクターを使ってDataSetを追加する 」を参照してください。[認証情報]ペイン
このペインには、Amazon Redshift Upsertアカウントに接続する認証情報の入力フィールドが含まれています。下表は、各フィールドに必要な内容を説明しています。フィールド | 説明 |
|---|---|
JDBCドライバー | 使用するJDBCドライバーを選択します。 |
ホスト | SQLデータベースのホスト名を入力します。ホスト名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
データベース | SQLデータベース名を入力します。データベース名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
ユーザー名 | Redshiftユーザー名を入力します。ユーザー名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
パスワード | Redshiftパスワードを入力します。ユーザー名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
データベースポート | Redshiftデータベースのポート番号を入力します。ポート番号が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
証明書書式 | 証明書書式を選択します。これは、 [証明書] フィールドに入力した内容と一致している必要があります。特別な証明書が分からない場合、[証明書なし]を選択します。 |
証明書 | CA証明書用テキストを貼り付けるか、証明書がある場所のURLを入力します。デフォルトでは、証明書は必要ありません。 |
[詳細]ペイン
このペインには、Domoにロードするデータを指定するための、様々なオプションが含まれています。| メニュー | 説明 |
|---|---|
| クエリタイプ | クエリタイプを選択します。 クエリ :パラメーターなしの通常SQLクエリ クエリパラメーター :パラメーターを伴うSQLクエリ |
| クエリ | 必要なデータの選択に使用するSQLクエリを入力します。例: SELECT * FROM Employee |
| フェッチサイズ | メモリのパフォーマンスのフェッチサイズを入力します。空白の場合、デフォルト値は1000です。値に対してメモリー不足の例外が発生した場合、フェッチサイズを縮小します。 |
| クエリパラメーター | クエリパラメーターの値を入力します。この値は、クエリパラメーターの初期値となります。最終実行日はオプションです。指定しない場合はデフォルトで「1700年2月1日」となります。例:!{lastvalue:_id}!=1,{lastrundate:start_date}!=02/01/1944 |
| 検証タイプ | 検証タイプを選択します。 検証なし :検証を実行しません。 検証スキーマ :現在のスキーマと直前のスキーマを検証し、スキーマが同じではない場合、ジョブの実行が失敗します。 |
| 検証手段 | 検証するケースを選択します。 列名の大文字と小文字を区別 :現在の列名と直前の列名が同じで大文字・小文字のみが異なる場合、列名が一致するとはみなしません。 列の順序 :現在の列と直前の列が同じ順序ではない場合、列名が一致するとはみなしません。 |
| Booleanの形式 | 返されるデータにおけるBooleanの形式を選択します。 1 = true、0 = false :すべてのBoolean型のデータ列で、真の場合は1を返し、その他の場合は0を返します。 t = true、f = false :すべてのBoolean型のデータ列で、真の場合はtを返し、その他の場合はfを返します。 T = true、F = false :すべてのBoolean型のデータ列で、真の場合はTを返し、その他の場合はFを返します。 true = true、false = false :すべてのBoolean型のデータ列で、真の場合はtrueを返し、その他の場合はfalseを返します。 |
| タイムアウトクエリ(オプション) | 使用されるクエリタイムアウト値を入力します。 |
スケジュール設定
このコネクター特有のスケジュール設定機能により、データのマージ(アップサート)を実現します。この方法では、更新された行はすべて置き換えられ、新しい行は追加されます。