はじめに
Amazon Redshiftは高速で拡張可能なData Warehouseであり、Data Warehouseとデータレイク全体のすべてのデータを簡単かつ費用効果の高い方法で分析できます。DomoではRedshiftのデータを活用することができます。1つのRedshiftデータソースであっても、1000の様々なデータソースであっても、すべてのデータソースをDomoに取り込み、一元化したエクスペリエンスですべてを同時に表示および分析します。データをパーティショニングすることで、各クエリでスキャンされるデータ量を制限することができ、パフォーマンスを向上させ、コストを低減できます。DomoのAmazon Redshift Partitionコネクターを使用すると、Redshiftに直接接続し、提供された過去の日数に基づいてリアルタイムの視覚化で必要な情報を提供できます。このため、分析が簡単になります。Amazon Redshift APIについて詳しくは、製品ドキュメント( http://docs.aws.amazon.com/redshift/…_commands.html )を参照してください。 Amazon Redshift Partitionコネクターは「データベース」コネクターです。つまり、クエリに基づいてデータベースからデータを取得します。Data Centerでは、ウィンドウ上部のツールバーで [データベース] をクリックすることで、これを含む他のデータベースコネクターのページにアクセスできます。 Amazon Redshiftのアカウントには、Data Centerから接続します。このトピックでは、Amazon Redshift Partitionコネクターのユーザーインターフェースに固有のフィールドとメニューについて説明します。DataSetの追加や更新スケジュールの設定、DataSet情報の編集に関する一般的な情報については、「 データコネクターを使用してDataSetを追加する 」を参照してください。| 主な使用事例 | Redshift Dara Warehouseまたはデータマートからデータを取得する。 |
| 主なメトリクス | これは、Redshiftインスタンスに保存されたデータ次第です。 |
| 社内における主な権限 |
|
| 平均導入時間 | 設定と、取得するデータ量により、5時間から40時間です。 |
| 使いやすさ(1から10のスケールで、1が「最も使いやすい」) | 6 |
ベストプラクティス
結果セットのサイズをできる限り制限します。データの取得速度を高めるには、「フェッチサイズ」を増加できます。しかし、あまり大きなサイズにすると、コネクター実行の失敗が発生し、Redshiftインスタンスのパフォーマンスに問題が生じる可能性があります。まずは400から始めるのが適切でしょう。必要条件
Redshiftデータベースに接続し、DataSetを作成するには、以下が必要です。- Redshiftデータベースのログインに使用するユーザー名とパスワード
- データベースサーバーのホスト名(例: db.company.com )。
- データベースのポート番号
- データベース名
Redshiftアカウントを作成する
Redshiftユーザーアカウントを作成するには、Redshiftデータベース管理者(DBA)に連絡し、以下を行ってもらいます。 デフォルトでは、クラスターを起動したときに作成したマスターユーザーのみがクラスターの初期データベースにアクセスできます。ほかのユーザーにアクセス権を付与するには、1つ以上のユーザーアカウントを作成する必要があります。データベースのユーザーアカウントは、個々のデータベースに属するものではなく、クラスター内のデータベースすべてにわたって使用できます。 CREATE USERコマンドを使用して、データベースの新規ユーザーを作成します。新規ユーザーを作成する際に、新規ユーザーの名前とパスワードを指定します。パスワードは必須です。8から64文字で、また大文字と小文字、数字がそれぞれ1つ以上含まれている必要があります。 例えば、ユーザー名をGUESTにし、パスワードをABCd4321にする場合、次のコマンドを使います。create user guest password 'ABCd4321';
IPアドレスをホワイトリストに登録する
また、Redshiftデータベースに接続する前に、接続先となるデータベースサーバーのポートで使用するIPアドレスをいくつかホワイトリストに登録する必要があります。IPアドレスの詳細なリストは、「 コネクターのIPアドレスをホワイトリストに登録する 」を参照してください。Redshiftアカウントに接続する
このセクションでは、Amazon Redshift Partitionコネクターページの [認証情報] および [詳細] ペインのオプションについて説明します。このページのほかのペインの項目にある [スケジュール設定] や [DataSetの名前を付け説明を入力] に関しては、ほとんどのタイプのコネクターで共通しています。詳細については、「 データコネクターを使用してDataSetを追加する 」を参照してください。[認証情報]ペイン
このペインには、Redshiftデータベースに接続する認証情報の入力フィールドが含まれています。下表では、各フィールドに必要な内容を説明しています。フィールド | 説明 |
|---|---|
| JDBCドライバー | 接続に使用するJDBCドライバーを選択します。 |
| ホスト | SQLデータベースに接続するためのホスト文字列を入力します。例: // examplecluster.cpdbcwb2mzr4.us-east-2.redshift.amazonaws.com |
| データベース | データベース名を入力します。 |
| ユーザー名 | Redshiftユーザー名を入力します。 |
| パスワード | Redshiftパスワードを入力します。 |
| データベースポート | データベースのポート番号を入力します。 |
| 証明書書式 | 証明書書式を選択します。証明書を含めない場合は、 [証明書なし] を選択します。 [証明書文字列] を選択する場合は、証明書用テキストを [証明書] フィールドに貼り付ける必要があります。 [URLパス] を選択する場合は、証明書がある場所のURLを [証明書] フィールドに入力する必要があります。 |
| 証明書 | CA証明書用テキストを貼り付けるか、証明書がある場所のURLを入力します。これはオプションです。証明書を含めない場合は、 [証明書書式] メニューで [証明書なし] を選択します。 |
[詳細]ペイン
このペインでは、SQLクエリを作成して、データベースからデータを取得します。特定のデータベース表とパーティション列の名前を選択できます。データを取得する過去の日数も指定できます。メニュー | 説明 |
|---|---|
| クエリ | 実行するSQLクエリを入力します。例: select * from Employee |
| データベース表 | レポートに表示するデータベース表を選択します。 |
| パーティション列の名前 | パーティション列の名前を選択します。 |
| 過去日数 | データを取得する過去の日数します。値はXとすることができ、この場合Xは正の整数です。例:30。 |
| 日付形式 | 必要な日付形式を選択します。デフォルトでは、 yyyy-MM-dd が使用されます。 |
| カスタマイズされた日付 | データに適用するカスタマイズされた日付形式を入力します。 |
| フェッチサイズ | メモリのパフォーマンスのフェッチサイズを入力します。空白の場合、デフォルト値は400です。 |
その他のペイン
スケジュール設定、再試行、更新に関するオプションなど、コネクターインターフェースのその他のペインに表示されるオプションについては、「 データコネクターを使用してDataSetを追加する 」を参照してください。トラブルシューティング
接続問題が発生した場合は、- pgAdminを使用して接続を確認します。
- 必要なすべてのDomo IPがホワイトリストに登録されていることを確認します(上述の「 IPアドレスをホワイトリストに登録する 」を参照してください)。
- SQLクエリでプロファイルを実行します。