はじめに
各Data Assemblerジョブには、6つの考慮すべき主要条件があります。ジョブがこれらの条件を満たしていないと、ジョブの安定性とデータの有効性が侵害される可能性があります。 このページのガイドラインをPDF形式でダウンロードするには、こちらをクリックします: DataAssemblerUseGuildines.pdf このコンテンツをWordドキュメントとしてダウンロードするには、こちらをクリックします: DataAssemblerGuidelines.docx使い方のガイドライン
パーティションの平均サイズ
- これは合計の行カウントをパーティション数で割ることで計算できます。
- パーティションキーは、平均パーティションサイズができるだけ大きくなるように選択するする必要があります。
- 理想的なパーティションの平均サイズは10万行を超えていますが、パーティションあたり、最低5万行を推奨します。
入力比率
- これは、DataSetの出力に対するDataSetの入力の比率です。これは実行中に更新されるデータの量を表し、できるだけ小さくする必要があります。
- 1%以下を推奨していますが、この割合は10%未満である必要があります。
更新頻度
- Data Assemblerは1日1回データを更新するために使用されます。
- 1日4回以下の実行を強くお勧めします。
- Data Assemblerを使用して1時間に1回以上データを更新するべきではありません。
実行ごとに更新するパーティション数
- 各実行中に多数のパーティションが更新される場合、Data Assemblerを使用してはいけません。
- 毎日実行するジョブは100以上のパーティションを更新すべきではありません。
- 1日1回より多く実行するジョブは10パーティションを超えてはいけません。
スキーマの変更
- 入出力DataSetのスキーマは変更すべきではありません。Data Assemblerはある程度のスキーマの変更を扱うことができますが、データが壊れてしまう可能性があるので、このツールを使用して変更をすることをお勧めしません。
データ全体のサイズ
- データサイズが1,000万行未満の場合、これらのDomo機能には柔軟性が追加されるため、通常は標準のDataFlowオプションを使用することをお勧めします。
その他のヒント
- 新しいジョブを作成する時は、手動スケジュールで開始します。ジョブ作成の準備ができていることが確認されたら、必要に応じてスケジュールを変更します。
- トリガーは必要なときにのみ使用してください。スケジューリングオプションを先に使用することをお勧めします。
- 定期的にジョブをレビューします。もう必要のないジョブを無効にするか削除します。
- 大きな履歴に関する塗りつぶしジョブ(1億行を超える)を処理する時は、履歴を小さなDataSetに分割することを検討してください。エラーが発生した場合、ジョブの失敗が起こったデータの部分でジョブを再起動することができます。