ウェアハウスの概要
弾力的な CelerData クラスターにおけるウェアハウスは、クエリ、インジェスト、およびデータ処理タスクを実行するために必要な CPU、メモリ、一時ストレージなどのコンピュートリソースを提供するコンピュートノードのグループです。各ウェアハウスは個別のコンピュートリソースプールとして機能し、コンピュートリソースを物理的に分離することができます。
弾力的な CelerData クラスターでは、データは複数のウェアハウス間で共有されますが、異なるウェアハウスはコンピュートおよびメモリリソースの物理的な分離を維持します。そのため、アドホッククエリ、ETL、Compaction など、異なるビジネスニーズに合わせた複数のウェアハウスを作成し、特定のタスクをそれぞれのウェアハウスに簡単にルーティングすることができます。
利点
マルチウェアハウスは次のような利点をもたらします:
-
リソースの分離
マルチウェアハウスは、コンピュートリソースのより細かいスケジューリングを可能にします。異なるタスクを異なるウェアハウスに割り当てることで、コンピュートリソ ースの物理的な分離を確保します。
-
データ共有
複数のウェアハウスは共通のデータストレージを共有でき、認可されたユーザーがどのウェアハウスからでもシームレスにデータにアクセスすることができます。
-
水平スケーラビリティ
コンピュートリソースの需要が増加する際に、ウェアハウスにコンピュートノードを簡単に追加できます。既存のウェアハウスで実行中のタスクは、スケーリング中に中断されません。
ユースケース
マルチウェアハウスは次のシナリオで活用されます:
-
多様なビジネスワークロード
異なる種類のワークロードを異なるウェアハウスに割り当て、コンピュートリソースを物理的に分離できます。例えば、クエリアナリティクスを実行するウェアハウスと ETL 処理を行うウェアハウスを分けることで、それぞれのリソース利用を最適化します。
-
バックグラウンドタスクの分離
Compaction などのバックグラウンドタスクを専用のウェアハウス内で分離して実行することで、通常の操作に影響を与えないようにします。さらに、コストとパフォーマンスのバランスを取るために、必要に応じてウェアハウスのリソースを調整できます。
使用上の注意
各弾力的な CelerData クラスターには、default_warehouse
という名前の組み込みウェアハウスが提供されており、クラスターを作成すると自動的に作成されます。ウェアハウスが明示的に指定されていない場合、すべての DML ワークロードはデフォルトウェアハウスにルーティングされます。アクセス制御はなく、クラスター内のすべてのユーザーが使用できます。デフォルトウェアハウスは、コーディネーターノードから個別に削除または停止することはできません。クラスターが停止されるときにのみ停止されます。
一部のシステムバックグラウンドタスクは、デフォルトウェアハウス内でのみ実行されます。これらのバックグラウンドタスクは次のとおりです:
- Compaction
- SUBMIT TASK
- Pipe
- 統計収集
- 動的パーティション作成
- Schema Change
- AutoVacuum (Compaction 後のガーベジコレクション)
- ガーベジコレクション
- SHOW DATA の統計レポート
- 非同期マテリアライズドビューのリフレッシュ
- ANALYZE TABLE