認定ビッグデータ - 専門知識 勉強記~RedShift~


今回は RedShift に関する勉強記録となる.なお,記事は適宜更新していく.

基本情報

特徴
* リーダーノードと、コンピューターノードがいる
* データサイズは最大2PB
* 超並列(MPP)、列型志向DBエンジンによる高速SQL処理
* スケールアウト可能(最大128台)
* PostgreSQL との互換
* 管理機能がビルトインされている
* バックアップ機能:スナップショットをS3に保存
* Workload Management:実行に長い時間をようするクエリ(ロングクエリ)クラスタ全体のボトルネックとなり、ショートクエリを持たせる可能性がある.WLMで用途ごとに、クエリー並列どの上限を設けた複数のキューを定義することでクエリー処理の制御が可能.