s3をちゃんと調べてみた


勉強前イメージ

バケットごとにデータを保存していくAWSのサービスって概要は知ってる
データの保存方法とかストレージクラスとか細かいところがわからん
今回は知りたいこと中心に書いてます。

調査

s3とは

Simple Storage Service の略で、AWAのサービスの一つです。
破格な安さと、99.999999999%という耐久性を兼ね揃えています。

用語

  • バケット
    • バケットはデータを置いておく箱のようなもの
    • バケットはs3の中で一番大きな単位
    • バケットは複数作成し、用途ごとに分けることが出来る
    • バケットごとにアクセス制御を行う
    • バケット作成時にリージョン指定を行うことが出来る
  • オブジェクト
    • オブジェクトはアップロードするデータのこと
    • バケットに格納されるのがオブジェクト
    • オブジェクトにはキーとバージョンIDによってバケット内で一意である
  • キー
    • オブジェクト(アップロードデータ)の固有識別子
    • オブジェクト1つに1つキーが割り振られる

ストレージクラス

S3 標準(高頻度アクセスの汎用ストレージ用)

  • 低レイテンシーで高スループットなパフォーマンス
  • 複数のアベイラビリティーゾーンにわたってオブジェクトに耐久性 99.999999999% を達成するよう設計
  • 1 年で可用性が 99.99% になるように設計
  • → いわゆる普通のやつ

S3 Intelligent-Tiering(未知のアクセスパターンのデータ、またはアクセスパターンが変化するデータ用)

  • アクセスパターンが変化したときに 4つのアクセス階層の間でオブジェクトを自動的に移動することで、コストを削減するストレージクラス
  • アクセス階層
    • アクセス用に最適化された 2つの低レイテンシーのアクセス層
    • 非同期アクセス用に設計された 2つのアーカイブアクセス層
  • 30日間オブジェクトを監視して、適するアクセス層に移動します

S3 標準 – 低頻度アクセス(S3 標準 - IA)

  • アクセス頻度が低いデータ向け
  • 長期保存、バックアップ、災害対策ファイルのデータストアとして適している

S3 1 ゾーン - 低頻度アクセス(S3 1 ゾーン - IA、長期間使用するが低頻度アクセスのデータ用)

  • アクセス頻度が低いデータ向け
  • 通常3つのAZに保存しているが、1つのAZにのみ保存するのでコストを削減できる
  • オンプレのデータのバックアップやセカンダリバックアップなどに適している

Amazon S3 Glacier(S3 Glacier)

  • データのアーカイブに適している
  • 低コストでセキュリティや耐久性が高い
  • 取得時間を設定可能

Amazon S3 Glacier Deep Archive(S3 Glacier Deep Archive、長期アーカイブおよびデジタル保存用)

  • 最も低コストのストレージクラスであり、1年のうち 1,2回しかアクセスされないようなデータに適しています
  • 長期間のデータを保存し、あまりアクセスしないデータを対象としている
  • 取り出し時間は 12 時間以内

S3 Outposts

  • オンプレ環境でデータを管理
  • S3 Object 互換性、および、S3 SDK を介してのバケット管理が行われる

バージョニング

  • 同じバケット内でオブジェクトの複数のバリアントを保持する
  • バージョニングが有効なバケットでは、誤ってオブジェクトを削除したり上書きした際でも復元できる
  • 固有のバージョンIDが割り振られる
  • デフォルトでバージョニングは無効
    • 一度バージョニングを有効にすると無効には戻せないが、停止させることは出来る

ライフサイクルポリシー

  • 別の ストレージクラス にオブジェクトを移行する・削除するタイミングを定義すること
  • 2通りのアクションがある
    • 移行アクション
      • 別のストレージクラスにオブジェクトを移行するタイミングを定義
    • 有効期限アクション
      • オブジェクトの有効期限を定義します。Amazon S3 はユーザーに代わって有効期限切れのオブジェクトを削除します。

レプリケーション

  • 異なるバケット間で自動的に非同期コピーが出来る
  • 同一アカウントOK、別アカウントにコピーもOK
  • 同一リージョンでもOK、別リージョンでもOK
    • 同一リージョン : 同一リージョンレプリケーション(SRR)を使用
    • 別リージョン : クロスリージョンレプリケーション(CRR)を使用
  • メタデータを保存しながらのレプリケーション
  • 別のストレージクラスにレプリケーションも出来る
  • オブジェクトを別のAWSアカウントの所有権に変更できる(所有権オーバーライドオプション)
  • S3 Replication Time Control (S3 RTC) を使用して、15分以内にレプリケーションが出来る

勉強後イメージ

ストレージクラスが、1,2個かなって思ってたらめっちゃあった...
実際に手を動かして、ストレージクラスの変更させたり、ライフサイクル設定したり、レプリさせたりしないとピンとこないかもー
それにしても、s3ってこんないっぱい機能あったなんて知らなかった

参考