AWSにおけるDataSunriseの導入及び初期設定
はじめに
こんにちは。
現在私は社内のデータ分析基盤の刷新に取り組んでいます。
この記事は以下の要件を満たしてくれそうな製品であるDataSunriseを検証すべく、
まずは導入してみようという内容です。なお環境はAWSでEC2を用います。
マスキングを試したみた記事はこちら
- 要件
- DB内のセンシティブなデータはマスキングしたい
- リアルタイムに更新されるDBにアクセスしたい(※)
※現状マスキングは日次バッチ処理であり、データ分析担当はマスキング後のDBにしか触れられない状況にある
DataSunriseとは
- コーポレートサイト
-
公式ドキュメント
-
DataSunriseはDBに接続するユーザー/アプリの間のプロキシとして動作し、様々な機能を提供してくれるソフトウェアです(以下要約です)
- データ監査
- ユーザ/アプリのアクションやQuery、およびその結果を保存する機能(Export可)
- データ保護
- トラフィックを分析し、SQLインジェクション等の不正なQueryや認可されてQueryを防止する機能
- データマスキング
- 動的/静的なマスキングを提供し、センシティブなデータを保護する機能
-
データ検出
- DB内のセンシティブなデータを検出する機能
(公式ドキュメント1.1 ProductDescriptionより)
ちなみに
公式ドキュメント
DataSunriseはDBに接続するユーザー/アプリの間のプロキシとして動作し、様々な機能を提供してくれるソフトウェアです(以下要約です)
- データ監査
- ユーザ/アプリのアクションやQuery、およびその結果を保存する機能(Export可)
- データ保護
- トラフィックを分析し、SQLインジェクション等の不正なQueryや認可されてQueryを防止する機能
- データマスキング
- 動的/静的なマスキングを提供し、センシティブなデータを保護する機能
-
データ検出
- DB内のセンシティブなデータを検出する機能
(公式ドキュメント1.1 ProductDescriptionより)
これまでそれとなくマスキングを扱っていましたが、動的/静的なる分類があることを今回初めて知りました。
- 静的なデータマスキング(Static Data Masking)
- オリジナルのDBからコピーを作成し、コピーしたDB内のデータ自体を書き換え、機密データを永続的に置き換えること
- 動的なデータマスキング(Dynamic Data Masking)
- 元データには手を加えず、送信中の機密データを一時的に非表示乃至は置換すること
当社の分析担当者が現状アクセス可能なのは静的マスキングされたDB(に近いもの)と言え、希望するのは動的マスキングされたDBと言えるでしょうか。
DataSunrise導入
この記事ではAWS環境を想定していますが、DataSunrise社はAzure等でもイメージを提供しているようです。
1.事前準備
- 接続先のDB
- DataSunrise初期設定時、hostやID/PW等の接続情報を入力することになります
- あとから別のDBを追加することも可能です
- DataSunrise初期設定時、hostやID/PW等の接続情報を入力することになります
- 任意のVPC環境
- 対象DBへ接続できる環境を用意しておきましょう
2.EC2インスタンスの作成
-
AMIが提供されているのでこれを活用します(有料です)
- AMI選択にてDataSunriseのAMIを検索する
-
DataSunrise Database and Data Security w/ Hourly Billing
がライセンス込みのAMIです-
DataSunrise Database & Data Security (Linux)
はBYOL制のAMIなので別途ライセンス購入する場合はこちらを選択 - https://aws.amazon.com/marketplace/seller-profile?id=880a5857-74c1-44ea-a978-094093c08788
-
-
諸々設定しインスタンスを作成
3.DataSunrise初期設定
- DataSunrise管理画面にアクセス
- Step3: Static Masking Key
-
Step4: Database Parameters
4.SSL対応
- 今回は動作の検証がメインの為割愛します
- 実施する際はドキュメントの
3.3 SSL Certificates
に記載があります
- 実施する際はドキュメントの
5.ハマったポイント
- 上述した、proxyのポート設定を接続したいDBのポートと一致させてはいけないルールでハマりました
- 当初3306としており接続できなくて焦った(一先ず33066とした)
- プロキシ経由でアクセスするには以下のようにする
mysql -h [DataSunriseインスタンスのhost名] -u [ユーザ名] -p -P [proxyのポート番号]
- 例
mysql -h 127.0.0.1 -u root -p -P 33066
-
設定変更手順は次の通り
まとめ
admin以外のユーザ設定やSSL等、その他必要な設定は山積みですが、
DataSunriseを噛ませてのDBアクセスが可能になりました。
また、今回はGUIベースでの設定を行いましたが、
CLIも準備されているうえにCloudFormation等での環境構築も可能なようなので、
中々幅広いニーズに対応してくれそうな印象です。
Reference
Author And Source
この問題について(AWSにおけるDataSunriseの導入及び初期設定), 我々は、より多くの情報をここで見つけました https://qiita.com/t_odash/items/5792cd2aaf6adda6b4a2著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .