kikeda1104's blog

備忘録・技術に関することを書いています。(webエンジニア)

Redshiftの環境構築

Redshiftの環境構築について書いていきます。

前提

  • RedShift

  • データサイズが増加量を計測して毎月1GB増える

  • 将来的にデータサイズが、クラスターのストレージを超える可能性も検討してサイズ変更ができるように設計
    • Snapshotを利用したデータサイズの変更により停止せずにスケールを予定する。

構築

サービスから「Amazon Redshift」を選択する。

クラスターを起動」を選択。

f:id:kikeda1104:20180704213108p:plain

項目を入力する。
  • クラスター識別子: my-dw-instance
  • データベース名: mydb (省略するとdev)
  • データベースポート: 5439
  • マスタユーザ名: awsuser

f:id:kikeda1104:20180704212800p:plain

f:id:kikeda1104:20180704213555p:plain

f:id:kikeda1104:20180704214030p:plain

f:id:kikeda1104:20180704214039p:plain

確認画面になりますので、「クラスターの起動」を選択します。

IAM(ロールを作成)

aws cliからCOPYコマンドを実行するために、ロールを登録します。

サービスから「IAM」を選択する。 「ロール」-> 「ロール作成」を選択

f:id:kikeda1104:20180704214749p:plain

「Redshift」 -> 「RedShift -Customizable」を選択して「次のステップ: アクセス権限」

「AmazonRedshiftFullAccess」、「AmazonS3ReadOnlyAccess」を割り当てます。

「次のステップ: 確認」を選択する。

f:id:kikeda1104:20180704225012p:plain

  • ロール名: ClientForRedshift
  • ロール説明: デフォルト
  • 「ロールを作成」を選択します。
概要
  • このロールのARNをRedShiftのコマンドで利用する(今回はここまで) f:id:kikeda1104:20180704225508p:plain

RedshiftにIAMをsyncする。

サービスから「Amazon Redshift」を選択する。

クラスターをチェックボックスをチェックして、「IAMロールの管理」を選択。

追加したロール「ClientForRedshift」を選択して、「変更の適用」を選択。

クラスターステータスが、「使用可能」になれば完了です。

費用感

無料枠の場合は、750時間まで無料になっており、複数ノードの場合はより速く無料期間が無くなります。

ちなみに、(2018/07/04時点では) タイプ別の費用感はこちら。 f:id:kikeda1104:20180704212351p:plain

参考

料金 - Amazon Redshift(ビッグデータ向けデータウェアハウス)|AWS