はじめに
Azure Synapse Analyticsのコスト構造について書いてみました。
普段、あまりかかわることのないサービスだと思いますが、実際に利用する際のコストは大きいため、実際に利用するときのコストについて解説してみました。
もし、この記事がAzure Synapse Analyticsを利用する際の参考になれると嬉しいです。
Azure Synapse Analyticsとは
Azure Synapse Analyticsは文字通り「Analytics」データ分析するためのサービスとなります。
主に、小売業界や医療業界、金融などデータを多く利用する業界で利用されます。
Azure Synapse Analyticsで発生するコスト
Azure Synapse Analyticsを利用すると発生するコストは3つにわけることができます。
コストの目安金額も記載しているので実際に利用するときの参考にしてみてください。
※為替に左右されるため、必ずその金額になるわけではないことに注意ください
【データ統合コスト】外部からのデータ取り込みとデータ転送時に利用
1. 対象のリソース
■Data Factory
・Pipelines
・Mapping Data Flows
2.コスト
性能×利用時間
例)①Pipelinesの料金:性能(Azureホステッド)×利用時間
238円~/時間
②Mapping Data Flowsの料金:性能(Basic)×利用時間
320円~/時間
③データ移動のコスト:転送したデータ量 1GB 38円~
【ストレージコスト】データの保管に利用
1.対象のリソース
■Relational DB(DW)
■Data Lake Storage Gen2
2.コスト
保管するデータ量によってコストが異なる
例)①DWに1TBのデータを保存: 1TB 約3,500円/月
②Azure Data Lake Gen2に1TBのデータを保存:(ホット層、ローカル冗長)1TB 約3,200円/月
合計(①+②):3,500+3,200=6,700円/月
【計算処理コスト】データを分析するとに利用
1.対象リソース
■専用SQLプール
■サーバレスのSQLプール
■Apache Sparkプール
2.コスト
データ分析に利用する性能と利用時間または分析するデータ量によってコストが発生
例)サーバレスのSQLプール:分析したデータ量 1TBあたり 765円~
専用SQLプール:性能(DWU)×利用時間 231円~/時間
Apache Sparkプール:性能(ノードサイズ)×利用時間 85円~/時間
Azure Synapase Analyticsコスト削減方法
実際に利用するときに無駄なコストを発生させないようにするための方法を主に3つ紹介します!
※他にも削減方法はあるため、必要に応じて検討しましょう。
1.Azure Synpaseコミットユニット(SCU)の利用
計算処理コスト(SQLプール、Apache Sparkプール)とデータ統合コスト(Pipelines、Mapping Data Flows)に利用することができます。
事前購入プランとなり、1年分の利用料金を事前に購入します。
利用することで従量課金制の料金よりも最大26%コスト削減することができます。
※購入後のキャンセルと交換ができないです
2.適切なストレージ層の選択、不要なデータの削除
ストレージアカウントはホット層、クール層、アーカイブ層を適切に選択することが重要です。
コストは ホット層 > クール層 > アーカイブ層 となっており、ホット層がコストが一番
高いため、ホット層を利用している場合、クール層で問題ない場合は、ストレージ層を変更すること
を検討してみましょう!
また、ストレージアカウント内に不要なデータがある場合、余分にコストが発生してるため、
不要なデータがある場合は削除しましょう。
3.データ転送時のデータを圧縮
データ転送時にGZIPなどを利用することで転送量を減らすことができるため、データ転送時に発生す
るコストを削減することができます。
最後に
今回は、Azure Synapse Analyticsのコスト構造について書いてみました。
コスト構造を知っておくことで「思わぬコストが発生してる!」「想定よりもコストが高い!」という事態にならないようにするためにも、この記事が
Azure Synapse Analyticsを利用するときのコストの参考になれば嬉しいです。
最後まで読んでいただきありがとうございました。