1. はじめに
こんにちは。NewITソリューション部のエンジニアの齋藤です。
昨今、データ活用の重要性が高まっており、データを効率的に収集・分析し、ビジネスの意思決定を行うことが必要になっています。
そんなときに役立てるツールの1つが「Azure Synapse Analytics」です。
本記事では、「Azure Synapse Analytics」の概要から基本的な使い方まで行います。
2. Azure Synapse Analyticsとは
Azure Synapse Analyticsとは、Microsoft Azure 上で稼働するデータ統合・分析プラットフォームです。
データの収集、蓄積、加工、分析などデータ活用の一連のプロセスの機能をまとめて実現できるサービスです。
3. Azure Synapse Analyticsでできること
Azure Syanapse Analyticsでは、次のような特徴があります。
- 大規模データの収集、蓄積、分析までできる
- 構造化データや非構造化データなど様々な形式のデータを収集、蓄積、変換、分析までまとめて行えます。
- リアルタイム分析が可能
- Azure Cosmos DBのAzure Synapse Linkなどを使えば、データストアからリアルタイムでデータを分析することも可能です。
- BIや機械学習との統合
- Power BIやAzure MLなどと統合すれば、データの可視化やモデル構築などが容易にできるようになります。
- 多くの言語を使用可能
- T-SQL、KQL、Python、Spark SQL、.Netなどの多数の馴染のある言語を利用できます。
4. Azure Synapse Analyticsのサーバーレス SQL プールを使用してみる
ここでは実際に、組み込みのサーバーレスSQLプールを使用して、簡単なSQLを実行します。
※事前にAzure Synapse Analyticsのリソースが作成されている必要があります。リソース作成後、Synapse Studioを起動します。
- まず、Synapse Studioで[Develop]>[+]から[SQLスクリプト]を選択し、新しいSQLスクリプトを作成します。
- 次に、以下のコードをスクリプトに貼り付けます。
contosolakeをストレージアカウントの名前に更新し、userをコンテナーの名前に更新します
※今回はMicrosoft Learnで使用しているサンプルデータを使用します。下記スクリプトを実行するには、こちらのデータをSynapse Studio の[Data]ハブから事前にアップロードが必要です。
参照:
SELECT
TOP 100 *
FROM
OPENROWSET(
BULK ‘https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet’,
FORMAT=’PARQUET’
) AS [result]
5. まとめ
以上、Azure Synapse Analyticsの概要と簡単な使い方を説明しました。
今回のスクリプトの例では、単純なクエリの実行を行いましたが、複雑なクエリを組めばより詳細な分析も可能となります。
SQLだけでなくPower BIやAzure MLなどの機械学習とも統合ができるため、今後はこれらにも挑戦してみたいと思います。
弊社ではクラウドやAIを中心としたシステムを提供しております。
ご興味をお持ちいただけましたらお気軽にお問い合わせいただけると幸いです。