1. はじめに
こんにちは。NewITソリューション部の辻です。
昨今では、ビジネスにおいてデータ活用の重要性が高まっています。
大量のデータを効率的に分析し、迅速に意思決定を行うことが求められている中で、役立つツールの一つがMcirosoftの統合データ分析ツール「Microsoft Fabric」です。
本記事では、Microsoft Fabricの概要や基本的な構成要素、料金体系について解説します。
2. Microsoft Fabricとは
Microsoft Fabricは、データ分析とAIを統合した包括的なSaaS型の統合分析プラットフォームです。
Power BI、Azure Synapse Analytics、Azure Data Factoryなどの機能を統合し、シームレスなデータ管理を実現します。
また、AIと機械学習の機能も備えており、高度な分析や予測モデルの構築も可能です。
クラウドベースで提供されていて、スケーラビリティと柔軟性に優れているため、企業規模や業種を問わず幅広く活用できます。
Microsoft Fabricの主要な特徴は以下のようなものがあります。
- オールインワンプラットフォーム
- 多様なデータ分析ツールと機能が一つのプラットフォーム内で提供されます
- SaaS化
- クラウド上のサービスとして提供され、利用者はインフラに関わる心配なくデータ分析を行えます
- セキュリティとガバナンスの一元管理
- 企業レベルのセキュリティを備え、様々な業界基準や規制に準拠しているため、機密性の高いデータを扱えます
このようにMicrosoft Fabricは、データとAIを中心としたDXを推進する企業にとって、非常に有力なツールとなっています。
3. Microsoft Fabricの構成要素
ここでは、Microsoft Fabricを構成する主要コンポーネントについて紹介します。
OneLake
OneLakeは、Microsoft Fabricの中核を成すコンポーネントであり、SaaSベースのデータレイクです。
Microsoft 365アプリケーションなどがOneDriveに接続されているのと同様に、全てのMicrosoft Fabricワークロードと自動的に連携します。
非構造化データや半構造化データを含む大量のデータを保存するのに適しており、Delta-Parquet形式でデータを格納します。
これらにより、異なるコンピューティングエンジン間でデータのやり取りを行う場合でもデータのインポートやエクスポートの必要がないため、データ形式の整形を省略できたり、部門間のデータ連携が容易にできるなどのメリットがあります。
Data Factory
Data Factoryは、豊富なデータソースからデータを取込、準備、変換するためのプロセスを作成します。
Power Queryが組み込まれており、多くのコネクタを使用してクラウドやオンプレミスのデータソースに接続できます。
また、パイプラインを作成することで、データのコピーやデータフローの更新、ループや条件などのロジックを作成することができます。
Synapse Data Engineering
Synapse Data Engineeringは、Apache Sparkを活用した高度なデータ処理環境です。
「レイクハウス」というデータを格納できるデータストアを作成でき、Python、SQL、Rなどの言語を利用して、データ変換やデータ分析、機械学習に使うことができます。
Synapse Data Science
Syanapse Data Scienceは、データサイエンスのためのツールとサービスを提供しており、機械学習モデルのトレーニングやデプロイ、管理を行うことができます。
また、Azure Machine Learningと統合しており、組み込みの実験追跡やモデルレジストリを提供しています。
Synapse Data Warehouse
Synapse Data Warehouseは、高性能なSQLパフォーマンスとスケールを提供しています。
CSVなどの構造化データを格納でき、T-SQLによるクエリを利用することで、大規模データを高速に分析することができます。
データストアについては「レイクハウス」や「データウェアハウス」など様々ありますが、データ規模や、種類、利用用途によって適切なものを選択するのが良いでしょう。
Synapse Real-Time Analytics
Synapse Real-Time Analyticsは、ストリーミングデータの高速処理と分析を実現するツールです。
主にIoTデバイスやログなどから生成される大量の半構造化データをリアルタイムで処理し、低遅延で分析することができます。
これによりデータからのインサイト抽出や、適切なビジネス意思決定を行うことができるようになります。
Data Activator
Data Activatorは、リアルタイムでのデータ監視や自動的なアクション機能を提供します。
指定されたデータパターンを検出した後に、通知を送信したり、事前に設定したアクションをトリガーすることができます。
コードレスで操作できるため、技術的な専門知識がなくても高度なデータ監視と自動化が実現できます。
4. Microsoft Fabricの価格体系
Microsoft Fabricの価格は以下要素によって決定されます。
- Microsoft FabricのCapacity
- OneLakeの容量
- Power BIのライセンス料
- データ通信料
主な料金はCapacityであるため、データを単一リージョンに格納する設計と、必要なコンピューティングリソースに応じてSKUを設定すれば、適切な料金で利用することが可能です。
Microsoft FabricのCapacity
Microsoft Fabricは、保存されたデータを利用して様々な処理や分析を行う機能を有しており、そのために必要なコンピューティングによって価格が変動します。
Microsoft Fabricの容量価格については、事前に1年分の使用量に関する予約をコミットすることで、約40%程度のコストを節約することができるようになっています。
また、試用として60日間の無料期間も設けられており誰でも利用が可能です。
OneLakeの容量
OneLakeのストレージは、使用したデータのGB毎に従量課金が発生します。
「レイクハウス」や「データウェアハウス」などのデータストアは基本的にOneLake Storageを利用します。
OneLake BCDRは障害復旧に関してより有効な設定です。
BCDRが有効になっている場合、データは複製され、2つの地理的リージョンに保存されるgeo冗長となります。
OneLake キャッシュは、KQLキャッシュストレージやData Activatorで保持されるデータなどに掛かるものになります。
Power BIのライセンス料
個々のユーザーがMicrosoft Fabricで作業するためにはライセンスが必要です。
これはPower BIライセンスと共通しており、プランによって作成可能なコンテンツや共有出来る範囲が変わります。
データ通信料
Microsoft Fabricで扱うデータは、各リージョン毎のデータセンターに保持されています。
基本的に同じデータセンター内の転送であれば無料ですが、大陸内・間で異なるデータセンターでデータ転送を行う場合は料金が発生します。
5. まとめ
今回は、Microsoft Fabricの概要や各機能、料金体系について説明しました。
Microsoft Fabricは、データの収集から処理、分析、共有まで一つのプラットフォームで実現できるため、より効率的で高度なデータ活用が可能です。
データはAIを利用する上で欠かせない要素であり、その価値は今後も更に高まっていくと考えられます。
Microsoft Fabricを活用することで、より強固なデータ基盤を構築し、ビジネスの意思決定やイノベーションを加速させていくことができるようになるでしょう。
弊社では、クラウドやAIを中心としたシステムを提供しております。
ご興味をお持ちいただけましたらお気軽にお問合せいただけると幸いです。