Azure 分析基盤サービスとして以下のような様々なサービスが存在します。
- Microsoft Fabric
- Azure Databricks
- Azure Synapse Analytics
- HDInsight
- Azure Stream Analytics
- Azure Data Lake Analytics
今回は、その中の一つである「Microsoft Fabric」について、自分の整理も兼ねてまとめてみようと思います。
Microsoft Fabric とは
Microsoft Fabric は、データ活用、分析に必要となる複数のワークロードを一つにまとめた 統合データプラットフォーム (SaaS) となります。
統合された各ワークロードについて
Microsoft Fabric では、現時点(2024年2月時点)において、7個のワークロードが統合されています。
Microsoft Fabric メリット
Microsoft Fabric は以下の点でメリットがあるのではないかと思います。
- 共通のインターフェースによるデータ分析が可能
・データエンジニア、データサイエンティスト、データアナリスト、データ スチュワードなどの異なるロールのエンジニアが共通のインターフェーズ上でデータの取得、加工、分析、視覚化を実施することが可能となり、効率的に各エンジニア間のやり取りを進めることが可能。 - 各ワークロードで Microsoft Fabric の コンピューティング プール を共有して利用が可能 (最小分単位の従量課金もしくは予約)
- OneLake によるデータ統合が可能
・統合されたすべてのワークロードは、OneLake 上に配置されたデータを共有して利用可能。
・Microsoft 365 とも統合されており、Microsoft 365 上のデータ (洞察データなど) をシームレスに取得可能。
・ミラーリング機能により、Azure CosmosDB、Azure SQL Database、Mongo DB、Snowflake などのデータを OneLake 上に複製および自動同期させることで、ほぼリアルタイムのデータを分析可能。 - OneLake ショートカット機能によるデータアクセスが可能
・Azure Data Lake Storage Gen2、Dataverse、Amazon S3、Google Storage 上のファイルを OneLake にコピーすることなくアクセスして利用することが可能。 - Azure AI Studio、Azure OpenAI、Azure Databricks などのその他 Azure サービスから安全に OneLake 上のデータにアクセスすることが可能。
- Copilot in Microsoft Fabric により各ワークロードの作業の効率化が可能 (コードの自動生成など)
- OneLake を 生成AI アプリケーションの RAG データソースとして利用可能。
- Azure AI の各種サービス (Azure OpenAI、Text Analytics、Azure AI Translator など) の事前構築済みの AI モデルを Microsoft Fabric 上 (Notebook など) で利用することが可能 。
まとめ
今回は、Microsoft Fabric の概要についてまとめてみました。Microsoft Fabric の OneLake にデータを統合することで、効率的なデータの取得、加工、分析、可視化が可能となったり、異なるロールを持つエンジニア間の連携がスムーズになったり、Azure AI (Azure OpenAI 含む)、Microsoft 365 と密に統合されているため、統合したデータの AI 分析などが簡易に実現できる点などの様々なメリットがあるのではないかと思います。
また、各ワークロードで利用される コンピューティング リソース についても、Microsoft Fabric でプールされているリソースを共有して利用でき、かつ、最小 分単位の従量課金で利用できる点も良い点だと思います。
次回以降で、OneLake についてもう少し詳しく整理してみようと思います。
【第2回】基本から始める Microsoft Fabric【試用版申し込み】へ
※ 2024年2月時点