U「データはあるのに活用できていない」という声をよく耳にします。データウェアハウスとBIツールは、散在するデータを集めて経営判断に使える形に変える仕組みです。DWH・OLAP・データマートの関係を、図書館と司書のたとえで整理してみました。
この記事でわかること
- データウェアハウス(DWH)の役割とOLTPとの違い
- ETL処理(抽出・変換・格納)の意味
- データマートとOLAP(多次元分析)の仕組み
- BIツール(Business Intelligence)の機能と活用場面
- データレイク・データ活用の最新トレンド
目次
DWH——分析専用のデータ倉庫
データウェアハウス(DWH)とは
業務システム(ERPや基幹系)から大量のデータを集め、経営分析・意思決定支援のために最適化した専用データベース。図書館のたとえ:
・業務システム(OLTP)=図書館の貸出窓口(日々の取引を素早く処理する)
・データウェアハウス=書庫(すべての本を整理して蓄積、横断的に調べられる)
・データマート=各部門の専門コーナー(営業部用・財務部用に切り出した小さな倉庫)
OLTPとOLAPの違い:
OLTP(オンライントランザクション処理):日々の取引・業務処理に特化。高速・小規模
OLAP(オンライン分析処理):大量データの集計・分析に特化。多次元集計が得意
ETL処理——データを整えて倉庫に格納する
| 工程 | フルネーム | 内容 |
|---|---|---|
| E(Extract) | 抽出 | 業務システム・外部データ・ログ等から必要なデータを取り出す |
| T(Transform) | 変換・クレンジング | 形式統一・欠損値処理・コード変換・重複削除。「汚いデータ」を整える最重要工程 |
| L(Load) | 格納 | 変換済みデータをDWHに投入。定期バッチ処理またはリアルタイム処理 |
OLAP・データマート——部門別の分析を高速化
OLAPと多次元分析の仕組み
- スライシング:多次元データの1断面を取り出す(例:「2024年の関東地区の売上」)
- ダイシング:複数の次元で切り出して比較(例:「地区×商品カテゴリ×月別の売上比較」)
- ドリルダウン:集計レベルを細かくする(年→四半期→月→日)
- ドリルアップ(ロールアップ):集計レベルを粗くする(日→月→四半期→年)
- データマート:DWHから特定部門・用途向けにデータを切り出した小規模DB(営業マート・財務マート等)
BIツール・データレイク——現代のデータ活用
| 概念 | 内容・特徴 | 代表的ツール・サービス |
|---|---|---|
| BIツール | DWH・データマートのデータを可視化・分析するツール。ダッシュボード・グラフ・KPIモニタリング | Tableau・Power BI・Looker・Google Data Studio |
| データレイク | 構造化・非構造化データを問わず生データのままで大量蓄積。分析前に形式を決めなくてよい | AWS S3・Azure Data Lake・Google Cloud Storage |
| データメッシュ | データの所有権を各事業部門に分散させ、部門ごとにデータ製品を管理する現代的アーキテクチャ | 大規模組織での採用が増加中 |
Uのメモ
学習メモ
- DWH:業務データを分析用に集めた専用DB。OLTP(業務処理)とOLAP(分析処理)を分離
- ETL:Extract(抽出)→Transform(変換・クレンジング)→Load(格納)の3工程
- データマート:DWHを部門用に切り出した小規模DB
- OLAP操作:スライシング(断面)・ダイシング(複数次元)・ドリルダウン(詳細化)・ドリルアップ(集約)
- BIツール:Tableau・Power BIなどでKPI可視化 / データレイク:生データを大量蓄積(後から分析









