第3回:データウェアハウスアーキテクチャ(2):キンボールディメンショナルデータウェアハウス
さて、今回はデータウェアハウスアーキテクチャの「キンボールディメンショナルデータウェアハウス」について説明いたします。
ディメンショナルデータウェアハウス
ディメンショナルデータウェウハウスアーキテクチャは、ラルフ・キンボールによって提唱されているアーキテクチャです。ラルフ・キンボールはディメンショナルモデリング、いわゆるスタースキーマモデルを提唱した人で、データウェアハウスのグルの1人として数えられています。キンボールグループの創始者で、キンボールユニバーシティと称して、セミナーを開催しており毎年多くの人が参加しています。
さて、ディメンショナルデータウェアハウスアーキテクチャですが、これは簡単にいってしまえば、ディメンショナルモデリング、つまり、スタースキーマでデータウェアハウスを構築することです。インモンの提唱しているインフォメーションファクトリモデルでは、正規化されたセントラルデータベースがあり、そこから部署向けに作られたデータマートを構築するアーキテクチャですが、キンボールではデータマート自体がデータウェアハウスとなります。
データウェアバスアーキテクチャ
キンボールはこのスタースキーマで構築されたデータマート群を共通のディメンショナルテーブルで結び、それをデータウェアバスアーキテクチャと読んでいます。インモンのセントラルデータベースにあたるデータはステージングエリアで蓄積されるイメージです。
トップダウンとボトムアップアプローチ?
インモンモデルとキンボールモデルを対比して、インモンモデルはトップダウンアプローチ、キンボールモデルはボトムアップアプローチと称されることがあります。確かにインモンモデルは一気に導入、キンボールモデルは必要なデータマートから少しずつ作っていくのに便利ですが、キンボールモデルでもトップダウンで構築することもできます。
インモンモデルとキンボールモデル どちらがいいの?
よく聞かれる質問に、では実際どっちのモデルを採用したらよいのか? というのがあります。難しい質問ですが、どちらかにするかは会社の規模やデータ分析の成熟度によると思います。インモンモデルはどうしても大きなシステムになり、費用がかかってしまうので、小規模な会社の場合はキンボールモデルができしていると思います。
ただ、一般的にはこの両方を取り入れたハイブリッド形式が多いようです。
キンボールアーキテクチャ本
キンボールも多くの書籍を出版していますが、日本語に翻訳されている本は非常に少ないです。下記をお勧めします。
『データウェアハウス・ツールキット―多次元データウェアハウス構築の実践手法』
これは有名なディメンショナルモデリングを解説した本ですが、残念ながらすでに日本語版は絶版です。オリジナルはすでに第2版が出ていますので、英語が読める人はこちらを読みましょう。
The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling
次回は、第3のアーキテクチャ「データボルトモデリング(Data vault modeling)」について解説します。