第2回:データウェアハウスアーキテクチャ(1):インモンのコーポレートインフォメーションファクトリー
今回から3回にわたって、データウェアハウスのアーキテクチャについて説明します。
データウェアハウス業界では昔からアーキテクチャについて、大きく2つのグループに分かれており、どちらのアーキテクチャモデルがよいかが争っています。その2つのグループはインモンが提唱する「コーポレートインフォメーションファクトリー」とキンボールが提唱する「ディメンショナルデータウェアハウス」の2つです。本コラムでは、この2つのアーキテクチャモデルともう1つ有力なデータボルトマネジメントモデルの3つについて紹介いたします。
今回はインモンの「コーポレートインフォメーションファクトリー」について説明します。
コーポレートインフォメーションファクトリー
コーポレートインフォメーションファクトリーとは、データベースの父と言われるビル・インモンが提唱したアーキテクチャの構造です。どのようなアーキテクチャか。ライズデータウェアハウスという企業のすべてのデータを集めたセントラルデータベースを構築し、そこから各部署で分析に必要なデータをデータマートとして、抽出、構築して分析はそのデータマートに対して分析を行うというものです。
エンタープライズデータウェアハウスは、通常のデータベース設計で使用される正規化を利用して構築されます。クエリパフォーマンスが悪くなるためこちらでは直接分析クエリの実行は行いません。データマートは非正規化し、データウェアハウスの分析に適したディメンショナルモデリングで構築を行います。ディメンショナルモデリングについては第5回~第9回で詳細に説明を行います。
データウェアハウス 2.0
また、最近インモンはデータウェアハウス2.0を提供しています。2.0を利用するのは、Web 2.0の影響でずいぶんはやりましたね。では、データウェアハウス2.0はインフォメーションファクトリーとどう違うかというと、全体では大きな違いはありません。大きな特徴と言えば、メールやWeb、Twitterのつぶやきなどの非構造化データを考慮していることでしょう。企業にとって、このような非構造化データの分析は、ますます重要になってきています。まだ、企業での需要はそんなに多くないようですが、今後データウェアハウスの構築の際に考慮が必要になってくると思います。
うれしいことに、インモンの本については日本語版があります。より詳しい内容を知りたい人は下記の本を読むことをお勧めします。