DMBOK2のデータウェアハウス章には、データウェアハウスの実装で従うべき8つの原則が記載されています。(第11章 データウェアハウジングとビジネスインテリジェンス, 1.2 ゴールと原則, p413)
実はそのうちの3つがメタデータに関係する内容です。
・ウェアハウスと共にメタデータを構築する
・(メタデータを提供し続けて)透明性とセルフサービスを促進する
・(メタデータ管理施策と)協調する
(※原文では分かりづらいので、丸括弧内のことばを補っています。)
他にもメタデータについて原則で触れている章はありますが、11章ほど繰り返されている章はありません。それだけデータウェアハウス構築上、メタデータが重要なのでしょう。
ただ数行の説明でさらっと書かれているので、正直中身はわかりづらいです。
以下、この3原則について私なり理解を説明します。
ウェアハウスと共にメタデータを構築する
この原則の説明文には、次のように書かれています。
データウェアハウスの成功に決定的に重要なのは、データを説明する能力である。例えば「何故この合計はXなのか。」、「どのように計算されたのか。」、「データはどこから来たのか。」などの基本的な質問に答えることができることである。メタデータは開発サイクルの一環として取り込まれ、運用の一環として管理される。
たとえばデータウェアハウス内のデータの種類が多すぎて、使いたいデータを使いたいときにすぐ見つけられない。これではデータウェアハウスの構築は成功したとは言えません。
利用者が素早く目的のデータを見つけられるためには、
データを見つけるのに最低限必要なメタデータはなにかを定義し、
データウェアハウスへのデータ収集と同時にそのメタデータも集め、
共有・公開する仕組みを構築することが必要です。
データウェアハウス構築後にこうした活動を行うとその間は利用者が不便なので、ウェアハウスと同時に構築するべきです。
メタデータを提供し続けて透明性とセルフサービスを促進する
データカタログのようなメタデータの収集・共有ツールを導入したものの、導入プロジェクト終了後、メタデータの新規追加や更新が行われないということがよくあります。
こうしたケースでは、欲しいメタデータが欠けている、最終更新日が古いなどの理由でツールが信用されず、次第に使われなくなってしまいます。データの利用者はメタデータを知見者に確認するしかなくなり、ひとりで(セルフサービスで)データ利活用するのは無理です。
したがって、メタデータの収集と共有はプロジェクト的に一過性のもので終わらせるのではなく、データウェアハウス構築後も継続して続ける必要があります。
メタデータ管理施策と協調する
この原則は補足説明があまりないのですが、協調(Collaborate)と言っているので、体制の話ではないかと私は考えています。
一般にメタデータ管理では、データの論理名や意味・目的と言ったビジネスメタデータを誰が登録・更新するかがよく問題になります。ビジネスメタデータはIT部門では判断ができないので、ビジネス部門が責任を持つべきです。
なので、この原則は、データウェアハウスのメタデータ管理にもビジネス部門に協力してもらう体制を作れと言っているのではないかと、私は考えています(ちょっと強引な解釈かもしれません)。
上記をはじめとしたデータウェアハウスの原則は、全社横断で長期間使われるデータウェアハウスを構築するにはどうするべきかという視点で書かれています。今後データウェアハウス構築に関わる方は、ぜひご一読ください。
コメント