自社内であらためてデータ辞書の整備にとりかかっていることもあり、データ辞書・メタデータに関する書籍の金字塔ともいえる以下の書籍を読み返している。
『データ資源管理』
W.R.DURELL著 味村重臣監修 /IRM研究会 訳
日経マグロウヒル社 1987年刊
古い本なので(1987年刊!)、存在を知らない方も多いと思うが、 データベース設計に携わった方は、
修飾語+主要語+分類区分語 というデータ項目命名規約
例:ACCOUNT-PAY-VENDOR-NUMBER
→ ACCOUNT(修飾語) PAY(修飾語) VENDOR(主要語) NUMBER(分類区分語)
このルールを目にした、または実際に準拠した方は多いのではないか。
おそらくこの書籍がルーツである。
このポイントは、上記は単なるデータベース設計効率化の指針ではなく、
データ管理のためのルールということである。
その目的は、肥大化するデータ資産に立ち向かうために、メタデータ全体の情報量を抑えることにある。
都度新しい概念の項目名を発明するのではなく、 要素分解した単語を管理・掛け合わせることで、情報の「凝縮度」(と表現されている)を高めることが述べられている。
他にも以下のパラグラフなど、データ管理やメタデータ管理に携わる身としては、興味深い記述が多数ある。
・データ管理とは何か
・どう社内に売り込むか (!!!)
・幾つのデータ辞書が必要か(部署ごと、共通、など)
・保守か新規開発か
COBOLでの記述例など、時代を感じさせる記述はさすがに多いが、書かれている概念自体に陳腐化したものはなく、
むしろDMBOKがフレームワーク的であり、具体的なHowの記述が薄めであるのに対し、具体例も含めた記述が多い。
とはいえ今回の投稿は、絶版となっているこの本自体を推奨する意図はない。
読了感として、共有し・投げかけたい疑問は、
この本が1987年の刊行であるにも関わらず、DMBOK 2 メタデータ管理の章に遜色がない内容であるということ。
逆を言うと、DMBOK2が存在する2020年現在まで、その30年の間に大きな進化・成熟がないように思える、ということである。
30年の間に、何が有り・ 逆に何が無かったのか ?
という疑問である。
この他には、ISO 11179 (JIS 4181)というメタデータ管理標準の策定もあり、 そちらには命名ルールだけでなく、ドメイン(定義域) によるデータ資産の整理なども述べられている。
この時代にある程度集中して重厚な検討が行われたように思う。
単純化してDMBOKのメタデータ管理の章だけで測ると、DMBOK 2は参考になる点が多いが、 DMBOK 1のメタデータ章を読んだ時は、品質が低く感じられ、ある意味一度時代が退化してしまったのでは、という印象も受けた。
しかしながら、単に、当時を掘り下げるべき、巨人の肩に乗るべき、ということだけを言いたいわけでもない。
当時から現在へは、 データ資産に関わるテクノロジも当然進歩している。
さらに本質的な変化としては、データ資産の対象も、ホストコンピュータ的な「集約」から、オープン化を経て、さらに相互サービス連携へと「分散」の方向への変化を続けていることが大きいはずである。
モチベーションとしても、モノリシックなホストコンピュータ内の資産肥大化対応だけでなく DX等の文脈でのデータ連携や利活用、また法令対応など様々である。
当然、30年前とは異なる在り方になるはずである。
が、果たしてそれはどのような方向性だろうか? また以前の知見はどのように取り入れるべきか、という事が目下の関心事である。機会があれば同士の方々と議論していきたいと考えている。
コメント