年末に発覚した国交省での「建設工事受注動態統計」におけるデータ改竄事件が世間を騒がせました。
以下が主要紙で取り上げられている統計不正に関する記事です。
(産経新聞)
・国交省の統計不正 信用裏切った罪は大きい(2022年1月21日)
https://www.sankei.com/article/20220121-5XQH3MFRINLZJPE6G5H27ECVNI/
(日経クロステック)
・統計不正で国交省が次官ら10人処分、総務省も次官ら7人(2022年1月25日)
https://xtech.nikkei.com/atcl/nxt/column/18/00142/01194/
(朝日新聞デジタル)
・GDP、国交省の統計不正の影響は「不明」 元データ修正待って判断(2022年2月15日)
https://www.asahi.com/articles/ASQ2H436MQ28ULFA026.html
今回のようにデータを生成する過程で意図的に操作されてしまうと、ソースデータから統計表にアウトプットするまでのデータを完璧に記録し、誰がいつどのようにデータを編集したかの証跡を徹底的に記録しない限り検知することは不可能です。
「毎月勤労統計」に端を発してメディアを賑わせた2019年当時の「統計不正」が注目された際に、私は民間のデータマネジメントの有識者として点検検証部会の委員として招聘され、「紙の調査票を回答者から回収し、紙の統計表を出力すること」を前提とした統計の古い思想から、「過去の回答結果データを呼び出し、変更点だけを修正して簡単に回答できるような、回答者にとって、それを審査する行政機関にとっても快適的な、マスターデータを中心とした新たなデジタル統計の姿を目指すべき」と何度も何度も主張してきました。
今回の原因はまだまだ氷山の一角であり、毎月勤労統計のように「拡大推計し忘れて、それを長年放置してきた」といったケアレスミスに基づくものや調査回収率が悪いのを良く見せるため、実際には調査していないが、分母を増やして類似データを登録する、といった意図的なもの(※調査の主管課の職員たちにもそんなに悪気がある訳ではない)が何度点検検証部会を開催しても根絶は不可能であろうと考えています。
なぜ、そうなってしまうのか・・・
私はものすごく有益な武器にもなれば、判断を誤らせる凶器にもなり得るというデータの本質に対する理解が日本全体に決定的に足りていないことに根本原因があると感じています。
以前、自分の「リアライズ社長ブログ」でも記しましたが、「そのデータが後々にどのような活用のされ方をするか」をイメージせずにデータを取り扱うことの恐ろしさ、組織のボトムからトップに至るまでのデータマネジメントの重要性に関する実感がもっと日本社会の「新しい常識」になってほしいと願うばかりです。
・杭データ改ざん事件に寄せて~ストップ!データ軽視~
realize-corp.jp/blog/blog02-2-4
年末の国交省での統計不正の報道に触れるにつけ、自分が声高に叫んできたことが活かされていないことに暗澹たる気持ちになるとともに、まだまだデータマネジメントの普及・啓発に取り組んでいかなければいけないと決意を新たにした次第です。
DAMA日本支部 企画担当理事
日本データマネジメント・コンソーシアム[JDMC] 発起人 兼 事務局長
大 西 浩 史
コメント