「エンジニアの人生=エンジニアライフ」に役立つ本を紹介します。

『Head Firstデータ解析』――居眠りしない(できない)「データ分析」入門

»

Feadfirst_data

Head Firstデータ解析 ―頭とからだで覚えるデータ解析の基本

Michael Milton(著)、大橋真也(監訳)、木下哲也(翻訳)
オライリージャパン
2010年7月

ISBN-10: 4873114640
ISBN-13: 978-4873114644
3360円(税込)


■データ分析のスキルを持つ人が足りない

 「Microsoft Excelのヘルプファイルを、実際より見栄え良くプリントアウトしただけじゃないデータ解析本があったら素敵じゃない? 夢物語にすぎないかもしれないけど……」

 なんとも皮肉の効いた吹き出しから始まる、他のデータ分析本とはひと味違う1冊。

 ビジネスの世界において、データに基づく判断は、ますます重要になってきている。しかし、専門的・体系的な理解を有するデータ分析者は、ニーズに比べてぐっと少ない。

 私自身、かつて大学の授業で、統計の基礎を学んだものの、実践的な利用イメージがなかったために、あまり興味が持てなかった。しかし、今コンサルタントとして働く上で、データ分析の基礎は学んでおきたい――そんな動機で本書を手に取った。

■本書の構成

 著者のマイケル・ミルトンは、非営利団体の資金提供者から集めたデータを解析し、その結果に基づいて行動し、非営利団体の資金調達を強化するのを手伝うことにキャリアのほとんどを費やしてきた。なんとも説得力を感じるプロフィールである。

 本書は、主にクライアントとデータ分析者(以下、アナリスト)がやりとりするという形式で進む。

  • 1章 データ解析入門:分析する
  • 2章 実験:持論を検証する
  • 3章 最適化:最大にする
  • 4章 データの可視化:図を使うと賢くなる
  • 5章 仮説検定:否定する
  • 6章 ベイズ統計:基準を活用する
  • 7章 主観確率:数値で表した信念
  • 8章 経験則:人間らしい解析
  • 9章 ヒストグラム:数値の形状
  • 10章 回帰:予測
  • 11章 誤差:誤差を適切に示す
  • 12章 リレーショナルデータベース:関連付けられますか?
  • 13章 データクリーニング:秩序を与える

 ご覧のとおり、分析の基本的な考え方、確率、最適化、予測、データ加工、ビジュアライズと、実務で必要な要素はひととおりカバーしている。

■無味乾燥なデータ本とは一線を画す

 本書が他のデータ分析の指南書と異なる点についても、触れておこう。通常、データ分析の本は、たいてい下記の特徴を持っているように思う。

  • ある特定のツールを前提にしている
  • お題データがあるものの、ツールの機能を使用して加工・分析を進めていく
  • 機械的で無味乾燥

 これらの本は、脳を刺激してくれない。文字だらけのパワーポイントを眺めているのと同じだ。記憶への定着が難しかったり、気付きを得る機会がぐっと減ってしまう。

 一方、Head Firstシリーズはすべて、下記のような方針で作られている。

  • ビジュアル重視
  • 会話のような親密な感じの文体
  • 考えを深めながら学べるようにする
  • 読者の関心を引きつけ、飽きさせない
  • 感情に訴える

 これだけでも、無味乾燥なデータ本とは一線を画する本であることが、お分かりいただけると思う。

■作業だけでは足りない、必要なのは“思考”

 なぜ、普通のデータ分析本は飽きるのか? 飽きる原因はひとえに、「“作業”ばかりで“思考”するタイミングがない」ことではないだろうか。

 本書では、ストーリーの至るところに「自分で考えてみよう」という演習を用意していて、読み進めるうちに、なかば強制的に「思考」することが求められる。ゲームをしているような感覚を覚えて、非常に面白い。

■クライアントとの付き合い方も学べる?

 また、ストーリーがクライアントの存在を前提としているため、常にクライアントの反応(期待、クレーム)に対するアプローチを意識して学習を進められる。

 「答えを求めている相手=クライアント」と、「解として提示すべきものが何なのか」を考えることで、無駄な作業を減らせる―ーこうした考え方は、実際にお客さん相手に仕事をしてみないと分からないことなので、簡単ではあるものの、疑似体験できる価値は大きい。この点も、従来のデータ分析本にはなかったアプローチだ。

 今まで私が読んできた本では、Excelの機能を懇切丁寧に説明しているだけのもの、お題のデータを使って段階的に演習していくものがほとんどだった。ベンダの研修も似たような内容で、「思考する機会は帰ってからどうぞ」という感じだったので、本書のスタイルは思考したい人にとってはぴったりだろう。

■データ分析はツールが大事

 大量のデータ分析は、もはや人間の計算力・速度では対応できない。そのため、ツールを活用する必要がある。

 代表的なものとして、Excelのような表計算ツールが挙げられる。ある程度コストを掛けられるなら、もっと高機能なツールの使用も可能だ。本書で取り上げられているツールは2つ。1つはExcel、もう1つはRという統計分析ツール(フリーソフト!)である。

 本書の演習は、ExcelとRをうまく使い分けており、実践的な考え方に基づいて執筆されていることがよく分かる。

■まとめ:入門書としては申し分なし

 とにもかくにも本書は「実践的」という印象で、データ分析の入門書としては申し分ない。

 昨今、データに基づく経営、ビックデータからインサイトを得るなど、データ分析に関連する話題が飛び交っている。しかし、基本的なデータ分析のスキルなくして、インサイトなど得られるのだろうか。

 ボタンを押したら答えが出てくるような話ではない。ITシステムに求められる分析機能の要件は極めて高度で、統計や分析にうといエンジニアが処理できる世界を超えつつある。

 欧米に比べると、統計の専門者が圧倒的に少ないという日本の現状はあるものの、専門家にならなくとも、データ分析の重要性を考えていくべき、と感じる今日この頃だ。

 皆さんも、本書とともに、深遠なるデータ分析の道の第一歩を踏み出してみてはいかがだろうか?

『ワイン片手にITを思う』コラムニスト サトマモ)

Comment(0)