『Head Firstデータ解析』――居眠りしない(できない)「データ分析」入門

2012/05/10 18:14:37

Feadfirst_data

Head Firstデータ解析 ―頭とからだで覚えるデータ解析の基本

Michael Milton(著)、大橋真也(監訳)、木下哲也(翻訳)
オライリージャパン
2010年7月

ISBN-10: 4873114640
ISBN-13: 978-4873114644
3360円(税込)


■データ分析のスキルを持つ人が足りない

 「Microsoft Excelのヘルプファイルを、実際より見栄え良くプリントアウトしただけじゃないデータ解析本があったら素敵じゃない? 夢物語にすぎないかもしれないけど……」

 なんとも皮肉の効いた吹き出しから始まる、他のデータ分析本とはひと味違う1冊。

 ビジネスの世界において、データに基づく判断は、ますます重要になってきている。しかし、専門的・体系的な理解を有するデータ分析者は、ニーズに比べてぐっと少ない。

 私自身、かつて大学の授業で、統計の基礎を学んだものの、実践的な利用イメージがなかったために、あまり興味が持てなかった。しかし、今コンサルタントとして働く上で、データ分析の基礎は学んでおきたい――そんな動機で本書を手に取った。

■本書の構成

 著者のマイケル・ミルトンは、非営利団体の資金提供者から集めたデータを解析し、その結果に基づいて行動し、非営利団体の資金調達を強化するのを手伝うことにキャリアのほとんどを費やしてきた。なんとも説得力を感じるプロフィールである。

 本書は、主にクライアントとデータ分析者(以下、アナリスト)がやりとりするという形式で進む。

  • 1章 データ解析入門:分析する
  • 2章 実験:持論を検証する
  • 3章 最適化:最大にする
  • 4章 データの可視化:図を使うと賢くなる
  • 5章 仮説検定:否定する
  • 6章 ベイズ統計:基準を活用する
  • 7章 主観確率:数値で表した信念
  • 8章 経験則:人間らしい解析
  • 9章 ヒストグラム:数値の形状
  • 10章 回帰:予測
  • 11章 誤差:誤差を適切に示す
  • 12章 リレーショナルデータベース:関連付けられますか?
  • 13章 データクリーニング:秩序を与える

 ご覧のとおり、分析の基本的な考え方、確率、最適化、予測、データ加工、ビジュアライズと、実務で必要な要素はひととおりカバーしている。

■無味乾燥なデータ本とは一線を画す

 本書が他のデータ分析の指南書と異なる点についても、触れておこう。通常、データ分析の本は、たいてい下記の特徴を持っているように思う。

  • ある特定のツールを前提にしている
  • お題データがあるものの、ツールの機能を使用して加工・分析を進めていく
  • 機械的で無味乾燥

 これらの本は、脳を刺激してくれない。文字だらけのパワーポイントを眺めているのと同じだ。記憶への定着が難しかったり、気付きを得る機会がぐっと減ってしまう。

 一方、Head Firstシリーズはすべて、下記のような方針で作られている。

  • ビジュアル重視
  • 会話のような親密な感じの文体
  • 考えを深めながら学べるようにする
  • 読者の関心を引きつけ、飽きさせない
  • 感情に訴える

 これだけでも、無味乾燥なデータ本とは一線を画する本であることが、お分かりいただけると思う。

■作業だけでは足りない、必要なのは“思考”

 なぜ、普通のデータ分析本は飽きるのか? 飽きる原因はひとえに、「“作業”ばかりで“思考”するタイミングがない」ことではないだろうか。

 本書では、ストーリーの至るところに「自分で考えてみよう」という演習を用意していて、読み進めるうちに、なかば強制的に「思考」することが求められる。ゲームをしているような感覚を覚えて、非常に面白い。

■クライアントとの付き合い方も学べる?

 また、ストーリーがクライアントの存在を前提としているため、常にクライアントの反応(期待、クレーム)に対するアプローチを意識して学習を進められる。

 「答えを求めている相手=クライアント」と、「解として提示すべきものが何なのか」を考えることで、無駄な作業を減らせる―ーこうした考え方は、実際にお客さん相手に仕事をしてみないと分からないことなので、簡単ではあるものの、疑似体験できる価値は大きい。この点も、従来のデータ分析本にはなかったアプローチだ。

 今まで私が読んできた本では、Excelの機能を懇切丁寧に説明しているだけのもの、お題のデータを使って段階的に演習していくものがほとんどだった。ベンダの研修も似たような内容で、「思考する機会は帰ってからどうぞ」という感じだったので、本書のスタイルは思考したい人にとってはぴったりだろう。

■データ分析はツールが大事

 大量のデータ分析は、もはや人間の計算力・速度では対応できない。そのため、ツールを活用する必要がある。

 代表的なものとして、Excelのような表計算ツールが挙げられる。ある程度コストを掛けられるなら、もっと高機能なツールの使用も可能だ。本書で取り上げられているツールは2つ。1つはExcel、もう1つはRという統計分析ツール(フリーソフト!)である。

 本書の演習は、ExcelとRをうまく使い分けており、実践的な考え方に基づいて執筆されていることがよく分かる。

■まとめ:入門書としては申し分なし

 とにもかくにも本書は「実践的」という印象で、データ分析の入門書としては申し分ない。

 昨今、データに基づく経営、ビックデータからインサイトを得るなど、データ分析に関連する話題が飛び交っている。しかし、基本的なデータ分析のスキルなくして、インサイトなど得られるのだろうか。

 ボタンを押したら答えが出てくるような話ではない。ITシステムに求められる分析機能の要件は極めて高度で、統計や分析にうといエンジニアが処理できる世界を超えつつある。

 欧米に比べると、統計の専門者が圧倒的に少ないという日本の現状はあるものの、専門家にならなくとも、データ分析の重要性を考えていくべき、と感じる今日この頃だ。

 皆さんも、本書とともに、深遠なるデータ分析の道の第一歩を踏み出してみてはいかがだろうか?

『ワイン片手にITを思う』コラムニスト サトマモ)

『日本語入力を支える技術』――複雑な、あまりに複雑な“日本語入力”の解体新書

2012/04/13 17:29:41

Manual_2

日本語入力を支える技術 ―変わり続けるコンピュータと言葉の世界

徳永拓之(著)
技術評論社
2012年2月

ISBN-10: 4774149934
ISBN-13: 978-4774149936
2699円(税込)


■まるで空気のようなシステム

 この書評を読んでいるあなたが感想をTwitterに書きこもうとする時、日中の仕事でメールを書く時、友人とSkypeでチャットする時、Excel方眼紙に業務システムの設計書を作っている時。

 これらすべての場面で、共通して使用するソフトウェアがある。日本語入力システムだ。
 
 日本人としてコンピュータ上で日本語を扱う場合、このソフトウェアを利用せずに日本語を入力することはあり得ない。しかし、日本語入力システムはその重要性に反して、利用者のほとんどが意識しない。まるで、空気のようなシステムである。

 だが、空気とあなどるなかれ。日本語入力システムには、実は計算機科学の技術の粋が結集されている。

■複雑な日本語処理のすべてをここに書き残した

 本書は、日本特有のソフトウェアの中でも、最も重要性と難易度が高いシステムである日本語入力システムが、どのように設計されて動作しているのかを、実に読みやすく書いた良書だ。

 黎明期から現在に至る日本語入力システムの成り立ち、日本語入力システムの概観、それを実現するために必要なデータ構造の基本的な考え方や言語処理、機械学習のアルゴリズムなど、日本語入力システムのすべてが、本書には書かれている。

■メモリは限りなく少なく、しかし機能は膨大

 日本語入力システムに求められる機能は多い。

 日本語入力システムは、文字入力を必要とするあらゆるソフトウェアと連動して動作する。「入力」と「変換」という2つの機能を持ち、変換候補の一覧をどこに描画するか、という視覚的要素も必要だ。

 変換誤りに対する訂正の手段をどのように提供するか。仮にクラッシュした場合、他のアプリケーションを巻き込まないようにどう設計すべきか――。こうした高機能と変換に必要となる膨大なデータ量を要求されるにもかかわらず、空気のような存在であるがゆえに、メモリ量はできるだけ小さくなければならない。

 見た目のシンプルさや空気感と対照的に、日本語入力システムに求められる要件は複雑で、ソフトウェアとして高難度なものばかりだ。さらに、日本語は文法が複雑で、かつ扱う文字量の多さも半端なく多いため、さらに複雑さに拍車をかけることになる。

■難易度の高い話題を分かりやすく

 データ構造やアルゴリズムに関する章では、数学的な知識や情報処理についての素養が求められる場面もあるが、巻末に付録で説明されているので心配することはない。随所に登場する専門用語も、すべて初出時に定義されている。内容の高度さに比べると本書は驚くほど読みやすく、きちんと時間をかけて読めば誰でもこの本の内容を理解できるだろう。

 第3章以降のデータ構造、アルゴリズムの解説は難しいが、第2章の「日本語入力システムの概観」まではとても分かりやすく、日本語入力システムのエッセンスのすべてが書かれている。興味のある人は、第2章までを読むだけでも価値はあると思う。

 これほど身近に存在するにもかかわらず、その詳細を知る人はほとんどいないであろう日本語入力システム。その深淵の一端を、本書より感じとってもらいたい。

 これまではキーボードからの入力のみであった日本語入力システムは、スマートフォンなどで使用されるタッチパネルや音声入力など、一層の進化が期待されている。今、日本語入力について勉強してみるのもいいだろう。

スマホ案件用の秀逸なドキュメント『jQuery Mobile』

2012/03/23 16:59:51


jQuery Mobile

Jon Reid(著)、 渡邉真人・白石俊平(監訳)、牧野聡(翻訳)
オライリージャパン
2011年12月
ISBN-10:4873115264
ISBN-13: 978-4873115269
1995円(税込)

■どんどん増える、スマホ対応のお仕事

 「2011年はスマホ元年」と言われたように、スマートフォン市場が急成長を続けています。Webサイトや携帯サイトをスマホ対応させている人は多いでしょう。私もその1人です。

 iPhone、Android、Windows Mobileといった多様な端末それぞれに最適化したページを作成することは簡単ではありません。端末の種類を吸収し、どの端末で見ても同じデザインで見せるフレームワークを用いれば、簡単にスマホ対応ができます。jQuery Mobileは、それを実現させるフレームワークです。

■秀逸なオフライン・ドキュメント

 本書は、jQuery Mobileでできることを網羅的にまとめています。公式Webサイトにあるドキュメント内容はほぼすべて掲載しており、かつソースコードだけでなく、スクリーンショットも豊富なので、オフラインのドキュメントとしておすすめできます。

 私は、今年からフリーランスのプログラマとして仕事をしています。スマホ対応サイトを構築するお仕事をもらったので、早速オフライン・ドキュメントとして本書を手に入れました。

●目次

  • 1章 jQuery Mobileをはじめよう
  • 2章 アプリケーションの構造とナビゲーション
  • 3章 ページの要素
  • 4章 テーマの切り替え
  • 5章 jQuery MobileのAPI
  • 6章 jQuery Mobileアプリケーションの実際
  • 付録A 知っておくと役に立つTIPSとjQueryの基礎知識
  • 付録B リファレンス

 以下は、すべてのページの基礎となるソースです。

<!DOCTYPE html>
<html>
    <head>
        <title>jQuery Mobile</title>
        <link rel="stylesheet" href="css/jquery.mobile-1.0.min.css" />
        <script src="js/jquery-1.6.4.min.js"></script>
        <script src="js/jquery.mobile-1.0.min.js"></script>
    </head>
    <body>
        <header><h1>jQuery Mobile</h1></header>
        <div class="content">
                <p>jQuery Mobileのページ</p>
        <footer><h1>Copyright...</h1></footer>
    </body>
</html>

 head部分でjQueryとjQuery Mobileのjsとcssファイルを指定し、body部分でヘッダとフッタ、ならびにページのメイン部分を記述していきます。後は、jQuery MobileならびにHTML5の仕様に合わせて記述していくだけで、簡単にスマホ対応サイトのページを作成できます。

 もちろん、jQueryならではのアニメーションやナビゲーション、ページ間の制御などの設定も可能です。これらの点は、公式Webサイトのドキュメントだけでは分からなかったので個人的には大変ありがたく、実際に仕事で参照しました。

 最も役立ったのは、5章の「初期化イベント」です。仕事で、「ページ遷移の直前に処理を行い、処理を反映した状態で次のページを表示できないか」という依頼がありました。公式Webドキュメントだけでは理解しづらかったのですが、本書のその部分を読み、実装可能であると分かりました。

 例えば、bind()という関数と pagebeforeshow というイベントを用いて、下記のように記述します。

<script>
$("page1").bind("pagebeforeshow", function(event, ui) {
    (何らかの処理を記述)
});
</script>

 こうすれば、「ページ遷移の直前に、遷移先のページで記述された処理を実行し、その処理が反映された状態のページを表示する」ことが可能です。

■本書をおすすめする人

 jQuery Mobileを利用する上で、jQueryの知識は多少必要ですが、簡単なjQueryの使い方を知っていれば十分jQuery Mobileを使えます。

 本書は、プログラマだけでなくデザイナーにとっても非常に読みやすい内容です。フォーム部品など、どういった表現がjQuery Mobileで可能かを本書で確認しつつ、デザイナーとプログラマの間で打ち合わせを行い、サイトを設計・構築していく――本書は、その一助になると思います。

『It’s Party Time!』 コラムニスト あずk)

『プロジェクト・マネジャーが知るべき97のこと』――ソフトウェア開発の難問はいつだって“人”だった

2012/01/20 17:27:54

プロジェクト・マネジャーが知るべき97のこと プロジェクト・マネジャーが知るべき97のこと 

神庭弘年(監修)、Barbee Davis (編集)、 笹井 崇司 (翻訳)
オライリージャパン
2011年11月
ISBN-10: 4873115108
ISBN-13: 978-4873115108
1995円(税込)

■世界はきのこに満ちている

 「○○が知るべき97のこと」シリーズの第3弾が出た。本書は、プロジェクト・マネージャ(以下PM)向けのエッセイを97本(日本版は+11本)を収録している。

 第2弾『プログラマが知るべき97のこと』は、プログラマ向けのエッセイが収録されている名著だった(以前に書評を執筆したので、ぜひご覧いただきたい)。

 『プログラマが知るべき97のこと』は通称「きのこ本」として親しまれている。ちなみに第1弾は『ソフトウェアアーキテクトが知るべき97のこと』。これはもう「きのこ本シリーズ」とでも呼ぶべきだろう。

■きのこ本が築く、きのこの山

 「きのこ本シリーズ」は、それぞれの分野で活躍する人物の手によるエッセイを97本(+α)収録するものだ。いろいろなキャリアを積んできたベテランが、プロジェクトで経験してきたことを短く印象的なエッセイにまとめている。

 「いろいろなキャリア」に根ざして書かれたコラムはどれも味わい深く、時には執筆者同士がそれぞれ違う主張をぶつけ合うことだってある。それが「きのこ本シリーズ」の魅力の1つでもある。

 ところが、本書は過去2冊と比べて明らかに「主張の衝突」が少ない。これはどういうことなのだろう。

■PMの問題領域、それは「人」

 本書を最初から読んでいくと、「プロジェクトを進める際によくある落とし穴」「気を付けるべきポイント」「よりよい行い」といったことを書いたコラムが並んでいる。アジャイルな開発手法を少しでも学んだ/経験したことがある人にとっては「あるある」の連続だろう。

  • 顧客/ユーザーを巻き込む
  • シンプルを心がける
  • 問題を小さく分割する
  • 優秀なチームを編成する
  • チームで責任を果たす
  • 変化を受け入れる
  • コミュニケーションをとる

 読みながら分かったのは、「PMの問題領域は人間である」ということだ。

 考えてみれば当たり前なのだが、ソフトウェア開発においてもっとも難しいのは、設計でもプログラミングでもデバッグでもなく「合意すること」なのである。

 ユーザーは「自分たちが何を必要としているか」を分かっていない。顧客は予算を出し渋り、期間を圧縮したがる。開発者は移り気で扱いづらい。そしてみんな人間なので、エゴや怠惰さ、自己顕示欲や怠惰さを備えている。

 ソフトウェア開発プロジェクトでは、こういった「人間の厄介さ」が集約するハブとして「PM」というポジションがあるのだ。

 それであれば、本書に「主張の衝突」が少ないことにも納得がいく。人間関係の問題とは、「すでに解決策が分かっており、そしてそれを実践するのが困難」なものだからだ。

 ミーティングがつい長くなってしまう問題、複数のステークホルダーが違うことを言い出す問題、チームに問題児が紛れ込んでしまう問題、納期が遅れてしまう問題。いずれも、ソフトウェア開発が産業として興る前から存在し、そしてきっと、今後も存在する問題なのだろう。

■プロジェクト・マネージャとしてこの先生きのこるには

 ソフトウェア開発にかかわらず、プロジェクトをマネジメントするには「人」が最も大きな問題になるのだろう。そういう視点で本書を読みなおすと、PMという立場に置かれた時の心構えを準備できるだろう。

 目次を見てみよう。いずれも、ソフトウェア開発に関するエッセイとは思えないような見出しだ。

  • 05「複雑よりもシンプルな方がいい」
  • 14「大きさが重要」
  • 27「見積もって見積もって見積もる」
  • 37「自らに誠実であれ」
  • 39「変化のための道筋を描く」
  • 69「コミュニケーションが重要」
  • 82「みんなが聞きたいことはなんですか?」

 だが、PMが扱う問題領域は、まさにこうした解決法を必要としている。現場で問題に立ち向かうには、かつて問題に立ち向かった諸先輩の声をよく聞き、よく咀嚼(そしゃく)し、そして

  • 16「さあ、プラクティスを投げ捨てよう」

 自分の現場でこの先生きのこるには、自分の現場に合ったマネジメントを、自分の手で編み出す必要があるのだ。

『Wife Hacks ~仕事と家族とコミュニティと~』
コラムニスト kwappa)

『クラウド時代の製品・サービス選び Vol.2』――クラウドを使って、災害に強いインフラを整備する

2011/12/09 17:44:52

Manual_2 災害と節電を見据えたITシステム作りをサポート クラウド時代の製品・サービス選び Vol.2

ASCII.jp編集部(著)
アスキー・メディアワークス
2011年9月

ISBN-10: 4048709240
ISBN-13: 978-4048709248
1280円(税込)

 「クラウド時代の製品・サービス選び」の第2弾が登場した(第1弾の書評はこちら)。

 「クラウド」といってもその範囲は広いが、本ムックでは主にインフラを中心に扱っている。震災をふまえてか、本ムックのテーマは「災害に負けない次のITインフラ作り」。特集内容を順に紹介していこう。

■第1部 大震災以降のITの災害対策を考える。

 東日本大震災のような広域にわたる災害を想定した場合、業務データのバックアップメディアとデータセンターが同時に被災しないよう、遠隔に保管する必要がある。私もこれまでさまざまな業務アプリケーションの構築に携わってきたが、遠隔にバックアップサイトを設けるほどのシステム開発の経験は一度しかない。とはいえ、社会インフラを担うような重要業務のデータは失われてはならないものなので、さまざまなことを考慮したうえで保護されなければならないだろう。

 本ムックで私が注目したのは「リモートレプリケーション」という手法である。

 コンピュータシステムの災害復旧(ディザスター・リカバリ)の手法として、これまではバックアップ媒体を遠隔に保管する方法が主流だった。しかし、HDDや通信コストの低下によって、新しい手法が導入されるようになっている。

 事業継続の観点からバックアップ手法を検討した場合、RTO(目標復旧時間)がゼロに近い方が望ましい。レプリケーションという技法を使えば、ディスクボリュームやデータベースの完全な複製をリアルタイムで複製できる。

 最新の遠隔バックアップ技術は、レプリケーションを遠く離れた2つの装置間で行う「リモートレプリケーション」だ。本ムックでは、こうしたクラウド的なデータ同期の考え方を至るところで目にする。

■第2部 在宅勤務で失敗しない方法

 東日本大震災以降、「節電」は一大テーマとなった。休日をずらす、サマータイムを導入するなどさまざまな方法があるが、在宅勤務制度を導入した企業は多かった。

 VPNの技術が発達したため、自宅にいながらにして会社と同じデスクトップ環境を扱えることは珍しくない。セキュリティなどの問題さえクリアできれば、ITエンジニアという仕事は在宅勤務をしやすい。

 在宅勤務において私が最も気になる部分は、チームのメンバー間のコミュニケーションをいかに取るかということだ。本ムックでは、コミュニケーション不足を補うコラボレーションツールについても扱っている。

 最も古典的な方法として、ファイル共有がある。例えばマイクロソフトは「SharePoint Server」など、情報の共有化だけでなく、情報の可視化や生産性向上、標準化/最適化といった観点から、コラボレーションツールの充実を図っている。

 リアルタイムなレスポンスを期待するなら、Web会議システムが有効だ。昨今のWeb会議システムは、単に映像と音声を共有するだけのシステムではなく、アプリケーション共有機能もあり、これが在宅勤務に非常に有用なのだという。

 Google Docsも、リアルタイムで変更を共有できる機能を持っている。こうしたクラウドサービスを利用して、在宅勤務をより効果的にできるようにしたい。

■第3部 災害を見据えたデータセンター選び

 私は普段、あまりデータセンターに足を運ぶ機会はない。

 一度だけ、某社の大規模データセンターを見学させてもらったことがあるが、その佇まいはSF世界のようで、ずいぶん感動した記憶がある。

 そのデータセンターは厳重な耐震設計が施されており、大規模な直下型地震にも耐えられるという説明を受けた。本特集の最後は、そんなデータセンターの話。

 本特集で紹介されているのは、NTT コミュニケーションズの東京第5データセンター、KVHの印西データセンター、IIJの松江データセンターパークである。

 どのデータセンターも写真付きで設備が紹介されており、私が実際にデータセンター見学の際に感じた「SF的」な美しさを垣間見られる。また、各センターのセキュリティや災害への取り組みなども具体的な設備とともに説明されていて、大変興味深かった。

■クラウド時代の災害対策

 クラウドのメリットは、場所や端末にこだわらずにネットワークを経由して常に同じ情報にアクセスできるという点にある。

 これは、日々の業務の効率化や日常の情報の扱いを便利にするだけでなく、災害対策にも有用だ。

 ネットワークのコストが低下し、さまざまな新しい技術が生まれる時代において、災害対策についてもそれらを生かした方策を考えていく必要があり、本ムックはその一助となると思う。

@IT Special 注目企業
@IT Special ラーニング

エンジニアライフ 最新の投稿コラム

@IT自分戦略研究所 新着記事

エンジニアライフ スポンサー

コラムニスト プロフィール

書評チーム 「ELリーダーズ」

「エンジニアの人生=エンジニアライフ」に役立つ本を紹介します。

本をお探しの方は、インデックスからどうぞ。


2012年5月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

バックナンバー

月間バックナンバー

検索

Powered by TypePad
- PR -
@IT Special 注目企業
インデックス

@IT Special ラーニング