『ビューティフルデータ』――すべてがデータ化される時代に、データの美しさを求め
ビューティフルデータ TobySegaran、JeffHammerbacher(編集)、堀内孝彦、真鍋加奈子、苅谷潤、小俣仁美、篠崎誠(翻訳) オライリージャパン 2011年2月 ISBN-10: 4873114896 ISBN-13: 978-4873114897 3570円(税込) |
■データを知ること=世界を知ること
TwitterやFacebookに撮った写真をアップロードする、Webサイトの口コミ情報を見ながら飲み会のお店を予約する、ダイエットのために毎日体重を記録して変化をチェックする……今や私たちの日常生活で、データに触れない日はありません。オンライン上には無数のデータがあり、誰もが自由にアクセスできます。個人が作成したデータをアップすることも容易になりました。
本書は、WebやSNSの舞台裏で処理されるデータ、人工衛星やDNA解析といった学術の世界におけるデータ、国勢調査や政治といった私たちの生活に関わるデータなど、さまざまな場面におけるデータの収集や検索、分析などについてのエッセイ集です。
データがビューティフルであるために、データはどうあるべきか、そしてどう使われるべきか。
各章の内容は独立しているため、最初から読むのもあり、目次を見て興味のある内容の章を拾い読みするのもありです。今回は、テストエンジニアとして気になった章について、いくつか紹介します。
■データ収集の主役はユーザー
ユーザーからデータを収集する場合、データを入力するのはユーザーです。そのため、システム作成者ではなく、ユーザーにとって都合がいいやり方を選ぶことが大切です。
第1章「データの中に生活を見る」では、ユーザーに負担をかけないデータの収集方法について解説しています。例題は、Twitterから現在地データを提供するシステムのデータ入力。さまざまな端末から気軽にデータを入力できるため、また、ユーザーにとってデータ提供が生活の一部になりやすいため、Twitterの事例は身近なものでしょう。
ユーザーがデータを提供しやすい仕組みは大切ですが、同時にユーザーが「データを提供したくなる動機」も重要です。
第2章「ビューティフル・ピープル」では、新商品についての意識調査アンケートのフォームを作るエピソードを基に、「1人でも多くの顧客に回答してもらえるようにするための工夫」が語られています。
「データを提供しよう」とユーザーに思ってもらうためには、ユーザーの年齢層や社会的地位などを考慮しつつ、ユーザーがいちばん喜ぶ特典は何かを考える必要があります。特典とは、何もプレゼントだけではありません。データを提供することで感謝される、データを提供することが楽しみになるというのも、立派な特典です。
私は、趣味で演奏会へ行った時は必ず、アンケートに答えるようにしています。私自身が市民オーケストラに所属しており、観客からのアンケートを見ることが演奏会の楽しみの1つだからです。演奏についてアンケートをもらえる喜びを知っているからこそ、私もアンケートを返すようにしています。
■楽しみながらデータの価値を上げる
データは、ただ集めるだけではありません。データを公開することで、ユーザーがそのデータの価値を高めることがあります。
身近な例でいえば、ブログにコメントやブックマークが付いて注目を浴びること、自分が考え出したTwitterのハッシュタグが拡散して面白いツイートがたくさん集まるようになることなどが挙げられるでしょうか。オープンソースソフトウェアなども、典型的な例の1つでしょう。
人気ロックバンドRadioheadのプロモーションビデオについて、データと作成ツールを同時公開した事例(第10章「Radiohead『House of Cards』のプロモーションビデオができるまで」)、国勢調査のデータを、ユーザーが好きなテーマ(職業別、出生地別など)でグラフ化できるシステム(第12章「sense.usの設計」)などの具体例を見ていると、ユーザーが“楽しみながら”データをカスタマイズする様子、そのカスタマイズによってデータに付加価値が与えられる様子がよく分かります。
私も、Twitterでハッシュタグを作った経験があります。その時は、多くの人がお題に沿った楽しいツイートをしてくれました。個々のツイートの内容の面白さに加えて、多くの人が自分の思いつきに乗ってくれたこと、ハッシュタグがどんどん広がっていったこと、「楽しい」「面白い」という感想を寄せてくれたことは、とてもうれしいことでした。このように感じているのが私だけではないことは、今も毎日のように新しいハッシュタグが作られ続けていることからも分かります。
■データに振り回されないように、私たちが考えるべきこと
一方でデータは、使い方を誤ると人を不幸にしてしまう一面があります。
誤ったデータの使い方が不幸を招く例としては、企業や公的機関によるデータの隠ぺい・改ざんや個人情報流出といった事件などがまず考えられます。「データの『美しさ』は、それがどう利用されるかで決まる(p.175)」のです。
データの悪用は言語道断ですが、私たちもデータの使い方について、ある程度の心構えが必要です。データを並べただけで何もかも分かったような気になってしまうことは危険です。
第13章「データでできないこと」は、データの過信に対する警告ともいえる内容です。感情や先入観をまったく持たない人間はいません。私たち人間はデータに触れる時に必ず、感情や先入観を持ってデータを見て、解釈するのです。そのことを忘れてしまうと、誰かの感情や先入観が作り出したシナリオに巻き込まれ、振り回されてしまいます。
私にとって、いちばん印象に残ったのが、この第13章でした。私はテストエンジニアなので、テストの結果データを分析することがあります。この時、「私自身の先入観がなるべく入らないようにしよう」と注意してはいます。
しかし、先入観がまったく入らないようにすることはおそらく不可能でしょう。私だけではなく、分析結果を読む人も、先入観からは逃れられません。その事実をしっかり心に留めて、せめて自分が提示した分析結果について、なぜそのように解釈したのか、説明できるようにしなければならないと痛感しました。
◇◇◇
現代は、「好むと好まざるとにかかわらず、あらゆるデータが綿密に保管される(p.324)」時代です。冒頭でも述べたとおり、データを誰もが自由に扱える環境なのです。
だからこそ、「美しいデータ」がどうあるべきか、私たちの誰もが真剣に考える必要があるのではないでしょうか。
(『オブリガート ~感謝されるテストエンジニアになる~』
コラムニスト 第3バイオリン)