Windows Serverを中心に、ITプロ向け教育コースを担当

Googleの功罪

»

 月刊「Windows Server World」の連載コラム「IT嫌いはまだ早い」の編集前原稿です。もし、このコラムを読んで面白いと思ったら、ぜひバックナンバー(2006年4月号)をお求めください。もっと面白いはずです。

■□■

 筆者がWebサイトへのアクセスを始めたのは1994年頃だったと思う。あれから12年、当時からは想像もつかないくらい便利になったが、解決できていないこともある。今回は、特にインターネット検索エンジンに焦点を絞って、得られたものとまだ得られていないものについて考えてみたい。

●インターネット検索エンジン

 先日フリーライター森健氏(『Windows Server World 2006年4月号』で対談の相手をしていただいた方)に、インターネット検索エンジンの歴史について取材された。そのとき「インターネット検索エンジンがない頃は、どうやってWebサイトを探していたのですか?」と聞かれた。

 筆者がWebアクセスを始めたのは1994年、ブラウザはX Window System上のNCSA Mosaicだった。Internet Explorerはもちろん、Netscape Navigatorもなく、検索エンジンすら世の中になかった時代である。

 当時、Webアクセスに必要なURLを入手するには、以下の方法が一般的だった。

  • 電子メールで聞く
  • ニュースグループやパソコン通信などの掲示板システムで聞く
  • 知っている人に直接聞く

 この方法の利点は、Webサイトの評価も同時に得られることだった。後述するように、今でも、真に役立つ情報は信頼する個人からしか得られないのは変わらない。

 米国でYahoo! サービスが開始したのは1995年である。Yahoo! のサービスは人手による登録であり、ジャンル分けの信頼性は高い。しかし、当時は未登録のWebサイトも多かったうえ、サイトの内容についての信頼性はまったく保証されなかった。そもそも、この種のディレクトリサービスの必要性に懐疑的な人も多かった。筆者もその1人であり、先見性のなさを恥じている。

 プログラムに自動登録機能が登場したのは、1995年末のAltaVistaからであろう。ただし、当時のAltaVistaは検索結果の上位に有益なサイトが来るとは限らず、目的とするWebサイトを特定できないことも多かった。

 AltaVistaの反省をふまえ「ページランク」というアイデアを武器に登場したのがGoogleである。Googleは、いまや、英語でも日本語でも「インターネットで検索する」という意味の動詞となっている(日本語は「ググる」)。

●Googleが情報のすべてではない?

 当然であるが、Googleの検索結果が情報の全てではない。しかし、その便利さから情報検索にはGoogleしか使わない人も増えているようだ。最近は週刊誌の記事でも、Googleと「2ちゃんねる」だけで構成されたのではないかとおぼしき記事が登場しているくらいだ。

 もちろん、Googleにない情報も存在するが、Googleから検索できない情報は存在しないのと同じになっているのが現状ではないだろうか。たまにGoogleにない情報を知っていると、ちょっとしたヒーローである。

 Googleで恐いのは、GoogleがWebサイトの内容について真偽判定をしないことである。Googleの基本的な評価基準は「多くのサイトからリンクを張られているサイトは重要度の高いサイトである」点にある。「多くの人(Webサイト)が重要だとみなしている(リンクしている)人(Webサイト)の意見は重要度が高い」というわけだ。Googleのアイデアが素晴らしいのは「重要度」を「被リンク数」に置き換えたことである。

 しかし、重要かどうかと正しいかどうかは同じではない。アインシュタインは「神はサイコロを振らない」と言い、量子力学を受け入れなかった。「アインシュタインは量子力学を理解できなかった」という事実は重要であるにしても、アインシュタインの意見自体は間違っている。また、米国の一部の州では、進化論を否定する人が多数派だそうだが、ほとんどの科学者は生物が進化したことは事実と考えている。

 Googleは「重要であろうWebサイト」を提示してくれるわけで「正しい情報」を提供してくれるわけではない。ググっているとつい忘れてしまうが、このことは深く心に留めておきたい。

●Googleがすべての情報を握る?

 とはいえ、Googleが持つ情報を利用することで「正しい」情報を得ることも可能だ。重要なWebサイトの内容を比較し、矛盾があれば少数意見を排除する。こうすれば「現在の多数派意見」を取得できる。今の技術では、そこまでの自動解析は困難だが、無理な話ではないだろう。

 厳密な言語解析をしなくても自動化可能なこともある。たとえば、世界中のどの人間も、6人の人を仲介すれば必ず知り合いになると言われている。このような少ない人数で済むのは、一部の「顔の広い人」が「ハブ」になるためだという。

Image

 Googleのリンクをたどっていけば、ハブが誰かは容易に分かる。もし、ハブとなっている人に対して集中的な宣伝活動をすれば、それは多くの人に大きな影響を与えられるだろう。

 もっと恐いこともある。「横山哲也 グローバルナレッジネットワーク」でGoogleイメージ検索をすると、著書の表紙とともに筆者の写真が登場する。これで筆者の顔が特定できた。あとは画像解析の技術を使って、Google内の全画像インデックスに対して再検索すれば、筆者の行動を追跡できるかもしれない(できればそういうことはやめて欲しい)。画像検索は便利かも知れないが、「余計なサービスを始めたものだ」というのが率直な感想である。

●信頼できる情報とは

 では、信頼できる正しい情報を確実に入手するにはどうしたらよいだろう。実はそんな方法は存在しない。

 Googleのページランクは、多少いい加減なところはあるにしても、信頼度の指標にはなると考える人も多いだろう。しかし、Webサイトの内容が正しいかどうかを保証しないGoogleでは、厳密にいうと「多くの人が支持(リンク)している」ということが分かるだけだ。ほとんどの場合はこれで十分だろうが、本当に正しいかどうかは保証されない。内容は自分で判断する必要がある。ちなみに筆者の評価基準は「論理に一貫性があって、(筆者の知る範囲で)正しい根拠に基づいている」ことである。

 筆者は、本当に重要なことについては、原データにあたるようにしている。たとえば「WindowsのバグはLinuxより多い」(第8回参照)ことは、実際にセキュリティ情報を公開している第三者機関のWebサイトを参照した。

 時間的その他の制約により、原データに当たれないときは、筆者が信頼している人や信頼するコミュニティに質問することにしている。何のことはない、インターネット検索エンジン登場以前のスタイルと同じである。

 念のため書いておくが、筆者はGoogleを否定するものではない。むしろ積極的に使っていきたいと思っている方だ。ただ、無条件に信用するのは危険であるということである。先に書いたとおり、Googleは重要なWebサイトを検索してくれるが、Webサイトに含まれる内容の正誤を判断しない。誤解しないようにしたい。

●ソーシャルネットワーク

 最近、SNS(ソーシャルネットワーキングシステム)が話題である。2005年のインターネット大賞はSNSの1つmixi(ミクシィ)であった。

 SNSの面白いところは、人とのつながりだ。たとえば、mixiには「コミュニティ」を作ることで、同好の士を集めることができる。コミュニティは誰でも作成でき、何の審査もない。「既存のコミュニティと内容の重複を避けるように」という注意書きがあるだけだ。

 試しに調べてみた。同じアニメ番組のコミュニティで「魔法の天使クリィーミーマミ」「魔法の天使 クリーミィマミ」「クリィミーマミ」3つがある。このアニメ、正しくは「クリィミーマミ」なのだが、ちょっと変わった表記のため放送当時からしばしば間違えられていた。放送終了後20年以上たってもやっぱり間違われているのがおかしい。

 これは、単に表記の揺れが引き起こした問題だが、表記をわざと微妙に変えることで、別コミュニティとして登録している例もあるようだ。そして、事務局はこれを黙認している。

 筆者が思うに、mixiのコミュニティは、「同じ話題について語り合うグループ」だけではなく「人と人のつながりによるグループ」の機能も持たせようとしているのではないだろうか。人間のコミュニケーションは、会社、学校、クラブ、同好会など、特定の話題や組織で結びつくだけではない。組織を離れても付き合いを続けることもあるだろう。これを一般に「友だち」と呼ぶ。同じ話題に興味があっても「知らない人とコミュニケーションを取るのはいや」という人は結構多い。mixiのコミュニティは、こうした人を受け入れるため、内容の重複について黙認していると推測している。

●検索エンジンの将来

 今年あたり、SNS的な要素を持った検索エンジンが登場するのではないかと筆者は予測している。単なるインターネット検索エンジンはGoogleの1人勝ちである。Ask.jpなどの特徴あるサービスも出てきているが、実際の検索結果はGoogleとそれほど変わらない。だとしたら後発企業が生き残るのは難しいだろう。

 「SNS的な要素」が具体的に何かというのは、筆者にも予想できないが(予想できたらビジネス特許でも取る)、リンク数による評価でも、専門性による評価(これはask.jpが使っている)でもなく、人と人とのつながりを評価する仕組みになるのではないかと漠然と思っている。それはたとえば、従来の検索システムとは異なり、メールベースになるかもしれないし、個人のPC内部を検索するP2Pシステムかもしれない。プライバシーやセキュリティの問題はあるだろうが、公開するフォルダを限定すれば解決できるだろう。SNSのような個人の関係をベースにしたシステムならそれも可能だと思う。友だちが困っていて、自分ができることなら助けてあげたいのが人情である。

 例えば、筆者のPCには今までWindows Server Worldなどの媒体に書いた記事が多数保存されている。権利関係の問題とHTML化の煩雑さから、どこにも公開していないが、友人になら公開しても良いと考えている。こういう例は結構多いのではないだろうか。

 だれでも、求める者は受け、探す者は見つけ、門をたたく者には開かれる。

 「ルカによる福音書」第11章10節(新共同訳)

■□■

 どうもmixiの「コミュニティ」は、既存コミュニティとの重複を暗黙のうちに許可しているのではないかと思う。

 「魔法の天使クリィーミーマミ」「魔法の天使クリーミィマミ」「クリィミーマミ」(もっと増えているかもしれない)などの重複の他、「XXXと○○の好きな人のコミュニティ」なんかもある。XXXと○○のコミュニティは別にあるのに、である。結局のところ、テーマは人間が結びつくための口実に過ぎないと、筆者は思っている。事務局はどう考えているのだろう。

 ところで、Google中国は検索情報の結果を恣意的に選別していることをご存じだろうか。中国国内から「天安門」をググっても、観光案内しか出てこず、天安門事件は表示されない。

 Googleだけではない、MSNやYahoo! も同様である。Googleは「検索結果を削除することはGoogleのミッションに違反するが、何の情報も提供しないよりはマシ」と主張しているらしい(「論座」2006年5月号「世界は検索され尽くすのか」森健著)。

 しかし、こうした「検閲」は人間がやっているのだろうか? 政治的な主張を含むかどうかの判断を自動的に行うのは難しそうだ。自動的にやっているとしたらWebページの解析技術は大したものだ。Googleは、Webサイトのコンテンツ生成に人手を使わないことを信条としているようなので、もしかしたら自動かもしれない。人手でやっているとしたら……ご苦労なことである。中国人の人件費はまだまだ安いのだろうか?

Comment(4)

コメント

bom

リンクが多いものが価値が高いサイト??

SEOを最近勉強した人ですか?悪質にリンクを増やすとサイトランンク下がりますよ

なんか偏見の多い記事。
まったく参考にならないし

>そもそも、この種のディレクトリサービスの必要性に懐疑的な人も多かった。筆者もその1人であり、先見性のなさを恥じている。

先見性無いのだから無駄な事書かないほうが良いと思うよ、、

nil

bomさん、
良くない点を元記事から引用して批判するのは良いことだと思いますが、せめて元記事からの引用より長い考察を書いて批判したらどうですか?
私から見るとあなたのその批判こそ、根拠のない偏見だと思いますが。

「偏見が多い」を具体的に記さないと、どこが偏見かもさっぱりわかりませんし、参考にならないなら「こういうことについて扱って欲しい」などといった建設的な意見を述べるべきでしょう。

これだけだとなんなので私の意見を。
ある意味検索エンジンの持つ意味は年々薄れていっていると思います。
スタティックな企業のWebサイトからの情報より、ダイナミックな、リアルタイムな個人のブログサイトや価格情報サイトに投稿された口コミなどから情報を得るようになり、そのために必要なサイトへは検索サイトを介さずにアクセスできるほど、良くも悪くも「ネットサーフィン」の範囲は狭まっています(と私自身は感じていますが、SNSの流行やインターネットショッピングの普及はその傾向を示していると思います)。
最終的には機械が自動収集した情報に頼るのではなく、全てのインターネットユーザーが自分の目でその情報が正しいか、価値があるかを確かめる必要があるということでしょう。

ただ中国の検閲の件については、「Googleの功罪」というよりは中国の政治的な問題だと思いますので、ここで扱うには少し不適切かな、と思いました。

ycob

>Googleのページランクは、多少いい加減なところはあるにしても、信頼度の指標にはなると考える人も多いだろう。しかし、Webサイトの内容が正しいかどうかを保証しないGoogleでは、厳密にいうと「多くの人が支持(リンク)している」ということが分かるだけだ。ほとんどの場合はこれで十分だろうが、本当に正しいかどうかは保証されない。内容は自分で判断する必要がある。

元記事のこの文を読んでいれば、

>リンクが多いものが価値が高いサイト??
>SEOを最近勉強した人ですか?悪質にリンクを増やすとサイトランンク下がりますよ

こんな考えは起こらないと思うのですが。

閑話休題。

Googleが出始めの頃にインターネットを始めた身としては、
検索エンジンの正確性があがった昨今、非常に便利になってきたと思えます。

ただ、最近はインターネット同士のつながりが大きくなってきたためか、検索結果の1ページ目に同じような情報がずらり・・・なんて事も。
本当に欲しい情報は、ページの奥底にこそあったり。

検索する側の気持ちを反映してくれる検索サイトなんて・・・高望みですかね(笑)

bom

nilさんへ
別に理論的な考察なんてありません。
ただ記事の内容が気に入らな気ので(なんでアインシュタインの例えとか必要か?)

そもそもnilさんと筆者との最大の価値観の違いは

SNSやブログ、個人の情報の方が今は有利というのが私には?です。

そもそも専門家でも無い個人の主観によりブログが利用価値の高い情報なのでしょうか?参考意見程度だと思いますが、、、

mixiなんで業者の温床になっている部分も少なからずあります。
逆にSNSの方がたかが知れてきてるような気がしますけど、、、
なので検索エンジンの持つ意味が薄れてきたとは全く思いません。

ycob
グーグルのページランクはリンクだけじゃ無いでしょ?
って事が言いたいだけです。
この記事ではリンクが多ければと良いと思ってしまう人が出てしまうような書き方でしたから、、、

まあ
どちらにしろ
WEB上の情報を正しく判断するのはユーザー自身です。
検索エンジンが優れてる
SNSが優れてる
なんて話題は幻想でしかないです。

コメントを投稿する