5月31日にYahoo! Japanが独自の検索エンジンを採用しました。したがって、検索数や検索結果評価に新たにYahooの調査を追加しました。
まず、検索数調査でYahooは今までトップのfreshEYEに比べて約1.7倍の結果を示しました。米Yahooの検索数も他に比べて多く、検索数ではトップを維持しています。検索数調査の結果は、1位 Yahoo 100.0、2位 freshEYE 59.2、3位 Google 56.3、と下部の表のようになりました。
Yahooのデータ数は公表されてませんが、Webの場合、情報量の異なる分野から収集するため、データ数自体あまり意味がなくなりつつあります。その点、検索数調査は有力ですが、検索サイトにおける検索数のカウント方法が異なるため、同じ次元で比較するのも難しくなっています。
次に検索結果の評価を行いました。新たにYahooのデータを追加し、他の検索サイトのデータは前のものを使いました。YahooとfreshEYEの検索結果は類似しているため、一緒に評価すると互いに有利になるため、評価基準の作成の際にはfreshEYEを外しました。そのため、freshEYEの評価は少し不利になっています。
検索評価は、1位 Google 100.0、2位 Yahoo 87.7、3位 freshEYE 69.7、と下部の表のような結果が得られました。新しく提供されたYahooのページ検索がどれ位の性能を持つのか、誰にもわかりません。検索をよく利用する人の主観的な評価はどうなるのか知りたいのですが、ランキングだけでない要因がありますのでなかなか解決しません。
YahooはAltaVista、Inktomi、Allthewebを買収しています。AltaVistaやAllthewebは多言語データベースを構築し、日本語コード問題を解決し、運用していました。InktomiはHotBotやgooを運用していましたが、日本語だけ別扱いのように感じました。
Yahooは先に英語の方を提供しましたが、その多言語データベースの日本語はまだ未提供です。日本語に設定して検索すると、一部の日本語文字列で検索できませんでした。これは米Yahooだけでなく、Allthewebでも同様な結果が示されるようになり、AltaVistaにいたっては日本語コードを受け付けなくなってしまいました。データベースをUnicodeに統一したためでいずれは解決するものと思っています。
しかし、今回の日本語検索サービスは米Yahooのとは異なってるようです。そのベースはAltaVista?、Inktomi?、Alltheweb?、のどれかです。Inktomiは、現在、freshEYEとMSNで運用しており、両者の検索結果は同じです。今回のYahooはそれらとは若干異なっていますが、紹介文の作成方法は同じです。ランキング方法の変更、データの増量、収集分野や時期の相違、などで結果は異なってきます。昨年秋までgooはInktomiを採用していましたが、今回のYahooは以前のgooのリバイバルなのかも知れません。
Googleには「Web全体から検索」と「日本語のページを検索」の検索オプションがあります。freshEYEは前者の「Web全体からの検索」だけしか検索できないですが、今回のYahooも同様に「Web全体からの検索」だけです。英語や中国語で使われるキー(例えば、vrml、文学、生物、など)で検索すると日本語だけの検索に比べて検索数は多くなる傾向があります。
リンクをベースにしたGoogleの検索はサイトとページの垣根を除くような検索をします。検索数が数十万以上の検索は本来ディレクトリーのサイト検索がカバーする領域です。ページ検索は検索数が1万に満たないような検索で本領をはっきするものと思っています。検索サイトがすべてのコンテンツを収集できない現状を考えると、できるだけ多くの異種の検索サイトが存在し、アクセスできることは意義のあることです。