1999年10月にGoogleがリンク情報を利用した検索システムを登場させ、日本語Googleは2000年9月から本格サービスを始めています。この特徴は検索結果のランキングが優れていることです。それにポータル化を進めている他の検索サイトが盛沢山な情報を画面いっぱいに表示するのに較べて、検索に特化した結果をシンプルなデザインで表示しています。最近、日本語Googleは新しい形態素解析を導入し全文検索を強化しています。
新しい技術を取り入れたサービスが登場すると、他の検索サイトは3〜6ヶ月でそれに対応します。gooは昨年10月ごろから頻繁にシステムの更新を繰り返して第3世代検索エンジンを開発し、総合的にみてGoogleよりもよい結果を得ています。7月1日の関連検索の調査では、1位 goo 100、2位 ODiN 89、3位 Google 83、4位 kensaku 73、となり、ODiNはGoogleよりもよい結果になっています。特に、kensakuは5月7日の0から7月1日の73へと、検索システムは1ヶ月半で大きく向上しました。
第3世代のデータベースはばらばらのページという概念から離れ、ページを連結したり、ページに関連した情報を取り込んだり、ページ間の関連性を定義するものになります。何を追加するかが問題ですが、人手で追加するのは不可能で、自動的に付加できるのが一番望ましいです。単純な方法としては階層下部のページを連結することです。また、Googleのようにリンク情報を利用してページ間の関係を利用するのも一つの方法です。
第3世代の検索エンジンによる検索は、ランキング表示が改善されることと、それに付随して重点的なデータ収集が可能になること、です。現在、Googleはリンクを使ってランキングをしています。goo、ODiN、Nexearchなどもリンク情報を使い始めました。第2世代ではリンクを単に表示していただけですが、第3世代ではリンクを検索に利用するようになりました。ここで困ったことに直面しました。それは第3世代検索エンジンを識別するものが見つからないということです。
第3世代検索エンジンの検索は、従来のものとは幾分異なった現象が現れます。関連情報も一緒に検索するため、従来のキーワード検索のルールは適応しなくなります。まず、検索したページのなかに検索キーワードが存在しない場合もでてきます。それからラフなキーワードを使っても、同義語をある程度カバーするようになります。そして、検索結果は多くなり、AND検索はあいまいになるなど、検索の常識を書き換えなければなりません。