ディレクトリ型と全文検索型

「全文検索型」は、検索ロボットが利用されているため「ロボット型」とも呼ばれています。ディレクトリ型と比較すると、全文検索型の方が情報量も多く、新鮮な情報も多いと言えるのですが、検索ロボットによってはPDFファイルやテキストファイル、文書ファイルも回収してしまうので、機密文書が公開されてしまう、などの事故も発生しています。代表的な全文検索型の検索エンジンには、「google」や「goo」などがありますよ。

インターネットがあれば、検索エンジンを利用して知りたい情報を手軽に調べることができますね。googleはロボット型検索エンジンとして圧倒的なシェアを持っている検索サイトなのです。世界中の全てのホームページの内容をデータベースに保存して、検索ロボットがデータベースから結果をはじきだしています。

Yahoo! Japanやinfoseek、msnなどのディレクトリ型検索エンジンでは、ディレクトリ型とロボット型を併用しています。「ディレクトリ型」は人の手作業でページを分類し、データベースに登録する方法です。このデータベースの作り方の違いで、「ディレクトリ型」と「全文検索型」の2種類の検索エンジンに分けることができます。

検索エンジンは、ウェブサイトに公開されているたくさんの情報を集めてテータベースを作っています。ディレクトリ型で該当するページが検索できなかった場合、自動的にgoogleの検索結果が表示されていますよ。検索ロボットは、常にインターネット上のホームページのリンクをたどっていて、データベースに登録されていないものや、更新されたものを発見して回収しています。