
ホーム > サイトマップ > 過去のコラム > チーフディレクター、小川のコラム > コラム:検索エンジン最適化(SEO) - 検索エンジンスパムとは(3)
チーフディレクター、小川のコラムです。
先日「ネットオークションの運営管理者がネット犯罪のほう助罪で逮捕」という記事が流れました。(不起訴になったそうです)このような記事が流れると「そのサイトが行っていた事が見たい」と思うのが人の子というものです。そんなとき役に立つのが(?)「Internet Archive Wayback Machine」です。このサイトは「既に閲覧できなくなっているページを、過去にさかのぼって見ることができる」というサービスを展開しています。サイトの中央にあるテキストボックスにURLを入力すればそのサイトの過去を見る事ができ、先ほどのオークションサイトの過去が見たいと言う事ならば「http://www.guruguru.net/auction/」と入力すれば見る事ができます。しかし残念ながら現在から最近半年ぐらいまでの過去はデータベース化されていなく見る事ができません。そんな時にはGoogleのキャッシュで見る事もできます。GoogleでそのサイトのURLを検索して「Googleのキャッシュ」を押すだけです。
さて、前回も前々回も書きましたが(しつこい?)、検索エンジンスパムとは、不正な方法でwebコンテンツを作成し、ロボット型検索エンジンの検索結果の上位表示させること、あるいは検索エンジンの上位表示だけを目的としたHTMLのコーディングを指します。検索エンジンスパムを使っているとみなされたサイトは、ロボット型検索エンジンからペナルティーを受けます。どのような行為が検索エンジンスパムとみなされるかを知り、そして知らず知らずのうちに検索エンジンスパムを使ってしまわないようにする知識を持っておく必要があります。
検索エンジンスパムには、前回の「ドアページスパム」「フェイクコピースパム」「メタタグスパム」以外にもこのようなものもあります。
Flash や画像ばかりのページの場合、スパイダーが内容を理解できないので表示順位の評価を上げることがなかなか出来ません。しかし「クローキング」と呼ばれる技術を利用すれば、訪問者が人間かスパイダーかを判断して、スパイダーの場合はテキスト主体の(あるいはテキストのみの)キーワードに最適化されたページを見せ、人間の場合はFlashや画像ばかりの見栄えの良いページを見せるといった事ができます。訪問者がスパイダーか人間かの判断は「User- Agent」や「IPアドレス」で行います。
「User-Agent」とは「どの種類のブラウザを利用しているか」という情報で、人間が「Netscape7」を利用していれば「Mozilla/5.0」、Googleのスパイダーなら「Googlebot/2.1」といったものです。SSI等を利用すれば「User- Agent」を知る事ができます。またスパイダーのIPアドレスはある程度決まっているので、そこからもクローキングができます。「User- Agent」と「IPアドレス」のクローキングを比べた場合「IPアドレス」を利用したクローキングの方がよく使われているため、(こちらの方が精度が高いからだそうです)「クローキング」=「IPクローキング(IPアドレスを利用したクローキング)」を指す場合が多いようです。
そして一歩進んだ(?)IPクローキングになると人間かスパイダーかの判別の後、スパイダーの場合はどの検索エンジンのスパイダーかを判断します。 Googleのスパイダーが来た場合はGoogleに最適化されたページへ、Infoseekのスパイダーが来た場合はInfoseekに最適化されたページへと、すべての検索エンジンに最適化されたページを構築する事が出来ます。
「リンクスパム」とは、「リンクポピュラリティーを上げる事だけを目的としたリンク」のことを呼びます。これは「PageRank」や「WiseRank」や「マルチ・プロセス・スコアリング」等、リンク要素を考慮した検索エンジンが増えてくるにつれて広まってきたスパムです。リンクスパムには「隠しリンク」や「リンクファーム」があります。
「隠しリンク」とは人間の目に見えないように張ったリンクで、背景と同色の画像からリンクを張ったり「.」のような目立たない記号からリンクを張ったりします。その先にリンクファームを置いたり、※クロールファイルを置いたりして利用されます。
「リンクファーム」とは、全く無関係なテーマのページが多数集まったリンク集で、リンクポピュラリティーを上げる事だけを目的として相互にリンクを張ったりするスパムです。悪質なSEO業者にSEO対策を依頼してしまった場合、SEO対策をするついでに勝手にリンクファームに参加させられてしまう場合もあります。「リンク集からはずして欲しい」といっても「規約で決まっているから無理」といって断られたケースもあったそうです。
SEO業者の中には「テーマが一緒のページのリンク集」を構築するサービスをしている業者もあります。「テーマが一緒」なのでスパムとはならないと思いますが、ちょっと微妙な感じもしますね。
クロールファイルとは、サイトマップをもっと簡単にしたようなもので、スパイダーが全ページを巡回(クロール)しやすいように作ったページです