
ホーム > サイトマップ > 過去のコラム > チーフディレクター、小川のコラム > コラム:検索エンジン最適化(SEO) - 検索エンジンスパムとは(1)
チーフディレクター、小川のコラムです。
OvertureがAltavistaとFast(AlltheWeb)を買収しました。Googleもブロガーを買収しました。日本でもLYCOS Japanの株主がTerra Networksから楽天へ変わり、それに伴ってLYCOS Japanのロボット検索エンジンがinfoseekになったりと検索エンジン業界の変化は激しくなる一方です。追っかけてるだけで息切れしそうですね。
| Overture | FAST、Altavista |
|---|---|
| Yahoo! | Inktomi |
| Looskmart | WiseNut |
| Ask Jeeves | Teoma |
| 楽天 | Infoseek Japan |
検索エンジンスパム(またはサーチエンジンスパム、spamdexingとも呼ばれます)とは、不正な方法でwebコンテンツを作成し、ロボット型検索エンジンの検索結果の上位表示させること、あるいは検索エンジンの上位表示だけを目的としたHTMLのコーディングを指します。インターネット上で情報を探すのにロボット型検索エンジンが利用されるようになって以来、様々なスパム手法が生まれました。それらのスパム手法は、検索エンジンの検索アルゴリズムの進化によって淘汰され無効になったものもありますが、手法によっては今なお効果を持つものもあり、検索エンジンスパムは検索キーワードとそれによってランキングされる検索結果の整合性を乱し続けています。
検索エンジンスパムを使っているとみなされたサイトは、ロボット型検索エンジンからペナルティーを受けます。そのペナルティーとは「検索結果からの除外」や「検索結果順位の低下」というもので、永久ではないにしろ長期的にこの措置をとられます。検索エンジンスパム行為を行っているサイトをGoogleに報告(密告?)するページもあります。個人の趣味のサイトであれば実害はさほどありませんが、商業ページの場合は次の日から客が来なくなるのですから大変です。このような処置をとられないよう、どのような行為が検索エンジンスパムとみなされるかを知り、そして知らず知らずのうちに検索エンジンスパムを使ってしまわないようにする知識を持っておく必要があります。
検索エンジンスパムにはこのようなものがあります。
「隠しテキストスパム」とは、検索エンジンのスパイダーに読み込ませる事のみを目的としたテキストを人の目に見えないように隠したり(Hidden Text)、読めないような小さいサイズ(Tiny Font)で記述する事をいいます。「Hidden Text」は<BODY>タグで設定した背景色と同じ色で設定する事で実現出来てしまいます。「Tiny Font」は<FONT>タグで<FONT SIZE=1>とすることで実現出来てしまいます。そしてこれらの検索エンジンスパムは、同ページ内の<BODY>タグや< TITLE>タグの中に繰り返し上位表示させたいキーワードを記述する「Keyword Repetition」と呼ばれる検索エンジンスパムと併せて使用される場合が多く、主にキーワード出現頻度をコントロールするために利用されています。
「ALT 属性テキストスパム」とは、<IMG>タグのALT属性にその画像自体とは全く関係ない上位表示させたいキーワードを記述する事です。たちの悪いものになると1×1ピクセルの小さな画像を複数用意して、その複数の画像全てのALT属性に<ALT=データ入力 ホームページ作成文章入力>等、上位表示させたいキーワードを詰め込んだりしています。この検索エンジンスパムも、主にキーワード出現頻度をコントロールするために利用されています。
「複数コピーページスパム」とは、特定のキーワードに対し最適化されたページの複製を複数用意し、検索エンジンに登録してしまうことにより検索結果の上位を自サイトで埋め尽くしてしまう事をいいます。いくつかの検索エンジンで実装されているクラスタリングという技術により、この行為は無効化しつつあります。しかし複数のドメインを用意されると今でもこの検索エンジンスパムは通用してしまいます。試しに「ALT属性スパム」をGoogleで検索してみてください。同じような内容のページが複数出てきたと思います。これが「複数コピーページスパム」です。
次回も、検索エンジンスパムについて書いていきたいと思います。