
ホーム > サイトマップ > 過去のコラム > チーフディレクター、小川のコラム > コラム:Yahoo! Japan(YST)検索実験おぼえがき
チーフディレクター、小川のコラムです。
Gmailアカウントをゲットしました。噂の1GBも使いたい放題です。
しかし・・・、ゲットしたはいいんですが、いつも使っている「Mac IE5.1.7」では使えないようです。悲しいッス。
下記の記事は6/25に確認できた現象です。6/28に確認したところ、いくつか結果が変わっていました。
前回のコラム「Yahoo! Japan(YST)の検索アルゴリズム」で、米Yahoo! の登録フォームからの申請でYahoo! Japanへも登録されるかどうかの実験をしました。結果的に登録されたのですが、その時色々おかしな現象がありました。今回はその時の現象についてのおぼえがきです。おぼえがきですので「そんな事もあるんだ、フ〜ン」ぐらいの軽い気持ちで読んでください。
登録申請からインデックスされるまでに1週間、検索結果に表示されるまでに9日間かかった事がわかります。米Yahoo! へ登録申請してYahoo! Japanで検索結果に表示されているという事は、データベース自体は共通のようです。米Yahoo! とYahoo! Japanでは、検索結果に表示するところから別々の処理をしているのではないでしょうか。ですので6/25現在、米Yahoo!では検索結果に表示されていませんが、インデックスはされていると思いますので、もう少ししたら表示されるようになるでしょう。
6/28追記
米Yahoo!でも検索結果に表示されました。
6/25現在、Yahoo! Japan(YST)では「サイトマップ - 糸の鈴富(愛知県名古屋市)」というタイトルのページのみ検索結果に表示されています。色々実験してみたところ、なんかおかしいです。その現象をまとめてみました。
「= キーワード site:サイト名」というのはYahoo! Japan(YST)でのサイト内検索の構文です。下記の表はYahoo! Japan(YST)で「検索キーワード」を検索したときに、検索結果に表示されたかどうかを載せています。「検索キーワード」はすべてそのページ内に含まれている言葉です。「含める」「含めない」は表記のゆれの事です。(ディフォルトでは「含めない」になっています)
| 検索キーワード | 含める | 含めない |
|---|---|---|
| ボタンつけ | ○ | ○ |
| GTOボタンつけ | × | ○ |
| GTOボタンつけ糸 | ○ | ○ |
| ボタンつけ 糸 | × | ○ |
| ボタンつけ糸 | ○ | × |
| http://www.suzutomi.jp/ | × | × |
| http://www.suzutomi.jp/6site.html | × | × |
| =サイトマップ site:suzutomi.jp | ○ | ○ |
| =市 site:suzutomi.jp | × | ○ |
| =サイトマップ - 糸の site:suzutomi.jp | ○ | × |
| GTO ファイブ | × | ○ |
| =GTO ファイブ site:suzutomi.jp | × | ○ |
| GTOファイブ | ○ | × |
| =GTOファイブ site:suzutomi.jp | ○ | × |
| =サイトマップ - 糸の鈴富(愛知県名古屋市) site:suzutomi.jp | ○ | ○ |
| サイトマップ - 糸の鈴富(愛知県名古屋市) | ○ | × |
どうです、おかしくないですか?「GTOボタンつけ糸」はYahoo! Japan(YST)の形態素解析では「gto ボタン つけ 糸」となります。ですので「ボタンつけ糸」で出ないのはおかしいです。同様に「サイトマップ - 糸の鈴富(愛知県名古屋市)」は「サイト マップ 糸 の 鈴富 愛知県 名古屋 市」となるので「=サイトマップ - 糸の site:suzutomi.jp」で出ないのもおかしいです。表記のゆれを「含める」「含めない」でやたらと検索結果が違いますし、果てはURLで検索しても表示されません。
予想できる現象としては、色々なパターンのキャッシュを持っていて徐々に更新しているのか、ページの一部をインデックスしているという事なんでしょうか。
![]()