アルファサード株式会社 代表取締役 野田 純生のブログ


Google 対 Yahoo!


公開日 : 2007-05-15 00:44:32


えーっと、検索の質とかそういう問題ではなくて。

Another HTML-lint gatewayでのチェック結果。

  • Google 日本
    80個のエラーがありました。このHTMLは -215点です。
  • Yahoo! Japan
    869個のエラーがありました。このHTMLは -443点です。

点数だけで比較は出来ないですね(っていうか、どっちもどっち)。タグが 29種類 1462組使われています(Yahoo!)、とタグが 28種類 62組(Google)だからね。

こうやって書く理由ですが単なるHTMLへの純粋な?ツッコミではなくて、ちょっと昨日今日と苦労したのだ。

ってのを作ってみたのだ。「できるだけ音声ブラウザで読みやすいHTMLを返すゲートウェイ」。

最初はMovable Typeのプラグインを書いていたのだ。テキストバージョンテンプレートってのを作って完全なるJIS X8341-3対応! ってのを考えてね。

だいたい出来たところで、(基本的にHTMLを正規表現でああしてこうして...)「これやったら別にMT限定じゃなくてゲートウェイとか作ってみたら実用性があるんじゃないだろうか...」ということで改造して置いてみた。自分のブログとか会社のサイトとか閲覧してさ、だいたいこんなもんでいけるんかなと思ったあたり...

実際に使うとなったらやっぱり検索エンジンとか必要だろうなぁ...ということでGoogle!(ん?、何かおかしい), Yahoo(レイアウトが変...)

ひどかったのはYahoo!のほうだったので、つぎはぎ的に修正して修正して...うん、なんとか使えるに耐える...って、遅い!

CSSベースになっていない、、ってのは百歩譲って。両者に共通なのは、


GoogleもYahoo!も属性値を引用符で囲まない!

MTプラグイン作って自分で動かしている時は気にならんかったわけだ。ところがYahoo!やGoogleだとスタイルシートちょんぎってプレーンにしたつもりがちょん切れてない。

タグの大文字小文字もばらばらだし、Googleは改行がなくて見にくいし。

容量減らすために「引用符」「改行」を省略してる!? トラフィック気になるならロボットの振る舞いなんとかしなよ!

まぁ処理が遅いのは自分の書き方が悪いのだけど、もういい加減なんとかならんかね。 正規表現やのうて、最初からパーサーで処理した方が賢かった...というか、パースできんのかね。

肩で息するくらいに吠えたところで両者を改めて見た感想。

Yahoo! JapanとGoogle! 日本はユーザーの層もコンセプトも違うからそのままトップページを比較しても意味がないだろう。検索結果に絞って見る。


Yahoo! Japanの検索にLibwwwからクエリーを投げると「広告」が表示されない模様。


my $ua = LWP::UserAgent->new(agent => "Naked/0.1");

という感じ。最初はuse LWP::Simple;を使って「get ...」とかやってたんだが各所で話題の通りGoogleが何も返してくれなかったので適当なua名でアクセス。Googleは広告付きで返してくる。Yahoo!は広告が表示されないようだ。


Googleの検索結果は広告と検索結果が識別困難

以下、とりあえず消さないまでも、なんていうか見つけたので。


my $ua = LWP::UserAgent->new(agent => "Mozilla/5.0 (Macintosh; U; Intel Mac OS X; ja-jp) AppleWebKit/419 (KHTML, like Gecko) Safari/419.3");

とすると、つまりSafariと偽ってアクセスすると検索結果をh2で返してくる


my $ua = LWP::UserAgent->new(agent => "Naked/0.1");

とすると見出しにならない...よくわからんがYahoo!もGoogleもUAによって結果が違うのね。

一番気になったのは、Googleの検索結果で「スポンサー広告」と検索結果の識別が出来ないことだ。もちろん視覚的にはできるわけだがYahoo!のように見出しが入っているわけではないから、どこまでがスポンサー広告でどこからが検索結果なのかが理解不能。せめて見出しかアンカーがあれば良いわけだが(もっともYahoo!についても「見えない」ので何とも言えないが(まさかCSSでtext-indent:-1000pxとかやってるわけじゃないだろうな!)実際にどうかはCSS見るか実際に音声ブラウザで読み上げるしかないけど)。

トップページの入り口の好き嫌いはともかく、検索結果の表示を見るとYahoo!に軍配をあげよう。

一瞬、このエントリー見て速攻修正したのかと思った。まさか、ね。いやまじおどろいたよ。

# でもトップページの情報多すぎ(多いのはまだ良いがバキバキのテーブルレイアウトは良い加減何とかしませんか?)。宜しければ誰がご紹介いたしますが...


参考:検索結果のキャプチャ

カテゴリ


このブログを書いている人
野田純生の写真
野田 純生 (のだ すみお)

大阪府出身。ウェブアクセシビリティエバンジェリスト。 アルファサード株式会社の創業者であり、現役のプログラマ。経営理念は「テクノロジーによって顧客とパートナーに寄り添い、ウェブを良くする」。 プロフィール詳細へ