最近の Google

ryojiikeda
  • ????????????????????

最近は Google に対してネガティブな論調が目立ちますね。

アルゴリズムにしがみつくGoogleは明日の検索でピープルパワーのFacebookに負ける

ここ1、2年でしょうか。結構散々な言われようです。あまり話題にあがらなくなってきたマイクロソフトよりはいいと思いますが…

確かに最近の Google の検索結果はひどいものですが。上位の記事がほとんどコピペページだとほんと、イライラします。まあいろんなものをタダで提供してくれたりするいい会社だとは思いますが。最近はすべてが後追いになっていますね。はじめて Google 検索使ったときとか、Gmail を発表したときとか、昔はほんと魔法を使っているんじゃないか?という感じだったのですが…

Google のページランクの仕組みを知ったときは深く感動し、興奮しました。ペロン・フロベニウスの定理。実用的にもクールだったけれど、理論的にも美しかった。

しかし、美しい理論は悪意を持ったスパマーに負け続けているわけですね。おそらくページランクのウェイトは下がって、「内容得点」なるものが高いウェイトを持つようになってきているはずです。その「内容得点」なるものはどのようにスパムを判定しているのでしょうか?もし(if-then式の)エキスパートシステムを使っているならばもちろん勝ち目は無いはずです。学習型の判別器を使っているとしたら、その学習データはどのように収集すればよいのでしょうか?過去の蓄積データ?それでは新しいパターンのスパムに対応できませんね。やっぱり最後はある程度の規模を持った人間の集団を使って彼らに労働させるわけですね(たとえば「いいね!」ボタンを押させるなどして)。

「いいね」検索。まあ、一時的にスパムは減るでしょうね…世界中の優秀なスパマーたちに勝てるとは思いませんが。それにロングテールの部分はどういう風に処理するんですかね?「いいね」が0件だからスパム判定?そんなバカな!まあ現実には「いいね」スコアを使って機械学習させてそれを外挿していくような感じでしょうか?

ハイブリッド検索。Google も bing も「いいね」も Altavista も Wolfram alpha も何でもかんでもごちゃ混ぜの投票制。機械学習で言うところのブースティングですね。これだとスパマーたちも苦労しそうです。各社がこんなこと許すとは思えませんが。自分用に実装してみると面白そうですね。この程度のアイデア、すでに実装されてそうですが。

論点がぼやけてきたのでこの辺にしておきますが、Google にはがんばってほしいです。自動運転カーとかよくわかんないことやらずに。

はてなブックマーク - 最近の Google
Pocket