googleでの発見

  • 更新日:
  • IT時事

研究室で調べ物をしているときに発見したgoogleの挙動をメモっておきます。あまり気にしてなかったことだけれど、ちょっと注意してみると面白いことかも。

例えば、検索キーワードとして「ベートーベン」を入力してみます。すると、検索一覧の一番トップには、wikipediaの「ルートヴィヒ・ヴァン・ベートーヴェン - wikipedia」というページが現れます。さて、ここで何が特徴的かというと、「べートーベン」と入力しているのに「ベートーヴェン」に関するページも現れること。つまり、「ベートーベン」と「ベートーヴェン」が同じものを指すことを検索エンジンが認識しているということです。

さらに興味深いことに、「ベートーベン」と「ベートーヴェン」で検索したときにひっかかるページ数が同じではないこと。単純に同一視を行っているだけなら、これが同じになってもいいようにも思えるのですが、そうではないところを見ると、ある条件を満たしている場合のみ同一視を行っていることになります。その条件が何かのかはよく分かりませんが、この挙動もそれなりの理由があってのことでしょう。

今回気づいたのは「ヴェ」⇔「ベ」、「ヴ」⇔「ブ」だけだったのですが、他にも同一視をしている文字はありそうな気がします。

Track Back

Track Back URL

コメントする

公開されません

refresh captcha

画像の中に見える文字を入力してください。

このページの上部へ

About

tetsuの日記・雑記です。
日々経験したことを記録していきます。

広告

サイト内検索

最近のピクチャ

  • リアディレーラ

月別アーカイブ

最近のコメント