研究室で調べ物をしているときに発見したgoogleの挙動をメモっておきます。あまり気にしてなかったことだけれど、ちょっと注意してみると面白いことかも。
例えば、検索キーワードとして「ベートーベン」を入力してみます。すると、検索一覧の一番トップには、wikipediaの「ルートヴィヒ・ヴァン・ベートーヴェン - wikipedia」というページが現れます。さて、ここで何が特徴的かというと、「べートーベン」と入力しているのに「ベートーヴェン」に関するページも現れること。つまり、「ベートーベン」と「ベートーヴェン」が同じものを指すことを検索エンジンが認識しているということです。
さらに興味深いことに、「ベートーベン」と「ベートーヴェン」で検索したときにひっかかるページ数が同じではないこと。単純に同一視を行っているだけなら、これが同じになってもいいようにも思えるのですが、そうではないところを見ると、ある条件を満たしている場合のみ同一視を行っていることになります。その条件が何かのかはよく分かりませんが、この挙動もそれなりの理由があってのことでしょう。
今回気づいたのは「ヴェ」⇔「ベ」、「ヴ」⇔「ブ」だけだったのですが、他にも同一視をしている文字はありそうな気がします。
コメントする