週刊少年ジャンプの連載作品名からGoogleのアダルト語判定アルゴリズムの挙動を推測する
Googleはアダルトであると判定された検索文字列に対し、サジェストを表示しないらしい。その事実はなんとなく知っていたのだが、先日「セクシーコマンドー外伝 すごいよマサルさん」に対してサジェストが一切行われない事に気づき、どういう挙動をしているのかと興味を持った。
結論としては、おそらく辞書ベースでアダルト語と判定されたものを含む検索文字列に対してサジェストを表示しない、ということをしているようだ。結論に辿り着いた経緯を以下に示す。
「セクシーコマンドー外伝 すごいよマサルさん」は、読んだのがだいぶ昔なので記憶はやや曖昧だが、特にアダルトな内容の含まれない、週刊少年ジャンプ連載のマンガであったと記憶している。つまり、これは誤判定だと私は考える。
一方「究極!!変態仮面」は、ややアダルトな内容の含まれるマンガである。こちらも週刊少年ジャンプに連載されていた。変態仮面はサジェストが出てこなくても仕方があるまい。実際、サジェストはされない。
変態仮面は近年映画化されたのだが、映画は「hk 変態仮面」というタイトルであった。ここで、「hk」に対して「変態仮面」はサジェストされるかというと、「変体仮面」という奇妙な(変換ミス?)サジェストのみが行われるのである。
ここから、「変態」という文字列が入っていたらサジェストから外されるのではないか、と推測ができる。実際、「昆虫 変態」などと入れても、何もサジェストされない。「蝶」みたいに代表的な例がサジェストされてもよさそうなものなのに。
この推測の確からしさを高める傍証として「セクシーフットボール」がある。これは野洲高校のサッカーに対する肯定的な表現なのだが、アダルト的な要素はどこにも入っていない。しかし、セクシーフットボールに対しても、サジェストは一切行われない。
以上から、次のように推測できる。
- 「セクシー」「変態」のような言葉が入っている場合、Googleはアダルト語であると推測し、サジェストを行わない。
- 「セクシーコマンドー」「セクシーフットボール」などはそのとばっちりを受け、サジェストが表示されない。
なお、以上は、2013年8月現在のGoogleの挙動に基づく推測である。