こんにちは。Yahoo!検索スパム担当ヒュケナです。今回はいくつか補足します。

ふたたび、Yahoo!検索スパム担当ヒュケナ氏からのご挨拶。

  • 「リンクスパムとして報告されたURLのほぼすべてが『スパム』」に補足します – Yahoo!検索 スタッフブログ

スパムURLデータ、YSTの機械学習モジュール、ドメインの信頼性の判定

今回も、Yahoo!検索スパム担当ヒュケナ氏は示唆的なお言葉を残している。

サイトエクスプローラーの被リンクスパム報告機能から報告いただいたURLは、Yahoo!JAPANおよびYahoo!が独自に収集しているスパムURLデータとともに、YSTの機械学習モジュールに取り込まれ、最終的なスパム判定がなされるとともに、検索結果順序の決定の要素のひとつとして利用されています。

まず、ヤフー検索のスタッフは、日米ともに、スパムURLデータを収集しているということ。

さらに、スパム判定するプログラムがあって、モジュールを利用していること。

で、スパムは順位の決定に影響を及ぼすと。

なお、スパムサイトからリンクが1つでもあるとペナルティとされるとは限りません。これは、検索結果表示順序やドメインの信頼性の判定が、単一の要素だけでは決定されていないことと同様です。最終的なリンクスパムの自動判定は、リンクされるサイトとリンクするサイトの内容のオリジナリティや関連性、リンクの量などさまざまな要素を考慮して行われます。

ここで気になるのは、ドメインの信頼性の判定、である。

優良ドメインとか、不良(スパム)ドメインとか、そういう判定があるということだろうか。

ドメインが悪判定されれば、ドメイン丸ごとペナルティ、かつ関係が深いリンク・被リンクドメインも、一蓮托生という感じだろうか…

まあ、ドメイン丸ごと「Yahoo!八部」というのは、いくつかあるようだが。
グーグル八部とはサイト丸ごと、ディレクトリ丸ごとのインデックス削除であるが、ヤフー八部はインデックスには残すが上位表示はさせないというペナルティになる。

そして、スパムのペナルティとは離れて、Yahoo!アルゴリズムの一端を語ってくれた。

「リンクされるサイトとリンクするサイトの内容のオリジナリティや関連性、リンクの量などさまざまな要素を考慮」

気になるのは、ページではなくサイトと書いてあることである。上記のドメインの信頼性とも相応する言葉である。

«
»