グーグルの複数のインデックスが物理的な分割ではなく論理的な分割だとしたら

海外SEO情報ブログで、鈴木謙一さんがこのように投げかけてきた。

Googleには複数のインデックスが存在する » 海外SEO情報ブログ・メルマガ

テクニカルなテーマだったので「へぇ~、だからどうしたの?」という読者さんが多そうですが、SEO塾の石崎さんには喜んでもらえたのではないでしょうか?(笑)

これにどう応えようか、あれこれ迷ったのだが、先ほど重大なことに気づいたので、それに沿うようなかたちで返しをしておこう。

物理的ではなく論理的にインデックスが分割されることの意味

Googleのインデックスの容量、つまり格納しているWebページの数は、1兆ページを越えているそうだ。
参照:グーグルのインデックスが1兆ページ越え 2008-07-25公式ブログで発表

そして、PageRankは、まずはトピック・キーワードとは無関係に、全ページ1つ1つに対しリンク関係をサルベージして、その量と質においてランクをつけている。
このPageRankは、ツールバーでは、無しと0から10までの12段階しか見えないのであるが、内部的には細かな数値になっている。
参照:第4回 ページランクの通説と真相(前編)~ページランクの2つの値:MarkeZine(マーケジン)

理論的には、1兆ページをベタに並べて1ページずつリンク関係を精査しているはずである。

この考えに立つならば、Googleのインデックスは1兆ページを物理的に複数のハードディスクに分割して格納しているものの、シームレスにリンク関係を参照できるようになっていなければならない。

だから、海外SEO情報ブログが問題にしている複数のインデックスとは、このような物理的な分割を意味してはいないことは、お分かりいただけるだろうか?

鈴木さんの記事によると、ネガティブな方は昔の補足インデックスが挙げられており、ポジティブな方はTrustRankとかseedとかを発したり受けたりする超優良インデックスを想定している。

後者については、先日起こったGoogleのTDPのような、主にトップ表示されていたページが一瞬神隠しにあった現象の説明として、TrustRankとかseedとかの紐をつけ忘れたために、超優良インデックスに格納できずSERPsから消滅したのではと。

TrustRankとかseedとかについては、例えば履歴書に書く学歴や資格、あるいは誰それの紹介・縁故といった後ろ盾、つまり本人に箔をつけるバックボーンといったものと思っていいだろう。
能力に差がないと見えたら、バックボーンがしっかりした方を信用すると。

これがあるから、能力がないかもしれない世襲のセンセイも、ジバン・カンバン・カバンというバックボーンで当選するわけだ。

論理的に分割されるインデックス

さて本題に戻って、もしインデックスが論理的に分割されていて、(B)普通の場所と、(A)VIP席と、(C)カスページ席があり、それも所定のルールがあるとしたならば、(A)にあるページは常に上位表示候補ということになり、逆に(C)に追いやられたページはいつも圏外ということが考えられるのである。

さらに「所定のルール」も問題で、先の瞬間神隠しのような大規模な事件であれば騒がれるが、個別のページがGoogle様の判断または事故でTrustRank・seedがはがされ(A)の部屋から追い出されてSERPsから消えても、サイトオーナーが独り悩むだけで終わる可能性もある。

(C)の吹き溜まりに押し込められたら一生這い上がれないかもしれない。

そして想像をたくましくすれば、ここでは簡単に3とおりのインデックスで説明したわけだが、これがサイト・ドメインやページの格付けによっていくつもに区分されていたとしたならば、Webの身分制がGoogleの中でしかれていると言えるのである。

Yahoo!の場合は、商売っ気を出した恣意的で無邪気な差別化でしかないが、Googleにおいては、首尾一貫したストリクトな階級制度となっているかもしれないのである。

海外SEOブログで紹介された、激戦キーワードではGoogleのアルゴリズムが変位するといったSEOエキスパートの検証結果なども、このGoogleカースト制度の証左ではなかろうか。

『赤と黒』の主人公ジュリアン・ソレルが、ナポレオン失脚後の王政復古のフランスで成り上がるには、赤い軍服を着るか、黒い法衣をまとうしかないと思ったように、超激戦キーワードで上位表示されるためには、キーワードを書くとかリンクを受けるとか通り一遍では済まず、TrustRankやseedのような赤と黒によって上流階級に上り詰めるしかないのである。

Googleの検索不全症候群

超激戦キーワードの上位表示を目指すには、TrustRankとかseedとかによるVIPインデックスに格納されることであるが、さほど競合がSEOをやっているわけでもないキーワードにおいて、思うような検索順位にならない現象もある。

それらの、検索不全症候群についても、分割インデックスの視点で分析してみよう。

エイジングフィルター

Googleには、新設サイトを対象としたエイジングフィルターがあると言われている。
幸い、弊社の新設3サイトは3か月を経過した今も発症しておらず、このまま難を逃れればと願いたい。

SEO塾の新規サイトは、すべてccTLDドメインである。つまりco.jpもしくはjpドメインであること。
他方で、サイト立ち上げ後2週間で数千のバックリンクを一気に浴びせている。リンク元のドメインは、すべて優良というわけでもない。

よって、ハイペースのリンクがペナルティを招くというのも、100%正しいわけではないのである。

私は、エイジングフィルターを見たことがない。よって、リカバリー策も浮かばないのであるが、予防策は弊社の新設3サイトをつぶさに分析してみるといいだろう。

インデックス削除

次に、ドメイン丸ごと、あるいはディレクトリ丸ごとのインデックス削除がある。
これは、リダイレクトのやり損ないや、隠しリンクなどの初歩的なスパムによって、ペナルティが発動しているようだ。

この検索不全の場合は、すみやかにリダイレクトやスパムを撤去し、Google ウェブマスター ツールから、修正を報告し検索復帰の要望を出すべきだろう。

ペナルティと分割インデックス

また主に海外で噂されているGoogleの検索不全症候群に、「-30」「-950」というペナルティがあるが、これも出遭ったことがない。あるいは気づいていないだけかもしれないが。

さて、これらの検索不全症候群も、処理的にはそれぞれ分割インデックスに押し込んで、検索されない仕組みにしている可能性も考えられる。

例えば、インデックス削除といっても、site検索で出ない現象から、ペナルティ解除とともにSERPsに現れることが多い。ということは、本当に削除しているのではなく、検索されないようにしているだけということである。

エイジングフィルターもSandboxの変種と捉えれば、一定の条件に当てはまる新設ドメインを、検索上位にさせないインデックスに格納していることもありだろう。

要するに、クエリー段階で検索するたびにフィルターを働かせて、ペナルティを発動させるのではなく、インデクサー段階でルールに基づいてそれぞれのインデックスに仕分けしていると推察した方が合点がいくことも多いのである。

つまり、ペナルティを受ける場合はそれ専用のインデックスに、解除される場合は違うインデックスに移動すると。

結論であるが、クエリー段階のフィルターよりも、分割インデックスの方が、もろもろの検索不全症候群はより効果的により徹底的に発症していると思うのである。

そして、悪いインデックスに格納される時間が長くなった場合は、再起不能となる危険性もあると。

よって、分割インデックスの仮説では、激戦キーワードの上位表示も、検索不全の解消も、道はより険しいだろう。

«
»