動的ページって?

[`evernote` not found]

最近読んだ無料レポートのなかで「動的ページは検索エンジンロボットが読めない」
と書かれているものがありました。

○→【たゆ流!】ブログランキング徹底攻略マニュアル!

http://mag-zou.com/report_get.php?id=m0000186537&n=m0000137358

ちょっと引用させてもらいますね。

「動的ページというのは php などで作られたページです。この動的ページというのは検索エンジンロボットが読めないといわれています。 ただし、phpファイルでもURLに「?」とか「%」の入っていないURLであれば読むことが出来るとも言われています。

自分のブログへのリンク元が html ファイルであればそれが理想ですが、もしそうでなければURLに「?」や「%」が入っていないランキングサイトを選ぶとよいでしょう。」

※全28ページのレポートなので、ダウンロードをして見てください。
ブログランキングに関しては、とても参考になります。


で、動的ページは検索エンジンが読めないのかというと、そんなことはありません。
かなり長いパラメータ(「?」とか「%」がたくさんあるもの)がくっついているURLでも読み込めます。

これは実際に検索エンジンで検索をしてみれば、そうしたページが数多く検索されるので、検索エンジンがそうしたページを読めるということが分かるのです。

実際に Google には、次のように書かれています。

○Google は動的なページを登録しますか

http://www.google.co.jp/support/webmasters/bin/answer.py?answer=34431&topic=8522

「はい。Google は .asp ページ、.php ページ、URL に疑問符を含むページなど、動的なページも登録します。 ただし、クロールの際に、問題が生じ登録されない場合があります。」

ここで「クロールの際に、問題が生じ登録されない場合」とは、どういう事態でしょうか。

それは、サーバーが動的ページの生成に失敗したような場合です。

動的ページは、多くの場合、データベースなどから必要なデータを吐き出させてページを作ります。このときに高負荷が掛かるなどした場合には、ページの生成に失敗することがあるのです。

検索エンジンロボットが動的ページをクロールすると、次から次にページの作成要求がデータベースに送られ、最悪の場合、クロールをしているサーバーを検索エンジンロボットがクラッシュさせてしまうこともあり得ます。

そこで、Google などでは、そうしたリスクを恐れて、同一サイトでは動的なページのインデックス化比率を制限しているのではないか、といわれています。つまり、静的なページ数よりはるかに少ない数だけしか、動的ページをインデックス化しないのではないか、というわけです。

これは実は、「いわれている」のではなくて、Google に明記されています。

○→ http://www.google.co.jp/intl/ja/webmasters/2.html

「Google では、動的に生成されたページもインデックスに登録できますが、クローラによる負荷が原因で動的なコンテンツを含むサイトがクラッシュする可能性があるため、インデックスに登録する動的ページの数は抑制されています。」

「抑制されている」のであって、読めないわけではないのです。

例えば、ほとんどのオンラインショップのページは動的ページですが、ちゃんとインデックス化されています。

Amazon.co.jp では、以下のようなURLですが、当然データベースを使って動的に生成されたページです。

http://amazon.co.jp/exec/obidos/ASIN/4844321137

「?」とか「%」は入っていませんが、動的に生成されたページなのです。

実は、わたしのこのページも一種の動的なページです。

○→ http://www.so-desuyo.net/

リロードをすると、人気ブログランキングへのリンクの文言が変わるのが分かると思います。

各ページのファイル拡張子が「.html」になっていますが、実際には php ファイルになっていて、スクリプトを実行させているのです。

これは、Google が動的ページのインデックス化を抑制していると明言しているため、わざとそうしているのですが、一種のおまじないでしょうか。

そうしているサイトは、意外とたくさんあります。

[`evernote` not found]

シェアする

  • このエントリーをはてなブックマークに追加

フォローする