phpとmysql が使える
レンタルサーバー・	ポ	イ	ン	ト
ドメイン選びの

phpとmysql が使えるレンタルサーバー・ドメイン選びのポイント

簡単な質問に答えて、
あなたにあったレンタルサーバーをチェックしてみよう！

サーバー情報

中初

検索ロボット(クローラ)拒否で負荷軽減

格安レンタルサーバーレポート口コミ・評判はありません

ご利用のブラウザは、JavaScript が無効となっていませんか？
このサイトでは、コンテンツの一部が非表示、あるいは、コメント、お問い合わせの投稿ができない、検索ができないことがあります。

レンタルサーバーで、案外、負荷がかかりやすいのが検索ロボットです。

特に悪評高い「百度」(Baidu)は、やたらとサイト情報を採取しに来ます。

サイトの大きさに比例して「百度」(Baidu)のアクセス数も増えてくるのが知られています。

もし、あなたのサイトが、中国に一切関係ないのであれば、拒否するのも一つの案かもしれません。
特にWordpress,Joomla!などPHPで動的にページを作成する場合は、負荷の軽減が望まれるでしょう。

今回は、その方法を説明してみます。

目次
1. 検索ロボット(クローラ)拒否する方法
  1. robots.txtを使ったクロール拒否
  2. .htaccessを使ったクロール拒否
履歴

2010年5月8日初版

検索ロボット(クローラ)拒否する方法

検索ロボット(クローラ)拒否する方法は、大きく２つあります。

・robots.txtを使ったクロール拒否
・.htaccessを使ったクロール拒否

以降、その具体的な方法について簡単に解説します。

robots.txtを使ったクロール拒否

普通のクローラは、robots.txtの設定に従ってくれます。

robots.txtには、以下の情報を設定します。
User-Agent:ユーザエージェント名
Disallow: 拒否するディレクトリ名

以下は、その設定例です。

User-Agent: Baiduspider
Disallow: /
User-Agent: Baiduspider+
Disallow: /
User-Agent: BaiduImagespider
Disallow: /
User-Agent: BaiduMobaider
Disallow: /

筆者は、この設定を行って、１週間経ちましたが、ユーザエージェントを変え、IPアドレスを変えながら、アクセスは、全く止まることはありませんでした。
つまり、「百度」(Baidu)は、表面的に従っているふりはしますが、全くアクセスを止めることはありません。残念ながら。悲しすぎる・・・。

.htaccessを使ったクロール拒否

ある意味では、.htaccessを使える共有レンタルサーバーの環境では、最後の手段になります。

.htaccessファイルは、このファイルを置いたディレクトリとその配下のサブディレクトリのアクセス制限を設定することができます。
ほとんどの場合、httpd.confで設定できるディレクトリのアクセス制限が、そのまま、.htaccessファイルに記述することができます。

以下は、その設定例です。

# BEGIN crawler
SetEnvIf User-Agent "[Bb]aidu" deny_ref
SetEnvIf User-Agent "[Yy]eti" deny_ref
SetEnvIf Referer "^http://www\.baidu\.jp" deny_ref
SetEnvIf Referer "^http://www\.baidu\.com" deny_ref
SetEnvIf Referer "^http://help\.naver\.com" deny_ref
SetEnvIf Remote_Host "\.baidu\.jp" deny_ref
SetEnvIf Remote_Host "\.baidu\.com" deny_ref
SetEnvIf Remote_Host "\.hinet\.net" deny_ref
SetEnvIf Remote_Host "\.naver\.com" deny_ref
 
order allow,deny
allow from all
deny from env=deny_ref
 
##############
# robots.txt #
##############
<Files robots.txt>
    allow from all
</Files> 
# END crawler

SetEnvIf は、以降に記述する条件に一致した場合、env（グローバル変数のようなもの）に指定された値を設定します。

２行目は、	User-Agentの名前が、Baidu あるいは baidu を含んでいるならdeny_refをenvに設定します。
３行目は、	User-Agentの名前が、Yeti あるいは yeti を含んでいるならdeny_refをenvに設定します。
４行目は、	Refererの名前が、http://www.baidu.jpで始まる場合deny_refをenvに設定します。
５行目は、	Refererの名前が、http://www.baidu.comで始まる場合deny_refをenvに設定します。
６行目は、	Refererの名前が、http://help.naver.comで始まる場合deny_refをenvに設定します。 --- これは、NHN Corp.という「百度」(Baidu)とは異なりますが、韓国系の検索エンジンのクローラです。これまた、かなり頻繁にクロールしに来ます。ここで同じように拒否してみます。
７行目は、	Remote_Hostの名前が、baidu.jpドメインからのアクセスの場合deny_refをenvに設定します。
８行目は、	Remote_Hostの名前が、baidu.comドメインからのアクセスの場合deny_refをenvに設定します。
９行目は、	Remote_Hostの名前が、hinet.netドメインからのアクセスの場合deny_refをenvに設定します。
１２行目は、	ここからアクセス規制を許可(allow)、拒否で指定します。(deny)
１３行目は、	まず、すべてのアクセスを許可します。
１４行目は、	アクセスの中で、envにdeny_refを設定されるようなアクセスの場合、そのアクセスを拒否します。
１９－２１行目は、	robots.txtファイルだけは、だれでもアクセスできるようにします。

通常、この設定を行うと拒否された情報が、エラーロギングへ設定されます。
また、通常のアクセスロギングには、403で拒否された情報が残ります。

[エラーロギング]

[Sat May 08 15:41:01 2010] [error] [client 119.63.198.26] client denied by server configuration: /var/www/html/wordpress/

[アクセスロギング]

119.63.198.26 - - [08/May/2010:15:41:01 +0900] "GET / HTTP/1.1" 403 214 "-" "Baiduspider+(+http://www.baidu.jp/spider/)"

この設定で、負荷が大きくてアクセスエラー(500,503)がでているような場合は、その頻度が減ると思います。
少なくとも筆者は、データベースアクセスエラーは、減りました。
どうしても共有レンタルサーバーの場合は、データベースへの同時接続できる数には、限界があります。「百度」(Baidu)などのクローラがデータベースへのアクセスリソースを占有してしまっている場合もあります。

一度、試されるのも有りだと思います。

口コミ・評判

口コミ・評判を投稿 :

ブラウザの JavaScriptが無効となっている場合、コメントの投稿はできません。
コメントを投稿するには、JavaScriptを有効にしてください。

お名前.com共用サーバー SD-11 でキャンペーン実施中です。

キャンペーン情報
初期設定費無料キャンペーン実施中です。

お名前.comレンタルサーバー VPS (KVM) メモリ 2GB プランでキャンペーン実施中です。

キャンペーン情報
初期設定費無料キャンペーン中！！( ~~¥1,600~~(税抜) → ¥0 )
KVM, メモリ 2GB, ディスク 200GB, CPU 3 コア で, ¥1,099 / 月(税抜)[年契約時] です。
このスペックでこの値段はかなりリーズナブルです。まずは、お試し期間15日間を使ってお試しですね。

その他のキャンペーン情報は、こちらをご確認ください。

サイトメニュー（カテゴリ）

主なラインキング

共有レンタルサーバー＆みんなの評価

みんなの評価は、このサイトを利用されている方の評価平均でランキングされています。

各共有レンタルサーバーの詳細については、こちらからどうぞ

ＶＰＳ＆みんなの評価

みんなの評価は、このサイトを利用されている方の評価平均でランキングされています。

各ＶＰＳの詳細については、こちらからどうぞ

マネージドサーバー＆みんなの評価

みんなの評価は、このサイトを利用されている方の評価平均でランキングされています。

各マネージドサーバーの詳細については、こちらからどうぞ

ドメインレジストラ＆みんなの評価

みんなの評価は、このサイトを利用されている方の評価平均でランキングされています。

各ドメインレジストラの詳細については、こちらからどうぞ

共有サーバー１年目総額最安値

ドメインキング(DomainKing) (Pプラン)
１年目総額 : ¥1,296(税込)
バリューサーバーまるっと
１年目総額 : ¥1,726(税込)
ServerQueen (Q-S1(超低価格))
１年目総額 : ¥2,556(税込)

１年目総額とは、初期設定費用＋月額使用料１年分の総額です。

もっと詳しく調べたい方は、こちらで調べることができます。

ドメイン１年目最安値

みんなのドメイン.com : .be
ドメイン登録価格 : ¥714(税込)
みんなのドメイン.com : .de
ドメイン登録価格 : ¥714(税込)
みんなのドメイン.com : .nl
ドメイン登録価格 : ¥816(税込)

１年目最安値とは、新規登録料金１年契約料金の最安値です。

もっと詳しく調べたい方は、こちらで調べることができます。

ドメイン移管最安値

みんなのドメイン.com : .de
ドメイン移管価格 : ¥714(税込)
みんなのドメイン.com : .biz
ドメイン移管価格 : ¥919(税込)
みんなのドメイン.com : .com
ドメイン移管価格 : ¥919(税込)
みんなのドメイン.com : .info
ドメイン移管価格 : ¥919(税込)
みんなのドメイン.com : .name
ドメイン移管価格 : ¥919(税込)
みんなのドメイン.com : .net
ドメイン移管価格 : ¥919(税込)
みんなのドメイン.com : .org
ドメイン移管価格 : ¥919(税込)
みんなのドメイン.com : .us
ドメイン移管価格 : ¥919(税込)

移管最安値とは、移管時に発生する契約１年延長料金の最安値です。

もっと詳しく調べたい方は、こちらで調べることができます。

: この表示がある価格は、キャンペーン価格になります。

新型コンピュータウィルス「JSRedir-R（通称：Gumblar・GENOウィルス）」の亜種が、2009年末より猛威を振るっており、現在もウィルスによって、FTP接続パスワードが抜き取られる事象が多発しております。

このサイトでは、ランキング情報には、すべてのレンタルサーバーの情報が表示されますが、 おすすめ情報には、SFTP/FTPSに対応していないレンタルサーバーをおすすめはしないようにしております。

phpとmysql が使えるおすすめの格安レンタルサーバーをご紹介します。もちろん、Joomla!,WordPress,Mobile Typeなどの有名なCMSも使える格安、割安感のあるレンタルサーバーを厳選して、比較紹介します。