検索エンジンの巡回（クロール）を拒否　noindex、nofollowのmetaタグとrobots.txtの設定方法

公開日：2015/04/07

HTML 検索エンジン

検索エンジンの巡回（クロール）を拒否　noindex、nofollowのmetaタグとrobots.txtの設定方法

ホームページを公開すると検索エンジンがアップロードしたページのクロールを行い、
公開したページがインデックスされるようになります。
そして、検索エンジンにインデックスされると検索結果に表示されます。

ホームページを制作しているとGoogleなどの検索エンジンからインデックスされないように設定することがあります。
例えば下記のような場合です。

テストで公開しているページ
管理画面などのログインページ
コンテンツの内容が薄いページ

検索結果に表示されても意味がないページや検索されなくないといった場合、
robots metaタグやrobots.txtで検索エンジンを制御することが可能です。

今回はrobots metaタグの設定やrobots.txtファイルの作成や記述方法を記載します。

robots metaタグの設定方法（noindex、nofollow）

robots metaタグではクローラーにページをインデックスさせるかやリンクをたどらせるかを設定します。
その場合はnoindex、nofollowを使用します。

ただし、クローラーのアクセスを拒否しているわけではないので、インデックスされたくない場合などに利用します。

下記にrobots metaタグの記述方法について紹介します。

検索エンジンにインデックスさせない（noindex）

noindex

検索エンジンにページをインデックスさせない時に指定します。

<meta name="robots" content="noindex">

1	<meta name="robots" content="noindex">

検索エンジンにリンクをたどらせない（nofollow）

nofollow

検索エンジンにページ内のリンクをたどらせない時に指定します。

<meta name="robots" content="nofollow">

1	<meta name="robots" content="nofollow">

インデックスとリンクの巡回をさせない（noindex,nofollow）

インデックスとリンクの巡回を拒否する場合はどちらも指定します。

<meta name="robots" content="noindex,nofollow">

1	<meta name="robots" content="noindex,nofollow">

robots.txtの設定方法（Disallow、Sitemap）

検索エンジンのクローラーはサイトを巡回する時にrobots.txtを最初にクロールします。
そこで、巡回（クロール）の拒否やサイトマップの場所などを判断します。

ページを公開したけどインデックスされたくないなどの時にクローラーを制御することができます。
下記にrobots.txtの作成や記述方法について紹介します。

robots.txtの作成・置き場所

robots.txtの作成はメモ帳などのテキストエディタで作成します。
その際にファイル名を「robots.txt」で保存してください。

robots.txtを作成し、設定が完了したらサーバにアップロードします。
robots.txtの置き場所（アップロードするディレクトリ）はサイトのドキュメントルートにアップロードします。
ドキュメントルートではない場合、robots.txtがクローラーに検出されないので注意してください。

正しい：http://www.dataplan.jp/robots.txt

誤り：http://www.dataplan.jp/test/robots.txt

robots.txtの記述方法

robots.txtに設定する内容について記載します。

User-Agent

User-Agentではクローラーの種類を指定します。

User-Agent: Googlebot

1	User-Agent: Googlebot

全てのクローラーに対して制御する場合は「*」を記述します。

User-Agent: *

1	User-Agent: *

また、画像用のGooglebotを指定する場合はこのように指定します。

User-Agent: Googlebot-Image

1	User-Agent: Googlebot-Image

その他のGoogleのクローラーについては下記で確認できます。

Google クローラ – ウェブマスターツールヘルプ

Disallow

Disallowはクロールを拒否するディレクトリやファイルを指定します。
必ず「/」から記述してください。
指定がない場合は検索エンジンにクロールされます。

User-agent: *
Disallow:

1 2	User-agent: * Disallow:

サイト全体に対し、巡回を拒否する場合は「/」のみを記述。

User-agent: *
Disallow: /

1 2	User-agent: * Disallow: /

特定のディレクトリを指定する場合、ディレクトリ名を設定。
ディレクトリ名の最後には「/」を付与。
ディレクトリ以下の全てに反映されます。

User-agent: *
Disallow: /sample/

1 2	User-agent: * Disallow: /sample/

特定のページを指定する場合、ファイル名を設定。

User-agent: *
Disallow: /sample.html

1 2	User-agent: * Disallow: /sample.html

Allow

Allowはクロールを許可するディレクトリやファイルを指定します。
こちらは記述しなくても検索エンジンにクロールされるので、基本的には指定しなくて大丈夫です。

ただし、Disallowで設定したディレクトリ内の特定のファイルだけ許可したい場合などに利用します。

User-agent: *
Disallow: /sample/
Allow: /sample/page.html

User-agent: *

Disallow: /sample/

Allow: /sample/page.html

また、全ての検索エンジンに対してクロールを拒否していて、特定のクローラーは許可するといった場合にも利用できます。

User-agent: *
Disallow: /

User-agent: Googlebot
Allow: /

User-agent: *

Disallow: /

User-agent: Googlebot

Allow: /

Sitemap

Sitemapにはサイトマップ（sitemap.xml）のURLを設定します。
サイトマップを作成している場合はクローラーにサイトマップの場所を知らせることができます。
SEO的にも効果的なのでサイトマップがある場合は設定しましょう。

User-agent: *
Disallow: 

Sitemap: http://www.dataplan.jp/sitemap.xml

User-agent: *

Disallow:

Sitemap: http://www.dataplan.jp/sitemap.xml

robots.txtの確認

robots.txtの確認はウェブマスターツールの「robots.txt テスター」で確認することができます。

robots.txtの内容やURLがブロックされているかどうかをテストすることができるので、
robots.txtを設定したらウェブマスターツールで確認するのがいいと思います。

まとめ

robots metaタグとrobots.txtを使用した検索エンジンの巡回（クロール）を拒否する方法を紹介しました。
これらを使用すればサイトへの検索エンジンのクロールを制御することができます。

検索結果に表示されたくないページなどがある場合はちゃんと検索エンジンに教えてあげることが重要です。
また、同じ内容のページが存在するとSEO的にもよくないのでしっかり設定することをおすすめします。

ホームページに関するお悩みは、仙台のホームページ制作アド・エータイプにお任せください！

お気軽にご相談ください。
022-716-3883
営業時間　平日9:30～18:00

<< 前の記事

【SEO】Googleのアルゴリズム変更によりスマホ対応サイトの検索順位が大きく影響する

次の記事 >>

iPhoneでinput要素に付く影や角丸を消す　スマホサイト制作時のメモ

仙台のホームページ制作･システム開発･ウェブコンサルティングはアド･エータイプへ。

検索エンジンの巡回（クロール）を拒否　noindex、nofollowのmetaタグとrobots.txtの設定方法

robots metaタグの設定方法（noindex、nofollow）

検索エンジンにインデックスさせない（noindex）

検索エンジンにリンクをたどらせない（nofollow）

インデックスとリンクの巡回をさせない（noindex,nofollow）

robots.txtの設定方法（Disallow、Sitemap）

robots.txtの作成・置き場所

robots.txtの記述方法

robots.txtの確認

まとめ

関連記事

Category

最近の投稿

人気の投稿

検索エンジンの巡回（クロール）を拒否 noindex、nofollowのmetaタグとrobots.txtの設定方法

robots metaタグの設定方法（noindex、nofollow）

検索エンジンにインデックスさせない（noindex）

検索エンジンにリンクをたどらせない（nofollow）

インデックスとリンクの巡回をさせない（noindex,nofollow）

robots.txtの設定方法（Disallow、Sitemap）

robots.txtの作成・置き場所

robots.txtの記述方法

robots.txtの確認

まとめ

関連記事

Category

最近の投稿

人気の投稿

検索エンジンの巡回（クロール）を拒否　noindex、nofollowのmetaタグとrobots.txtの設定方法