検索エンジン拒否:noindex・nofollowの基本
検索エンジン拒否」とは、Googleなどの検索エンジンに「このページをインデックス(登録)しないでください」と伝えることを意味します。
ブログ運営では、次のようなページを検索から除外したいケースがあります。
- テスト用・下書きページ
- 会員限定・有料会員ページ
- 重複コンテンツ(カテゴリ・タグページなど)
- プライバシーポリシーや利用規約などSEO価値の低いページ
こうしたページを意図せずインデックスさせると、SEO評価の分散や重複コンテンツ判定のリスクが生まれます。
そのため、noindexタグの活用はSEO上でも重要なテクニックです。
検索エンジン拒否metaタグの書き方
検索エンジン拒否を設定するには、ページの<head>内に以下のコードを記述します。
1 2 3 |
<meta name="robots" content="noindex, nofollow"> |
各属性の意味
- noindex:検索結果に表示しない
- nofollow:ページ内リンクをクロール・評価しない
このタグを設定したページは検索結果に表示されず、内部リンクもSEO評価に影響を与えません。
もし「ページはインデックスさせたくないけど、リンク評価は渡したい」場合は、次のように設定します。
1 2 3 |
<meta name="robots" content="noindex, follow"> |
Googlebotなど特定クローラーだけの指定もできる
1 2 3 |
<meta name="googlebot" content="noindex"> |
Bingなど他の検索エンジンに対しても同様の形式で指定できます。
robots.txtとの違い
robots.txtでもクローラーのアクセスを制御できますが、noindexとは仕組みが異なります。
項目 | metaタグ(noindex) | robots.txt |
---|---|---|
ページ内容をクロール | する | しない |
検索結果から削除できる | できる | できない(既に登録済みなら残る) |
ファイル設置場所 | ページ内(headタグ) | サイトのルートディレクトリ |
robots.txtは「クロールさせない」指示であり、既にインデックスされたページを削除する効果はありません。
インデックス除外を確実にしたい場合は、metaタグのnoindexを使うのが正解です「