クローラーとは？意味やSEOでの仕組み、対策を解説！

2025年3月13日
SEOの記事一覧
#SEO対策

サイト内のページを巡回していくクローラーをご存知ですか？
このクローラーとは、Googleの検索エンジンにデータを登録（インデックス）するために情報収集を目的としたボットとも呼ばれるもので、主にインデックスされているページから外部・内部のリンクを辿って巡回していきます。

必須キーワードの選定と高品質記事作成を完全自動化！
＼短期間でアクセス数を増やす専用ツールをご案内！／SEOツール「キーワードファインダー」を無料で見る

必須キーワードの選定と高品質記事作成を完全自動化！短期間でアクセス数を増やすSEOツール「キーワードファインダー」を無料で見る

＼御社サイトの必須キーワードをたった3秒で最大約1000個無料入手！／

そして、サイト管理者としてはこのクローラーの最適化を行うこともまた必要であり、理由としては…不要なクロールを制御することで、重要なページを優先させて巡回させ、正しく内容を伝えることはもちろん、キャッシュを更新することで修正箇所などをすぐに検索結果に反映することも可能となります。（場合によってはクロールの申請も必要。）

というのも、クローラーがしっかりとページの更新箇所など前回クロールしたデータとの差分がないかどうか？を正しく理解しなければ、インデックスにも反映されないため、当然公開されているページも古いままとなってしまいます。

もちろんこれは新しいサーチコンソールに実装されている“URL検査”を利用してインデックスを促すことも可能ですが、質の低い不要なページをインデックスした状態だと場合によってはサイト全体のSEOにも影響することから、重要なページを中心にクロールしてもらう必要があるというわけです。

要はクローリングの最適化（クローラビリティ）が重要であり、検索結果に表示させる必要のないページにクロールさせないことがポイントとなります。例えばお問い合わせフォームなどが良い例で、こういったページはインデックスさせる必要がありませんのでnoindexで対応します。

では今回は、このクローラーの意味やクリーラビリティについて詳しくご説明していきたいと思います。

必須キーワードの選定と高品質記事作成を完全自動化！短期間でアクセス数を増やすSEOツール「キーワードファインダー」を無料で見る

＼御社サイトの必須キーワードをたった3秒で最大約1000個無料入手！／

クローラーとは？
クローラーの仕組み
クローラーの対象ファイル
クローラーの種類
クローラーの対策
- クローラビリティとは
- 不要なクロールを制御する
  - サイトマップ（sitemap.xml）による管理
  - robots.txtによる管理
クローラーのアクセスを確認する方法
まとめ

クローラーとは？

まずクローラーとは、Web上の無数にあるサイト・ページをクロール（巡回）するボットのことを意味し、Googleのクローラーの場合だと情報を収集して各種検索クエリの答えとして相応しいコンテンツを200以上もの要素からランキングして検索結果に返しています。

また、クローラーにはGoogleの検索エンジンに限らず様々なボットが存在し、BingやBaidu以外にもインターネットアーカイブといったWebページの過去をキャッシュしていくクローラーもあり、詳しくは後述しますが、こういった過去のキャッシュを残したくない場合は、ボットを指定してクロールのブロックといった制御を行う必要があります。

他にもGoogleだけでも検索用のボット以外にも広告用や画像用、各種モバイルやスマホ用などのボットなどが存在します。
参考：Google のクローラ（ユーザーエージェント） – Search Console ヘルプ

ちなみに、アナリティクスの管理画面にはクローラーの巡回をひとつのアクセスとして計測しない設定があり、“設定”＞“ビュー”＞“ビューの設定”から指定することができます。
※正しいアクセス解析を行うためにもチェックを入れておきましょう。

つまり、このクローラーの制御を行うことによって検索エンジンが重要なページ、そしてその内容を正しく理解することにも繋がり、それによってコンテンツの評価としての順位変動に現れるということです。（決してクローラビリティが良ければ順位が上がるというものではありません。）

クローラーの仕組み

クローラーの仕組みとして、まずクローラーは、指定されたURLからウェブページを自動的に取得します。
ページ内のリンクを抽出し、それを辿って次々に他のページを訪れます。訪問済みページは記録して、重複や無関係なページは避けます。
サイトには「robots.txt」ファイルでクロールの制限が設定されており、クローラーはそれに従います。クローラーが収集したデータはデータベースやインデックスに保存され、後で検索や解析に使われます。

クロールの際に、サーバーへの負荷を避けるためにクローリング速度が調整されます。クローリング速度の調整によって、クローラーがインターネット上の情報を効率的に収集・管理します。

クローラーの対象ファイル

クローラーの対象ファイルがいくつかあります。

HTML
画像
動画 – サポートされている動画形式のいずれか。
JavaScript
CSS
PDF
その他の XML – XML をベースとした RSS、KML などの形式を含まない XML ファイル。 etc…

参考：クロールの統計情報レポート – Search Console ヘルプ「クロールされるファイル形式」

クローラーの種類

クローラーは、検索エンジンや取得する情報によって種類が異なります。
例えば、Googleの検索エンジンの「一般的なクローラー」がいくつかあります。

スマートフォン用 Googlebot
パソコン用 Googlebot
画像用 Googlebot
動画用 Googlebot
ニュース用 Googlebot
Google StoreBot
Google-InspectionTool
GoogleOther
GoogleOther-Image
GoogleOther-Video
Google-CloudVertexBot
Google-Extended

参考：Google の一般的なクローラー | Google 検索セントラル | ドキュメント | Google for Developers

クローラーの対策

上記のように、しっかりと作り込まれたご自身のページは、クロールされることによって読み込まれ、データベースへと保存されなければ検索結果にも表示されることはありません。

そのため、クローラー対策の基本は重要なページを優先的に巡回してもらうことです。
それを行うためには“robots.txt”や“サイトマップ（sitemap.xml）”、さらに内部リンクの精査といった基本的な要素をしっかりと理解しておく必要があります。

ちなみに重要なページというのは、しっかりとキーワード選定を行い、それに伴うユーザーに役立つコンテンツを作り込んであるページを指し、その他インデックスさせる必要のないページに関してはnoindexで対応しましょう。

つまり検索順位を計測することも非常に重要で、ターゲットキーワードで上位表示できてなければリライトなりコンテンツの改善を行うべきで、質の低いページが存在しているとサイト全体の足かせとなってしまうため、流入キーワードも参考に記事の統合なども視野に入れてください。

ここで例えば、どこからもリンクされていない状態の孤立したページがあったとします。
そしてそのページがいくら重要なページだったとしてもクローラーが巡回する手段がなければクロールもされることがありません。

ということは、いくら検索しても順位が付かない状態（インデックスされない）となってしまうわけです。

そうならないためにも重要なページに内部リンクを集めるといった手段が行われてきたわけですが、こちらについてもまた後ほど詳しくご説明します。

クローラビリティとは

では、次にクローラビリティについてご説明していきたいと思います。

とは言っても先ほどご説明したようなクロールの最適化のことを意味するわけですが、そもそもユーザビリティやアクセシビリティといった“（ability）アビリティ”とは能力といった意味を持ち、ユーザビリティの場合だと使い勝手などと捉えられるように、クローラビリティもクロールしやすい状態といった意味で広く使用されています。

つまりは、クローラー対策はクローラビリティを最適化させることが目的となり、検索される必要のない（インデックスされる必要のない）ページは予め削除しておくことも大切ですが、場合によっては申込みページなど必要なページもあり、そういったコンテンツには先ほどもご説明した通り“noindex”の付与やクロールさせないように指示しておくことも重要となります。

その指示というのが、以下にご説明する“robots.txt”や“サイトマップ（sitemap.xml）”といったファイルによるもので、強制力のないものもあるので、“noindex”や極力内部リンクを設置しないといった対策が必要です。

内部リンクの精査

ではまず、内部リンクから考えてみましょう。
先ほどもご説明した通りクローラーは外部リンク以外にも下記のようなリンクを辿って巡回してきます。

グローバルメニュー
テンプレートに配置したアーカイブからのリンク
記事内に添えられたテキストリンク
フッター部分に表示された簡易サイトマップ

そして、その際重要となるのがアンカーテキストで、例えば“こちら”といった文字にリンクを設定していると…検索エンジンもその先に何が書かれているのか？伝わりにくい状態となってしまいます。

それは検索エンジンだけでなく閲覧ユーザーにとっても同じです。
こういったクローラビリティを内部リンクから考える場合は、ユーザービリティにも考慮する必要があり、どこに何が用意されているのか？こういったユーザーの利便性に基づいた考え方で内部リンクを設置することを念頭に置いておけば、単純に重要なページ（上位化させたいページ）に内部リンクを集中させるといった施策にはならないはずです。

そのため、内部リンクの基本的な考え方としては…関連する情報を提供してあげるということが大切で、今現在せっかく集中して読んでくれているユーザーに対して無理に広げたコンテンツを盛り込むよりも、「必要な方はこちらもご覧ください。」といったユーザーが疑問に思うかもしれない箇所に適宜リンクを設置してあげることが重要です。

そうなれば、リンク前後の文脈も不自然になることもなく、クローラーは何らかの関連するコンテンツが存在するとして、そのリンクを辿ってインデックスしていくことでしょう。

内部リンクについては他にもパンくずリストなど様々な要素が考えられるかと思いますので、さらに詳しくはこちらの「内部リンクとは？SEOに効果的な設置方法について」もぜひご覧ください。

リンクはアンカーテキストで

続いて、クローラビリティを考慮するとリンクは画像ではなくアンカーテキストを使用するようにしましょう。

というのも、クローラーはあくまで機械ですので人間のように目視してコンテンツを把握していくわけではありません。

そのため、リンクに含まれる内容は伝わりやすいテキストで設置するようにし、それによってその先にどういった内容のコンテンツがあるのか？クローラーにとっても伝わりやすくなり、関連するコンテンツの有無も理解することによって、あくまで推測ですが…詳しい執筆者・専門性の高いコンテンツといった評価にも期待できるかもしれません。

クローラビリティとは単純にページ間の巡回だけでなく、正しく内容を伝えることも重要となるため、こういったリンクの設定や正しいタグの使い方も重要視するべきでしょう。（アンカーテキストの分散も考慮してください。）

はじめはクロールを申請する

上記のように、サイト・ブログをある程度運営していれば、調整する内部リンクも増えてくるかと思われますが、立ち上げた当初はクロールが巡回してくる術がありません。

こういった場合はクロールの申請をすることによって、ご自身のサイトの存在を検索エンジンに知ってもらう・見つけてもらうことになります。

方法としては、“Fetch as google”といった以前のサーチコンソールに実装されていた機能を使っていたんですが、新しいサーチコンソールになってからは“URL検査”といった機能を使用することとなります。

これは本来、指定したURLのページが現在どういた状況なのかをチェックするもので、そこでインデックスされていないようでしたらクロールを促すこともでき、ページの内容に修正など更新された情報などがあっても再度クロールを申請することも可能です。

不要なクロールを制御する

では、続いてクロールの必要がないページからクローラーの巡回を制御する方法についてご説明していきます。

これは、先ほどもご説明した通りインデックスの必要がないページにクロールが巡回しても意味がないように、不要なページへのクロールをブロックして重要なページを優先させることが定説で、以前は“クロールバジェット”といったクロールの回数などが存在するとも言われていて、極端に気にしていた方も多かったのではないでしょうか？
※“クロールバジェット”について詳しくはGoogleウェブマスター向け公式ブログから公表されている「Googlebot のクロールバジェットとは？」を参考にしてみてください。

どちらにしても、正しくコンテンツ内容を伝えるためには、こういったクロールの最適化を行う必要があり、重要なページを優先的にクロールしてもらうことが理想となります。

そして、質の低いページがサイト内に存在することで、サイト全体の価値が下がる可能性も考えられるため、クロールが不要なページに関してはそもそも“noindex”など予め対応しておきましょう。

サイトマップ（sitemap.xml）による管理

まず、クロールの制御を行うために必要となるのが“サイトマップ”で、閲覧ユーザーのために用意するhtmlページも内部リンクといった意味ではクローラビリティにもなるわけですが、ここではクローラー用にサイト内のページリストを記述する“sitemap.xml”のことを指します。

そして、クローラーはこの“sitemap.xml”というファイルに記述されているページ一覧を参考にサイト内を巡回してインデックスしていくわけです。

そのため、クロールしてほしい重要なページを記述し、他には重要度や更新頻度も一緒に記述してサーバーにアップしておきます。
つまりわざわざ必要のないページまでも記述する必要がないというわけですね。

ただし、この“sitemap.xml”にはクローラーに対しての絶対的な強制力を持つわけではなく、あくまでヒントとしてサイト内を巡回するため、例えば内部リンクが少なく、クローラーが巡回する頻度が低い場合などに役立つファイルという意味もあり、場合によっては“noindex”や後述する“robots.txt”を併用してクロールの制御を行うことが重要となります。

もちろん、クローラーは内部・外部からのリンクを辿って巡回して行きますから、そういったクローリングによってインデックスさせたくない場合は“noindex”の付与が必要です。

このサイトマップ（sitemap.xml）について詳しくは、こちらの「サイトマップを設置する理由とSEO効果について」もぜひご覧ください。

robots.txtによる管理

次に、クローラーに対するクロールのブロック（または一部許可）を指定する“robotx.txt”というファイルについてです。

こちらは、指示をするボットを“User-agent”によって指定し、ページ単位やディレクトリ単位でブロック“Disallow”、または許可“Allow”するタグを組み合わせてクローリングを制御します。（任意で“sitemap.xml”へのパスも記載。）

ここで、なぜ許可を意味する“Allow”があるのかというと…基本的にはクローラーは全てのページを巡回していきますが、例えばブロックしたディレクトリがあるものの、その中の数ページだけはインデックスさせたい、という場合に“Disallow”と組み合わせて指定することで、クロールの動きを制御することが可能となります。

この“robotx.txt”に関しては特にクローラーのブロックを指定する必要がなければ用意しなくてもかまいません。

このrobots.txtの記述方方などについて詳しくは、こちらの「robots.txtとは？意味やSEO効果、設定方法を解説！」もぜひご覧ください。

クローラーのアクセスを確認する方法

クローラーのアクセスを確認するには、サーチコンソールを活用します。

例えば、サーチコンソールにログイン後、メニューの「設定」をクリック後、クロールの「レポートを開く」をクリックします。

クローラーのアクセスを確認する方法①

すると、クロールの統計情報の画面が表示されて、「クロールリクエストの合計数」の推移や「クロールリクエストの詳細」が見れます。

クローラーのアクセスを確認する方法②

つまり、クローラーのアクセスを確認できます。

まとめ

今回は、検索エンジンのデータベースに保存するためにサイト内を巡回する“クローラー”についてご説明しました。

このようにクローラーはサイト内のページの存在はもちろん、既存の保存データとの差分を認識し、新しい情報としてキャッシュを更新して検索結果に反映させていきます。

そのため、サイトを管理・運営していくためにはクローラビリティの最適化も念頭に置くことが重要となり、トラフィックを右肩上がりで伸ばしていくためにはシンプルな階層が理想となるわけです。

記事を増やせば増やすほどにトラフィックが減っていく…といった状況に陥らないためにも、しっかりとクローラーの動きを制御して、必要のないページに関しては削除や統合、または“noindex”によって対応するようにしましょう。

必須キーワードの選定と高品質記事作成を完全自動化！短期間でアクセス数を増やすSEOツール「キーワードファインダー」を無料で見る

＼御社サイトの必須キーワードをたった3秒で最大約1000個無料入手！／

短期間でアクセス数を増やすには、自動化が重要です！

短期間でアクセス数が増えないのはなぜ…？
短期間でアクセス数が増えない理由は、高品質ページのインデックスが遅いからです。

例えば、サイトやページのテーマに関連するキーワードやそれらのキーワードの検索ボリューム、競合性を都度自身で手動でツールで調べて、キーワードを選定します。

必須キーワードの選定と高品質記事作成を完全自動化！短期間でアクセス数を増やすSEOツール「キーワードファインダー」を無料で見る

＼御社サイトの必須キーワードをたった3秒で最大約1000個無料入手！／

また、選定したキーワードの検索意図を、都度自身で手動で競合上位サイトの傾向を見ながら記事構成を書きだして、記事作成をします。
この場合、記事公開までかなり時間がかかって、高品質ページをGoogleに認識させること(高品質ページのインデックス)が遅くなります。

そうなれば、Googleに評価されるまで時間もかかるので、検索順位が上がるまで数カ月、数年かかりすぐにアクセス数が増えません。
結果、短期間でアクセス数が増えないというわけです。

こうした悪い状況を回避する為に、必須キーワードの選定と高品質記事作成を完全自動化して、短期間でアクセス数を増やす専用ツールをご案内します。(無料)

SEOツール「キーワードファインダー」を無料で見る

« 前の記事
キーワード出現率とは？SEOとの関係性と出現頻度の調べ方を解説！
次の記事 »
SEOライティングとは？上位表示させる文章力の基礎要素まとめ

検索順位を改善するには正しいSEOの知識が必要です

【2025年最新】SEOとは？SEO対策の基本と具体的な施策方法を詳しく解説します