SEO
SEOで知っておくべき「インデックス」とは?インデックスされやすくする方法と確認方法
この記事は、
- SEOで「インデックス」という言葉を聞くけどなんだろう?
- なんとなくわかるけど、ちゃんと知っておきたい
という方向けの記事です。
検索結果に表示されるには、まずインデックスされる必要があります。そもそもインデックスされないことも珍しくはありませんので、インデックスの仕組みに関する知識はSEOの基本とも言えます。
この記事では、インデックスの仕組みと、インデックスされやすい状態にする方法をご紹介します。
インデックスとは?
検索エンジンのロボットは日々増えるウェブページを巡回して探し、見つけたものの中から、検索エンジンのデータベースに登録すべきものを判断したうえで登録します。登録する先としてのデータベースにおいて、整理された状態で登録されたページ群のことをインデックスと呼びます。
そこに登録された場合、厳密には「インデックスに登録された」と表現するのが正しいですが、SEO業界では一般的にインデックスされたと表現します。
Googleサーチコンソールでは、インデックスに登録された状態を「ページはインデックスに登録済みです」と表記して示します。
インデックスは一般的な用語としては「索引」としての意味を持ちますので、検索エンジンもその意味で用いているものと考えられます。
まずはGoogleの索引として登録される(=インデックスに登録される)ことがSEOにおいては不可欠になります。
SEOにおけるインデックス登録の必要性
インデックスに登録されていなければ、検索結果に表示されることはありません。
そのため、ウェブページを検索上位に表示させることを目標にするならば、まずはインデックスに登録される必要があります。
しかし、そもそもインデックスされないケースというのは多く、まずインデックスされるようにする、というのはとても重要で、気を付けるべき点なのです。
インデックス登録されないケース
以下に、どういう理由でインデックスされないことがあるか、ケース別にご紹介します。
公開したばかりのウェブサイト
公開したばかりのウェブサイトは、インデックスされるまでにある程度時間がかかります。少なくとも1週間程度、遅いときには数カ月かかります。この差は検索エンジン側の都合によるものの場合もあります。遅いときは、特定のサイトだけ遅いのではなく、その時期に全てのサイトにおいてなかなかインデックスされないという状態が生まれます。
日々大量のウェブページが生まれるため、検索エンジンのリソースの問題が生じることもあるものと考えられます。
ただし、公開したばかりのサイトでは、早くインデックスされるためにも「サイトマップの送信」というものを必ず行うべきであり、それを行ってないことが原因でインデックスが遅れることもあり得ます。「サイトマップの送信」の方法に関しては後述します。
ユーザーにとって価値の低いページ
Googleはユーザーにとって価値の低いページはインデックスに登録しません。
そのような状態の場合、Googleサーチコンソールにおいて「クロール済 – インデックス未登録」となります。
よく似た状態として「検出 – インデックス未登録」というのがありますが、その場合は原因はコンテンツではなく、例えばサイトマップの送信をしてないなど、別の原因となります。
ユーザーにとって価値が低いと判断される理由としては以下が挙げられます。
- ページの内容が検索意図に対して合致していないか不十分
- サイト内またはサイト外と重複している
- 表示が大きく崩れている
- ページの表示スピードが遅すぎる
noindexにしている
以下の記述をページのHTMLのheadタグ内に行うことで、そのページをインデックス登録しないように検索エンジンに伝えることができます。
<meta name="robots" content="noindex">
そのため、この記述があればインデックスされません。
robots.txtでクロールを許可していない
検索エンジンへの指示を行うための「robots.txt」というファイルがあります。このファイルをサイトのルートディレクトリに配置することで、検索エンジンはその中身を読み取り、指示に従います。
robots.txtで、クロールを許可しない記述がされていれば、インデックスはされません。詳しくは次の記事を参照ください。
robots.txtとは?意味とSEO効果、書き方について解説
大規模サイトのためクロールバジェットが足りない
クロールバジェットというのはGoogleが用いている言葉ではありませんが、サイトによりクロールの頻度やクロールするURLの数というのは異なります。
大規模なサイトでページが大量にある場合、全てのページがクロールされない状態になりやすいと言えます。
インデックスまでの流れ
インデックスされるようにする対処のご説明の前に、まずはGoogleのインデックスまでの流れをご説明します。
Googleがインデックスするまでの流れとして以下の5つがあります。
- クロールキュー
- クロール
- レンダリングキュー
- レンダリング
- インデックス
クロールキュー
ページが検出されると、クロールするためのキュー(待ち状態)に入れられます。
クロール
検出されたページの全てがクロールされるわけではありません。先述のように「検出 – インデックス未登録」という状態もあります。その状態は、クロールキューにだけ入っていて、クロールされてない状態となります。
レンダリングキュー
noindex
の指示がされてなければ、クロール後にレンダリングキューに入れられます。
レンダリング
Googleのリソースに空きがあり、インデックスされるべきと判断されれば、レンダリングがされます。
インデックス
上記4つのプロセスを経て、インデックスに登録された状態となります。
インデックスされているかどうかの確認方法
Googleにインデックスされているかどうかは、Googleサーチコンソールを使って調べることができます。
「URL検査」メニューで調べたいページのURLを入力すると次のように結果が表示されます。
インデックスされやすくするための対処方法
以下にインデックスされやすくするための対処方法をご説明します。
XMLサイトマップを送信する
XMLサイトマップは、検索エンジンにページの構成と、各ページのクロール優先順位などを伝えることができるファイルです。
WordPressのプラグインなどで、自動的に作ることができます。
サイトを公開したらまず、XMLサイトマップのURLをGoogleサーチコンソールを使ってGoogleに送信することが重要です。これはサイトを公開した際のSEOの第一歩とも言えることです。
Googleサーチコンソールで「サイトマップ」メニューを選択すると、サイトマップのURLを入力して送信することができます。
検索するユーザーにとって有益ではないページはnoindexにする
クロールバジェットがあるので、クロールの無駄なリソースを使わないようにするという意味でも、indexする必要のないページはnoindex
にすることが望ましいです。
このことは、サイト全体の評価を高めるのにも有効で、SEOとして重要です。
有益なコンテンツを増やす
有益なコンテンツが多いサイトは、Googleのクロール頻度を高め、クロールしてもらいやすくなります。
ユーザーにとって有益で、かつ独自性ある内容とする
「クロール済 – インデックス未登録」の場合は、そのページがユーザーにとって有益ではないと判断されていることが理由です。ユーザーにとっての価値を高められるように内容をリライトします。
他のサイトと内容が重複している場合も、クロールしてもらいにくくなります。独自性ある内容となるように留意しましょう。
サイトの表示速度を高める
サイトへの負荷が高まっていると判断されるとクロールされづらくなるので、サイトの表示速度が遅い場合は、そのことが原因である可能性を考えた方が良いです。
サイトの表示速度は、WordPressのプラグインを少なくしたり、不要なコードを削ることで早くなることもありますが、利用しているサーバーの速度に依存する部分が大きいです。レンタルサーバーであればエックスサーバーなど、速度の早いものを利用することが望ましいです。
サイト内に適切にリンクを張り巡らせる
クローラーはサイト内のリンクを辿ってページを探します。その観点でも、サイト内に適切に関連ページへのリンクを張ることが重要です。
サイトのどこからもリンクが張られてない孤立したページは検出されないこともあります。
インデックス登録をリクエストする
Googleサーチコンソールを使ってインデックス登録をリクエストすることができます。
「URL検査」のメニューで、検査したいURLを入力するとそのページがインデックスされているかどうか確認できます。その結果の中に「インデックス登録をリクエスト」というメニューがあるので、それを押すとリクエストができます。
まとめ
検索順位が付かないと思っていたらインデックスされていなかった、ということはありがちです。
細目にインデックス状況を確認するようにしましょう。
BringFlowerがSEOコンサルティングする場合はもちろん、インデックス状況も観察しながら対策をおこなっていきます。よろしければご相談ください。