SEO
「検出 – インデックス未登録」の解消、解決について|Googleサーチコンソール
Googleサーチコンソールで「検出 – インデックス未登録」の状態が続いてお困りでしょうか?
2022年2月に新しいドメインでサイトアップした当サイトも多くのページでその状態が続いて、しばらくは様子をみていたのですが、ある方法で解決しました。
「検出 – インデックス未登録」の状態と「クロール済 – インデック未登録」との違い
「検出 – インデックス未登録」は、Googleがそのページを認識しつつも、あえてクロールさえもせず、その結果インデックスしてない状態です。「え?どうして?」ってなりますよね。
ちなみに、「クロール済み – インデクス未登録」というステータスもありますが、こちらはクロールはされているものの、あえてインデックスしなかったという状態です。
検出 – インデックス未登録 | クロール済み – インデックス未登録 | |
---|---|---|
URLの発見 | 〇 | 〇 |
クロール | × | 〇 |
インデックス登録 | × | × |
「検出 – インデックス未登録」の理由
以下に「検出 – インデックス未登録」の理由として考えられるものを挙げます。
サイトへの過負荷
Googleサーチコンソールのヘルプページでは、
サイトへの過負荷が予想されたため、クロールの再スケジュールが必要となった場合です。
と書かれています。
LighthouseというGoogleのツールでパフォーマンスを測定できるので、パフォーマンスの点数をひとまず確認してみるとよいでしょう。
当方サイトはページによりますが、トップページは見た目のため大きめの画像データが多く、またJavaScriptも割と使っていて、点数が高いとは言えない状態です。
(なお、他の項目はトリプル100点です、この点数は当方サイト以外で今のところ見たことがありません!)
そこで、一応できることは色々試して、点数改善したのですが、特にそれによって解消されることはありませんでした。パフォーマンスの点数は、多くのページが1位に表示されるような某大手ポータルサイトで10点台など結構ありますので、点数が低いからと言って、そこまで気にする必要もないと思っています。あくまでも、想定し得る低スペックのスマホやPCで見た時に、ユーザーがイラつくほどのパフォーマンスかどうか、を気にしたいところです。
サイト内で重要でないと判断された
当該サイトの中において、重要なページではないと判断されるとインデックスされないことがあります。例えば以下のようなページです。
- そのページへのリンクがない孤立した状態
- 階層(ディレクトリ)が深いページ
なお、コンテンツの質と、このステータス「検出 – インデックス未登録」とは関係ありません。コンテンツの質が低くてインデックスされない場合は、後述する「クロール済み – インデック未登録」となります。
ドメインパワーが低い(サイト全体の評価が低い)
サイト全体の評価が低い状態だと、全てのページがインデックスされないことがあります。
当サイトは後述する解消方法で解消した時点でまだ公開して2か月、新しく作ったドメインなので、これが理由だった可能性が高いと思います。
全体的な傾向
当サイトだけでなく、2021年位から、Googleの意図に反してクローラーの問題により全体的にクロールされる数が減少されているという報告があります。
2022年はその傾向が続いていましたが、2023年になって、改善されているように感じられます。
「クロール済み – インデックス未登録」の場合
「クロール済 – インデックス未登録」の場合は、コンテンツがインデックスするべきではない品質であると判断されている可能性が高いです。例えば以下のようなページです。
- 内容が薄い
(手短かなお知らせなど) - サイト訪問者がリンクを辿って見るべきものであり、インデックスされる必要はない
(サイトポリシー、問い合わせフォームなど)
実際、「クロール済み – インデックス未登録」のページは、サイト運営者にとってもインデックスされる必要のないページである場合が多いと思います。インデックスされないと困るようであれば、コンテンツの質を上げるという対応となりますが、インデックスされる必要がなければそのまま放置でよいと思います。Googleがインデックスしないように、あえてnoindexを明示するという手もあります。
質の高いページを増やすことでサイト全体の評価が高まりますが、質の低いページを増やすと、サイト全体の評価が高まらないまま、評価が分散されて良いことがありません。
「重複しています」の場合
「重複しています」と出ている場合は、同じサイト内で重複しているコンテンツがあるため、そのページをインデックスする必要がないと判断されています。
このステータスにあるページについて、canonical属性を使って正規ページを宣言していない場合は、宣言しておいたほうがよいでしょう。
ただ、canonicalを宣言している正規ページ以外にも重複しているページがある場合には、canonicalを使っていてもこのエラーが出ます。インデックスして欲しいわけでもないので、特に問題はないと思いますが、ユーザーにとって迷惑な重複コンテンツとみなされるリスクがないとも言えないので、可能であればh1要素の内容を重複している他のページと変えておくと無難です。
「検出 – インデックス未登録」の解消・解決方法
「検出 – インデックス未登録」が重複コンテンツや低品質なコンテンツであることなど、特にそのページに問題があるわけではない場合、Indexing APIを利用すると解消します。
多くの方は、サイト公開時にXMLサイトマップ(sitemap.xml)をサーチコンソールで送るので留まるか、むしろそれさえやってない方も多いでしょう。
しかし、本記事でご紹介している問題以前に、サイト公開時にインデックスするまでの期間そのものが長くなっている状況があり(2023年時点では、解消されているように感じられます)、XMLサイトマップでインデックスされるのを待っていても主要なページ以外、なかなかインデックスされません。サイト公開時点でIndexing APIを利用してインデックスリクエストをすれば、すぐにインデックスされます。
ただし、求人広告あるいはライブ配信を行う目的でのみ利用できることになっているので、その点にご留意ください。
調べれば出てくるので、具体的なやり方は他の記事に託します。
しかし、具体的なやり方が載っている記事を見ても分からない方の方が多いと思います。
当方のSEOコンサルのサービスにお申込みいただける場合は、この問題の解消も請け負います。
なお、Indexing APIを利用する前にGoogleサーチコンソールからのインデックス登録リクエストも試しましたが、当サイトに関しては、その時点では効果がありませんでした。
結構な時間はかかると思いますが、待てばそのうちインデックスされる可能性もあります。
まとめ
Googleサーチコンソールの「検出 – インデックス未登録」のステータスについて、他のステータスとの違いも含めて説明の上、現在は「Indexing API」の利用が望まれるということをご紹介しました。
ご相談はこちらにお願い致します。