SEO

SEOで悪影響の重複コンテンツとは?回避、解消方法も解説!

SEOで悪影響のある「重複コンテンツ」と呼ばれる事象の状態でご相談を受けることは非常に多いです。SEO業界では「カニバリ」という呼び方もされています。ひどい場合はGoogleからペナルティを与えられるリスクもあります。具体的にどのような状態を避けるべきなのかと、対処方法についてご紹介します。

重複コンテンツとは

「重複コンテンツ」とは、そのページと重複するコンテンツが同一サイト内ないしはサイト外に存在する状態のことを言います。Googleは、オリジナルのページを評価すると明言しています。Googleのブログでも重複コンテンツに関する言及があります。

重複コンテンツは、以下の2種類に分けて考えた方が良いでしょう。

  1. 外部重複:サイト外で内容が重複したページが公開されている
  2. 内部重複:サイト内で他に内容が重複したページがあり、公開されている

重複コンテンツだとどうなるのか、ペナルティについて

では、重複コンテンツがあるどうなるのかについて解説致します。

上位に表示されない

重複コンテンツであるとGoogleに認識されると、後から掲載された方のページは検索結果の上位に表示されません。

同じサイトの他のページは上位に表示されるのに、なぜか特定のページだけ上位に表示されない場合や、サイト全体として、不自然に評価が低い場合には重複コンテンツを疑ってみましょう。

ペナルティが与えられる

外部重複、すなわちサイト外との重複がひどい状態だと、ペナルティが与えられる可能性もあります。

重複コンテンツでのペナルティは、手動ペナルティではなく自動ペナルティで与えられるため、サイト運営者が気づきにくいという問題もあります。

ペナルティが与えられると、サイト全体の評価が下げられます。

ペナルティが与えられてない状態では、他のサイトと重複しているページのみ評価が下げられますが、ペナルティが与えられると、重複しているわけではないページの評価まで下げられます。具体的には、トップページさえ、上位に表示されにくくなるということです。

ただ、ペナルティが与えられても指名検索(会社名などでの検索)では1位に表示されるため、やはりペナルティが与えられているかどうかは気づきにくいのです。

評価の分散が起こる

内部重複、すなわちサイト内で重複している場合にはペナルティが与えられることはありませんし、自サイトなので、そのページが上位に表示されなくても別に構わない、というケースもあるでしょう。ただ、完全に重複しているわけでもなく、それぞれに多少違う場合に、本来なら1つのページが高い評価を受けられるはずのところ、評価が各ページに分散してしまう、ということが起こり得ます。

重複コンテンツはどうして評価されないのか

他のサイトを参考にする、というのはSEO対策を行う上でやるべきとも言える行為です。ただ、真似てはいけません。コピーしてしまうのはそもそも、著作権の問題です。

そのことがまずありますが、ユーザー(サイト閲覧者)のことを考えてみましょう。知りたいことを検索して調べて、上位に表示されるページが似たようなものだと、いくつか見ても徒労に終わります。

ちなみに私は技術的なことをよく調べますが、いまだに、同じような情報ばかり出てきて徒労に終わることはよくあります。調べても調べても、バグが含まれる同じコードばかりが出てくるなど。1サイトだけそういうページが上位にあるぐらいなら、気にしません。でも、いくら探しても同じバグが含まれる同じコードばかり出てくる、というのは疲れます。そして、意外に2~3ページ目に良い情報が載っていたりします。

そういうことができるだけ起こらないように、ということをGoogleは考えているわけです。現状でもこのような状態なので、まだまだ厳しくなると考えた方が良いと思います。

※この記事を書いた後にあたる2022年8月、Googleは重複コンテンツに対する取り締まり強化を発表しています。

また、同一人物(同一企業)が上位を独占する、ということをしにくくする、という意図もあると思っています。それぞれのサイトの内容が異なるのであればよいのですが、同じようなサイトで上位を独占されると、ユーザーも困りますし、競争原理に反します。仮に、それがまかり通った状態を考えてみてください。大手にはどこもかなわなくなります。

どのくらい似ていると重複コンテンツとみなされるのか

重複コンテンツが評価されないというのは以前からなのですが、経験的に、どんどん厳しくなっているのが手に取るように分かります。「厳しくなっている」というよりも「Googleの判断の正確さが増している」と言うのが正しいかもしれません。

私はこのサイトを使って常に実験をしています。このサイトにはページ同士で大量に重複しているページがありました。

公開した直後、各ページが、とある検索キーワードの組み合わせで上位に表示されました。しかし、しばらくしたらほとんどが上位に表示されなくなりました。今はその状態は解消させてますが。

ただ、似たようなことをしている複数のサイトで、その時点でも各ページが上位に表示されている事例がありました。それぞれのページはタイトル以外、ほとんど重複していました。

どうして、そのサイトは重複しているページでも上位に表示されていたのでしょうか?答えは私にもわかりませんが、推測できることとしては、

  1. Googleアルゴリズムの正確さが増す前に評価されたページとそうでないページで結果が異なる
  2. サイト全体の評価の違い
  3. E-E-A-T(経験、専門性、権威性、信頼性)の違い

などが考えられます。

別業種でも、重複コンテンツなのに上位に表示されているサイトの事例は知っていまして、おそらく理由は1「公開された時期の違い」だろうと私は思っています。ここ数年の間に公開されたサイトで、重複コンテンツと思われる内容で上位に表示されている事例を知らないからです。

追記:

2023年9月8日時点で、上記サイトを確認したところ見事に上位から消え去ってました。

Googleのコアアルゴリズムアップデートで、それまで上位だったページが突然圏外に消える、という事象は起こり得ます。例えば「医療・健康アップデート」と呼ばれる2017年12月に日本向けに行われたアップデートなどが有名です。

生成AIによって益々重視されるであろうオリジナリティ

一般的な事柄に関しては生成AIで回答が得られるようになった現在、Googleは検索結果上位の多様性を益々重要視すると考えられます。

その考えのもとアップデートが行われれば、重複コンテンツを見抜く精度も高まっていくものと思われます。

重複コンテンツとなってしまっている具体例

外部重複:コピーしてできたような似たようなサイトを持ってしまっている

意図せず古いサイトを残してしまっているケースであっても後から掲載したサイトは順位が上がりません。このケースは結構あります。

不動産会社で、サイトAとサイトBで大量に掲載物件が重複している、というようなのも後から掲載した方のサイトの評価が下がります。それもユーザーにとっては迷惑ですからね。

外部重複:他のサイトのコンテンツを真似ている

記事などで上位表示を狙う場合、まずターゲットキーワードを使って検索してみて、上位に表示されているページを参考にするというのは鉄則とも言えます。

ただ、参考にしているだけなら大丈夫ですが、そのままコピーするのはもちろん論外、類似度が上がるほど重複コンテンツとしてみなされるリスクは高まります。そのロジックは、

  1. 同じページ同士で比較したときの重複具合
  2. 同じサイトで複数ページ同士で比較したときの重複具合
  3. 複数サイトに対しての重複具合

など見る観点は色々あります。3→1の順にリスクは高いと考えられます。

特に見出し(h1タグ~h6タグ)の中身、構成の類似具合などは注意した方が良いと思いますが、そこだけでもないでしょう。GoogleはもちろんAI使ってます。人の目で見て、似ているなと思うページは、似ていると判断できるはずです。同じ画像を使っているか、というのも見られている可能性は高いです。Googleは画像処理で類似画像を検索する機能を持っています。

内部重複:システムで自動的に似たようなページが作られている

例えば、検索結果画面で1ページ目、2ページ目、3ページ目、という具合に表示されるページング機能を持った各ページは、タイトル含め似た形になります。

店舗を多く持つ大手が、各店舗を紹介するページを簡単に作れるようにしている場合なども、それぞれの店舗独自の情報を載せるようにしなければ、重複しやすい例と言えるでしょう。

重複コンテンツのチェック方法、調べ方、判断方法

「&filter=0」を検索結果のURLに足して検索する

Google検索の検索結果URLの末尾に、「$filter=0」を加えて検索すると、サイト内で重複しているために表示されてなかったページが表示されます。

「site:」の検索演算子を用いる

site:URL 検索キーワード

で検索すると、そのサイトのみで検索結果が出てきますので、重複コンテンツの参考にはなります。ただしこの場合、問題のあるものだけが出てくるわけではないので、その点は注意が必要です。

Googleサーチコンソールの「クロール済み – インデックス未登録」を確認する

Googleサーチコンソールで「ページ」メニューから確認できるページのステータスの中で「クロール済み – インデックス未登録」の中に入っているページは、原因として他のページと重複しているためにインデックスされない場合があります。そのため、ここに入っているかどうかを確認しましょう。

ここに入っている場合、そもそも検索に引っかからないので、上述の「&filter=0」や「site:」を使った検索をしても見つかりません。

なお、似たステータスに「検出 – インデックス未登録」というのがありますが、こちらはクロールもされてない状態で、まずはクロールさせることが課題です。

タイトル(h1の値)をそのままで検索してみる

何故か上位に上がらないなと思っているページがあれば、そのページについてh1の値(文言)をそのままコピーして、Google検索で検索してみます。それでそのページが圏外になるようであれば、重複コンテンツとみなされている可能性が高いと思います。

類似度チェックツールを使う

他のページとの類似度をチェックするツールがあります。
CopyContentDetectorは特定のページを指定せずとも、チェックしたいページを指定するだけで、どこかのページと類似してないかをチェックすることができて便利です。

ただおそらくこの類のツールはコピペをしている文章が多いかどうかの判定しかできず、それよりも現在のGoogleの重複コンテンツチェックの度合いは厳しいので、例えばライターに外注した場合にコピペで終わらせてないかのチェックぐらいにしか使えないと思った方が良いと思います。Googleは、内容として既に他のページの存在している内容しかなければ評価を上げてくれません。

コンテンツ制作者に問う

参考にしたサイトがあるか、どの程度似せたか、コンテンツ制作者に確認しましょう。そして、それぞれのサイトを目視で確認してみましょう。

重複コンテンツの解消方法、回避方法

以下に重複コンテンツとならないようにするための留意点、解消方法を列挙します。

独自性(オリジナリティ)を持たせる

まず何よりも、独自性(オリジナリティ)のある内容にすることです。Googleは、重複コンテンツを上位に上げないと同時に、独自性(オリジナリティ)を重視する傾向が強まっているとも思います。

ページの中で、少なくとも20%くらいは独自性(オリジナリティ)のある内容となるようにすることを一つの目安として考えます。

基本的に、他のサイトにすでに載っている情報を別のサイトで別の記事かのようにして掲載することに大義はありません。自サイトが多くの人に見られていて、他の記事を見るついでに、この記事も見てもらいたいというのは気持ちとしては分かりますが、それであれば見てもらいたい記事へのリンクを張って終わりにするべきです。

独自性を持たせるには、以下のようなことがポイントだと思います。

  • 自分の考えや考察が書かれている
  • 自分なりの検証結果が書かれている
  • 他のサイトでは参考にしてないような内容を参照している(そこへのリンクを張っている)

自社で似たような複数のサイトをもっている、という場合は重複しない内容にしていく以外に道はありません。不動産会社で複数のサイトに同じ物件を掲載してしまっている場合は、それぞれのサイトで掲載する物件の種類を明確に分けるべきです。それができないなら一方のサイトは閉鎖すべきです。

仲介会社で、他社と掲載物件が大量に重複している、というのはよくあることだと思いますが、掲載している文章まで一緒でなければ重複コンテンツ扱いにはなりません。掲載元が同一なのか別なのか、掲載目的が何なのかをGoogleが見ているからだと思います。

他のサイトを見ながら書くのをやめて、自分の言葉を使う

答えが決まっているものに対して、同じ内容が書かれてもおかしくはありません。ただ、他のサイトを見ながら書いた内容と、そうでない内容は、類似度が違ってくるはずです。

自分の言葉を使って、一通り書くようにしましょう。

他のサイトを参考にする場合は、複数のサイトを参考にする

1つだけのサイトを参考にして書くよりも、複数のサイトを参考にして書いた内容の方が、特定のサイトに対しての類似度が下がりますよね?

タイトル、見出しの中身、構成の違いを意識する

上述した通り、h1~h6の見出しは、やはり文章の骨格ですから、そこが似ていると似ているように見えますよね。AIも、そう判断する可能性が高いでしょうから、できるだけそこは、あえて変えるくらいの考えで確認するようにしましょう。

一度URLを変えてみる

重複コンテンツとして扱われてしまったページについて、リライトして重複を解消できたと思ったとき、どのくらい効果があるかはわかりませんが、一度URLを変えてみると新しいページとして評価されるので、重複コンテンツ扱いから解消されやすい感じがしています。

なお、全く内容を変えずにこれを実施しても結果は変わらないでしょうし、悪質行為とみなされるリスクがあるので(と言いますか、悪質行為なので)やめておきましょう。

重複コンテンツを設ける場合にすべきこと

どうしても、サイト内である程度の重複は生じます。Googleは次の動画でコメントしている通り、重複コンテンツが悪意なく作られることが多いことも把握しています。悪意なく作られるぐらいの一部の重複コンテンツについては気にする必要はありません。

How does required duplicate content (terms and conditions, etc.) affect search?

ただ、サイトの構成上、一部ではなくほぼ同じページを設けたい場合もあると思います。そういった場合にやるべきことをお伝えします。

canonicalタグを使う

自サイト内で重複コンテンツがある場合、評価を分散させないためにcanonicalタグを使う方法があります。以下のような記述です。

<link rel="canonical" href="正規URL">

canonialタグは、正規のページが他にある場合に、そのページを宣言するためのものです。

301リダイレクトをする

サイトの構造を変えて、URLの変更が浸透するまでの間に前のページも残しておきたいというような場合は、元のページから新しいページに対して301リダイレクトをします。301リダイレクトというのは、正規のページがリダイレクト先である、ということを伝えるための方法です。301リダイレクトの方法はいくつかあり、htaccessファイルに記述する方法などがあります。

301リダイレクトとは?ホームページの引越しやURL変更時のSEOのため

WordPressの場合は、redirectionというプラグインを使うのが簡単です。

Googleのドキュメントについて

Googleの公式ドキュメントにもここで触れた内容の一部など書かれているページがあります。

Google検索セントラル

まとめ

不思議と上位に上がらない、という場合に多い重複コンテンツについて、解説しました。その状態からの回復は、重複している内容を削るか、独自性を持たせたリライティング以外には道はなく、後者は時間はかかりますので、まずは重複コンテンツとなることをできるだけ避けるということを意識するようにしましょう!

著者のイメージ画像

株式会社BringFlower
稲田 高洋(Takahiro Inada)

2003年から大手総合電機メーカーでUXデザインプロセスの研究、実践。UXデザイン専門家の育成プログラム開発。SEOにおいても重要なW3Cが定めるWeb標準仕様策定にウェブアクセシビリティの専門家として関わる。2010~2018年に人間中心設計専門家を保有、数年間ウェブアクセシビリティ基盤委員も務める。その後、不動産会社向けにSaaSを提供する企業の事業開発部で複数サービスを企画、ローンチ。CMSを提供し1000以上のサイトを分析。顧客サポート、サイト運営にも関わる。
2022年3月に独立後、2024年4月に株式会社BringFlowerを設立。SEOコンサルを活動の軸に据えつつ、AIライティングツールの開発と運営を自ら行う。グッドデザイン賞4件、ドイツユニバーサルデザイン賞2件、米国IDEA賞1件の受賞歴あり。