SEO

更新日2024年03月16日

URL正規化とは?SEOに必要な理由や最適化のやり方

甲斐龍之介

SEOツール「Nobilista(ノビリスタ)」の事業責任者。株式会社IIPにて取締役兼SEO担当者。中小企業庁が設置した経営相談所、福岡県よろず支援拠点にてSEOコンサルタントとしても活動

詳細を見る

公的機関におけるセミナー実績

ソーシャルメディア

 

SEOにおける「URLの正規化」とは、内容が同じまたは類似しているページやひとつのページに複数のURLが存在する場合に、代表として検索結果に表示するページ(URL)を検索エンジンに伝えることをいいます。

このような重複コンテンツの正規化は、本来検索エンジンが自動でおこなうものです。
ただ、意図しないページが正規化される可能性や重複コンテンツをうまく認識できない可能性もあるため、事前に手動で正規化をおこなっておくのが一般的となっています。

万が一、正規化が不十分だと、被リンクなどSEO評価の分散やインデックスの遅れなど、SEOへマイナスとなる可能性もあるでしょう。
ということで、今回のNobilistaブログでは、URLの正規化の概要SEOにおいて重要な理由、URL正規化の設定方法についてわかりやすく解説したいと思います。

大手企業も続々導入中!

多機能型 検索順位チェックツール「Nobilista(ノビリスタ)」

Nobilistaは、365日完全自動で大量の検索キーワードの順位を計測するSEOツールです。
※7日間の無料トライアル実施中

Nobilistaの詳細を確認する

重複コンテンツを避ける方法とは?判定基準や原因別の対策方法、SEOへの影響を解説

URL正規化とは

本来「正規化」とは、Googleがインデックスの過程でおこなう処理のひとつです。
Googleはページをインデックスする際に、内容が同じまたは類似したページやひとつのページにアクセスできる複数のURLを一度グループ化します。
グループのなかで代表としてインデックスするページをGoogleが選ぶこと、これが正規化です。

ただ、SEOでURLの正規化というと、重複コンテンツを想定して事前にインデックスしてほしい代表ページをGoogleに伝える「手動による正規化」の意味で使われることが多いでしょう。
ここでは、正規化のSEO効果や方法について解説する前に、まず大前提として知っておきたい4つの知識に触れておきます。

  1. Googleはページを「URL単位」で認識している
  2. 正規ページと重複ページの違い
  3. 正規ページ(正規URL)の判断基準
  4. 重複URLは気づかないうちに生成されているケースが多い

Googleはページを「URL単位」で認識している

GoogleはページをURLごとに認識しています。
そのため、まったく同じ内容のページでもURLが異なれば、別のページと判断します。

たとえば、同じ記事を別々のカテゴリーに入れたとしましょう。
以下は、記事を「SEO(/seo/)」と「ECサイト(/ec-site/)」という2つのカテゴリーに入れたURLの例です。

https://example.com/ja/seo/technical-seo/
https://example.com/ja/ec-site/technical-seo/

この場合、見る側からするとまったく同じ記事が表示されますが、Googleは別々のページとして認識しているということになります。

SEOとURLの関係性とは?SEOに効果的なURLの設定方法を解説

正規ページと重複ページの違い

Googleはページをインデックスする過程で重複コンテンツを洗い出し、そのなかから代表としてインデックスするページ「正規ページ(正規URL)」を選びます。

正規ページは、インデックスした後に検索結果に表示されるほか、おもな評価ページとなるのが特徴。
もちろん、クロールも高い頻度でおこなわれます。

Google では、重複する複数のページから正規 URL のみをインデックスに登録できます。

引用:Google – 正規 URL

一方、正規ページ以外は「重複ページ(重複URL)」と認識されます。
重複ページの特徴は以下です。

  • 重複ページへの被リンクは正規ページに移してくれる
  • クロール頻度を下げてほかのページへのクロールを優先してくれる
  • インデックスから削除してくれる(検索結果に表示されない)

正規ページと重複ページの扱いには、大きな差があることがわかったと思います。

クローラーとは?意味や仕組み、巡回を促す対策、拒否する方法をわかりやすく解説

正規ページ(正規URL)の判断基準

本来Googleは、自動で正規ページを選ぶことができます。
正規ページを選ぶ基準は以下をはじめ、さまざまなシグナルがあるようです。

とはいえ、すでにお伝えしたとおり、Googleも完ぺきではありません。
SEOへの影響も大きいため、手動での正規化はやはり必要でしょう。

canonical(カノニカル)とは?設定方法や書き方、重複URLの正規化によるSEOへの影響

重複URLは気づかないうちに生成されているケースが多い

困ったことに、重複URLは意図せず作られていることが多いです。
たとえば、Webサイトにある「サイト内検索機能」。
検索結果ページは以下のとおり、検索した単語ごとにURLが作られます。

▼東京都のサイト内検索で「人口」と検索した場合

▼東京都のサイト内検索で「税金」と検索した場合

もうひとつ例をあげるなら、ECサイトのソート(並べ替え)機能やフィルタ機能です。
ユーザーが特定の条件でソートすると、条件ごとにページ(URL)が自動生成されます。

▼楽天で「安い順」に並べ替えた際のURL

▼楽天で「新着順」に並べ替えた際のURL

細かく条件が指定できるソート機能やフィルタ機能がある場合、ユーザーの数や条件の数だけ重複URLが生成されると考えましょう。

SEOに強いECサイトの作り方とは?通販サイトで商品ページを検索上位表示させるためにやるべきこと

URL正規化がSEOに必要な理由

次に、URLの正規化とSEOの関係についてお話しします。
正規化が正しくできていない場合に、SEOにはどのような影響があるのでしょうか。

  1. 被リンクなど評価が分散される
  2. 不必要なクロールとインデックスの遅延
  3. インデックスがされない
  4. (大規模サイトは)クロールバジェットの問題

被リンクなど評価が分散される

重複コンテンツが重複ページと認識されず、正規化されない状態。
すなわち、アクセス数や被リンク数などSEOにかかわる評価が、すべて重複コンテンツごとに分散してしまう状態といえます。
もちろん、Googleからの評価も別々になってしまうため、SEOにおいて不利になるのはいうまでもないでしょう。

被リンクとは?増やし方や獲得方法の例、SEOとの関係

不必要なクロールとインデックスの遅延

不必要なページにもクロールすることで重要なページへのクロール、さらにはインデックスも比例して遅くなります。

インデックスが遅くなるということは、検索結果への表示も遅れるということ。
SEOは効果が出るまでに時間がかかる施策のため、インデックスの遅れはSEOでもマイナスといえるでしょう。

SEO対策の効果とは?効果が出るまでの期間や効果の高いSEO施策を紹介

インデックスがされない

正規ページ以外のURLは、基本的にインデックスされません
つまり、Googleが間違えて正規ページを選んでいた場合や重複コンテンツでないものを重複ページとしていた場合。
本来のページが検索結果に表示されないといったことが起こります。
もちろん、SEOにおいては絶対に避けたいことです。

Googleにインデックスされない原因別の対策方法!クローラーが来ない問題の解決方法やインデックスを促進する方法

クロールバジェットの問題

正規化は、大規模サイトで問題となりやすい、クロールバジェットにもかかわってきます。
クロールバジェット」とは、Webサイトに割り当てられたクロールの上限です。
この上限を超えるとクロールが制限されてしまうため、インデックスの遅れにもつながります。

クロールバジェットの可能性があるWebサイトは以下の通りです。

  • 大規模サイト(100万ページ以上)+更新が週1回以上
  • 中規模サイト(1万ページ以上)+更新がほぼ毎日
  • フィルターやソート機能など大量の自動生成ページを持つWebサイト
  • 大量のリダイレクト(リダイレクトチェーン)をしているWebサイト

補足として「リダイレクト」とは、特定のURLにアクセスすると強制的に別の指定ページに飛ぶような設定です。
そしてリダイレクトチェーンとは、このリダイレクトが連続して起こる状態。

数回程度のリダイレクトであれば問題ありませんが、あまりにもリダイレクトチェーンが続く場合やリダイレクトページにリダイレクトする「リダイレクトループ」はSEOでもマイナスとなるため避けましょう。

クロールバジェットについて、くわしくは以下の記事をご覧ください。

クロールバジェットとは?大規模サイトのSEOやGoogleの見解を解説

【補足】重複コンテンツ自体はペナルティにならない

重複コンテンツに対して、悪いイメージを持っている方は多いと思います。
ただ、実のところ重複コンテンツ自体は、ガイドライン違反やGoogleペナルティの対象ではありません。

すでにお話したとおり、重複コンテンツ自体はよくあることであり、Webサイトの仕組みによってはどうしても発生するものだからです。
それはGoogleも認識しており、以下のように発言しています。

サイト上で重複コンテンツが生じることは通常のことであり、Google のスパムに関するポリシーの違反にはなりません。

引用:Google
Googleペナルティとは?解除方法や確認方法、原因と対策を解説

URL正規化が必要なケースや事例

Google自身も正規化はおこないますが、正規ページの判断が難しいケースもあります。
手動での正規化が必要になりやすい事例を5つ紹介しましょう。

  1. wwwありなし
  2. URL末尾に付くスラッシュのありなし
  3. ドメイン変更などによるURLの書き換え・変更
  4. 内容の類似しているページ
  5. フィルタ・ソート機能などパラメータ付きURL

wwwありなし

URLにつく「www(World Wide Web)」。
最近では、wwwがついていないURLもよく見かけます。

https://www.example.com/
https://example.com/

wwwのありなしは、どちらでもかまいません。
だからこそ、Google側での判断は難しいといえるでしょう。

ただ、最近はレンタルサーバーとの契約時やWordPressの初期設定でwwwの正規化をする必要がないケースも多いです。

試しに、アドレスバーにwwwありとなしのURLを打ち込んで確認をしてみましょう。
どちらかのURLにリダイレクトするようなら、正規化を気にする必要はありません。

wwwあり・wwwなしはどちらが良い?統一すべき理由や設定方法を解説

URL末尾に付くスラッシュのありなし

URL末尾につく「/(スラッシュ)」は、俗にトレイリングスラッシュといわれています。

https://example.com/
https://example.com

https://example.com/seo/
https://example.com/seo

スラッシュがあってもなくても同じページが表示されますが、URLが異なるため重複コンテンツ扱いになります。
ただし、Webサイトのほとんどは「スラッシュあり」にリダイレクトされることが多いため、www同様に正規化を気にする必要はないでしょう。

とはいえ、リダイレクトされるか念のためアドレスバーで確認をおすすめします。
もしリダイレクトされず同じページが表示される場合は、URLの正規化が必要です。

URL最後のトレイリングスラッシュあり・なしの違いとは?必要性や有無が混在する時の対処法

ドメイン変更などによるURLの書き換え・変更

サイトの移転、リニューアルなどでドメイン(URL)が変わる際にも、手動での正規化をおすすめします。

ページの中身が同じで、異なるURL(旧URLと新規URL)が存在している状態とはまさに重複コンテンツの代表例です。
さらにGoogleの場合、評価がすでにある旧URLを正規ページとする可能性が高いため、ドメインの変更はとくに手動での正規化が欠かせないシーンといえるでしょう。

サイトリニューアル時にSEOで注意すべき点は?サイト移転やURL変更をする時のポイントも解説

内容の類似しているページ

コンテンツの大部分が似ているページ同士は、重複コンテンツとなる可能性が高いです。
たとえば、ECサイトの商品ページをサイズやカラーごとに分けている場合。
サイズやカラー以外はほとんど同じ内容になるため、もちろん重複ページとGoogleは判断するでしょう。

そしてこのとき正規ページを指定したい場合は、やはり手動での正規化が必要になります。

フィルタ・ソート機能などパラメータ付きURL

「?」のついたURLを見たことはあるでしょうか。
この「?」以降は「パラメータ」という要素で、ユーザーの操作によって自動生成されるページにつくものです。

https://example.com/blog/women?category=dresses&color=blue

たとえば、以下のような機能を使う際にパラメータはよく使われます。

パラメータも重複コンテンツと判断されることが多く、正規化が必要といえるでしょう。

www」や「トレイリングスラッシュ」「パラメータ」など、URLの文字列の意味や知っておくとちょっとおもしろい話を以下の記事で紹介しています。
SEOの知識としても役に立つため、ぜひお時間があるときにご覧ください。

SEOとURLの関係性とは?SEOに効果的なURLの設定方法を解説

【補足①】自動で正規化される「httpとhttps」とURL末尾の「.index.html」

「http」と「https」に関しては、Googleがおこなう正規URLの判断基準のひとつのため、あえて手動でおこなう必要はないように思えます。

Google は、いくつかの要因(シグナル)に基づいて正規ページを選択します。

シグナルには、ページが HTTP と HTTPS のどちらで配信されているか、ページの品質が高いか、サイトマップに該当 URL が存在するか、rel=canonical ラベルが付けられているかなどがあります。

引用:Google がインデックス登録で正規 URL を選択する方法

また、Googleのジョン・ミューラー氏いわく、URL末尾の「.index.html」「.html」も早い段階でGoogleが「なし」で正規化してしまうようです。
こちらもあえて正規化する必要はないといえるでしょう。

常時SSL化(https)はSEOに効果あり!SEOとの関係性やSSL化されていないサイトがどうなるのか解説

【補足②】スマホとPCサイトが別の場合も自動で正規化される?

現在レスポンシブデザインが主流ですが、スマホサイトとPCサイトが別URLだというWebサイトもまだまだあるでしょう。

スマホサイトとPCサイトは、基本的に重複コンテンツに該当します。
ただ、Googleは正規化においてデバイスに沿ったURLを選ぶことができるようです。

正規 URL とは、そのページの代表として最もふさわしいバージョンであり、大半のサイト訪問者が使用する「標準的なデバイスタイプ」(多くのサイトではモバイル デバイス)で適切に表示される URL を指します。

引用:Google

後述のスマホサイトとPCサイト向けの正規化はGoogleも推奨しており、スマホサイトを確実に伝えるという点ではおすすめです。
ただ、現在は必須でない可能性もあるということを、ここでは補足しておきます。

レスポンシブデザインとは?作り方のコツやSEOとの関係、CSS実装方法、テンプレート・参考サイトを紹介

URL正規化が必要かどうかを判断する方法

以下のようなインデックス関連の問題が起きていなければ、基本的に正規化は問題なくおこなえていると思ってよいでしょう。

  1. 検索結果に表示しているページのURLが違う
  2. インデックスされないページがある
  3. 見覚えのないURLからアクセスされている
  4. wwwありなし、末尾のスラッシュありなしのURLが混在している

自分のWebサイトの正規化がどのようになっているか知りたいという方は、Googleサーチコンソールの「URL検査ツール」から正規化の確認ができます。
くわしいチェック方法を見ていきましょう。

「Googleサーチコンソール」で正規URLをチェックする方法

Googleサーチコンソールの「URL検査ツール」を使って、どのページが正規化されているか調べてみます。

  1. 左メニュー「検索パフォーマンス」か「URL検査」を選択
  2. 検索欄に正規ページのURL(検索結果に表示させたいページのURL)を入力

すると以下の画像のような、インデックスの状況が表示されます。

上記のように「URLはGoogleに登録されています」とあれば、入力したページのURLが正規URLとなっているので問題はありません。
一方で「URLがGoogleに登録されていません」とある場合は、別のページが正規URLとされている可能性が高いです。

正規ページに指定されているURLを確認して、手動の正規化を考えましょう。

正規化が必要な例①「正規ページを指定してない」

正規化の状況を確認するには「ページはインデックスに登録されていません:」に書かれている理由を見ます。
理由によって、正規化がどのような状況になっているかがわかります。

以下の理由は、正規ページが指定されておらず、Googleの判断で正規URLを決めている状態に表示されるものです。

重複しています。ユーザーにより、正規ページとして選択されていません

「ユーザーが指定した正規URL」の部分も「なし」となっています。
正確な正規ページを伝えるため、手動での正規化をおこないましょう。

正規化が必要な例②「Googleが別ページを正規URLにしている」

正規ページは指定しているものの、Googleの判断でより適切だと思うページを正規URLとすることがあります。
その際の「ページはインデックスに登録されていません」の理由は以下です。

重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました

指定している正規URLと、Googleが正規URLに選択したものが違います。
また、この状況でよくあるのが、自分が指定した正規URLが間違っていたケースです。
いずれにせよ、手動での正規化をおこなうべきでしょう。

URL正規化の手段と設定方法

正規化の方法は、おもに4つです。

  1. 301リダイレクト
  2. canonicalタグ
  3. alternateタグ
  4. サイトマップの送信

Webサイトの状態や正規化の内容によって、適した方法が変わるためよく確認しておきましょう。

ページが不要な場合は.htaccessで「301リダイレクト」

重複ページが見られなくなってもよい場合は、ページを統合する「301リダイレクト」での正規化をおすすめします。

もちろん、リダイレクト元のページは見られなくなるため注意しましょう。
このときリダイレクト元の評価は、リダイレクト先に受け継がれます。

301リダイレクトがおすすめのケースは以下の通りです。

301リダイレクトの設定は「.htaccessファイル」を作成するか、WordPressであればプラグインの活用がおすすめです。
いずれも難しい場合は、次で紹介するcanonicalタグの正規化をおこないましょう。

301リダイレクトの具体的な方法は、以下の記事をご覧ください。

301リダイレクトとは?設定方法・確認方法やSEOとの関係、.htaccessの書き方を解説

重複ページを残したい場合は「canonicalタグ」

正規化後も、重複ページは見られるようにしたいという場合は、「canonicalタグ」での正規化がおすすめです。
canonicalタグがおすすめのケースは以下の通り。

  • パラメータ付きURLのような自動生成ページ
  • スマホサイトとPCサイトが別に存在する場合の正規化
  • カテゴリが違うためURLが別存在する同一ページ
  • 内容は類似しているが異なるページ(ECサイトのサイズ別・色別の商品ページなど)
  • ABテスト(リダイレクトには「302リダイレクト」を使用)
  • 301リダイレクトが利用できない場合

canonicalタグとは、htmlタグ(正確にはlink要素の属性値)の一種。
重複ページのhead内に以下のタグを記述することで、記述のあるページの正規URLをGoogleに伝えることができます。

<link rel=”canonical” href=”正規化したいページのURL”>

また日ごろから「自己参照canonical」を意識しておくこともおすすめです。
自己参照canonicalとは、正規ページにcanonicalタグを記述し、正規URLつまり記述しているページ自身のURLを記載することをいいます。

WordPressでは、新規ページにはこの自己参照canonicalがデフォルトで設定されるようになっているため、正規URLを伝え忘れるということはあまりないでしょう。
canonicalタグの具体的な設定方法は、以下の記事をご覧ください。

canonical(カノニカル)とは?設定方法や書き方、重複URLの正規化によるSEOへの影響

スマホサイトとPCサイトの正規化は「alternateタグ」

スマホサイトとPCサイトが別URLで存在している場合、正規化は「canonicalタグ」と併用して「alternateタグ」も使用しましょう。

スマホサイトにはcanonicalタグを、PCサイトにalternateタグを記述することで、Googleにただの重複コンテンツではなく、スマホサイトとPCサイトの関係であることを伝えることができます。

▼スマホサイトの<head>内
<link rel=”canonical” href=”PCサイトの正規化したいページURL”>

▼PCサイトの<head>内
<link rel=”alternate” media=”only screen and (max-width: 640px)”  href=”スマホサイトのページURL”>

alternateタグ(Link rel=alternate)の意味とは?記述方法や多言語・スマホサイトなど事例を解説

正規化したいページ数が多い場合は「サイトマップの送信」

大規模サイトやサイト移転におけるドメイン変更など、正規化したいページ数が多い場合は「サイトマップの送信」がおすすめです。

ただし、いくつか注意点があります。
まず、301リダイレクトやcanonicalタグよりも、正規化としての効力は弱いと覚えておきましょう。
もし、301リダイレクトやcanonicalタグが設定されていた場合、そちらの方が優先されるということです。

そして、重複ページ自体は残るので、クロールはされ続けます。
クロールバジェットやクロール関連の問題を解決するための正規化としては、ふさわしくありません。

XMLサイトマップ(sitemap.xml)とは?作り方やSEO効果、Googleへの送信方法を解説

URL正規化ができているか確認する方法

URLの正規化をおこなったあとは、Googleサーチコンソールの「URL検査ツール」で再度確認してみましょう。
見方は、正規化が必要かどうか判断した方法と一緒です。
正規ページのURLを入力して、正規URLの部分が同じか確認してください。

そのほか、検索順位チェックツールのNobilista(ノビリスタ)を利用して、URLの正規化ができているかを確認することもできます。
Nobilistaでは、登録キーワードごとに、「PLP(Preferred Landing Page)」を登録することができます。

PLPをキーワードごとに設定することで、狙っているキーワードに対して、意図したURLがランクインしているかどうか(URL正規化ができているか)を把握することができます。

登録キーワードに対してPLPが一致しているかどうかは、レポート画面の一覧で確認することができ、意図したURLがランクインしていない場合はすぐ気づくことができます。
(×の表示が出ているキーワードは、意図したURLがランクインしていない。)

サーチコンソールを利用した方法は少し難易度が高いですが、Nobilistaを使うことで簡単にURL正規化のチェックが可能です。
まずは、「優先URL機能(PLP)」より機能の詳細をご覧ください。

クレカ登録不要で7日間使い放題

公式サイトで詳しく確認する

PLP(Preferred Landing Page)とは?管理・対策のやり方と便利SEOツールを紹介

URL正規化するときの注意点

URLを正規化する際の注意点を2つご紹介します。

  1. 指示する正規URLは統一する
  2. robots.txtは使用しない

指示する正規URLは統一する

canonicalタグやサイトマップ送信など、正規化で指定するURLは間違えないようにしましょう。
また、内部リンクなどWebサイトで使用するURLは、正規URLと統一させてください。
正規URLがバラバラだったり、間違っていたりするとインデックスされない原因にもなります。

robots.txtは使用しない

robots.txtとは、クローラーを制御するためのファイルです。
robots.txtを利用することで、クロールしてほしくないページを伝えることができるのですが、canonicalタグを使った正規化はクロールされることが前提となっています。
つまり、robots.txtがあるとうまく正規化ができません。
両者は併用しないようにしましょう。

robots.txtの書き方とは?確認方法やSEO意識した使用ケース、記述例も紹介

URL正規化に関するよくある質問

URLの正規化に関する、よくある質問にお答えします。

URLの正規化がSEOで必要な理由は?

正規化が必要な重複コンテンツを放置することで、被リンクなど評価の分散やインデックスの遅れ、インデックスされない原因となる可能性があります。
SEOにおけるマイナスを事前に回避するためにも、重複コンテンツの正規化は欠かせないといえるでしょう。

正規化の反映はどれくらいかかる?

正確な日数は不明ですが、体感だと数日程度で反映されるようです。
とはいえ、1週間ほどは様子を見ることをおすすめします。

7日間0円トライアル実施中!

※クレジットカードの登録は不要です。   
※トライアル終了後の自動課金はありません。