365日完全自動でキーワード順位を計測
PC立ち上げ不要の検索順位チェックツール
Nobilista(ノビリスタ)はブラウザ上で動くクラウド型検索順位チェックツールです。
- PCへのインストール不要
- Macにも対応
- 毎日自動で検索順位を取得
- 検索ボリューム・SEO難易度を取得
- 順位をモニタリングしやすいインターフェイス
今なら7日間限定で検索順位チェックツール「Nobilista(ノビリスタ)」を0円で利用できます。
この機会にぜひNobilistaをご利用ください。
SEO
公開日2023年7月24日
更新日2023年08月28日
甲斐龍之介
SEOツール「Nobilista(ノビリスタ)」の事業責任者。株式会社IIPにて取締役兼SEO担当者。中小企業庁が設置した経営相談所、福岡県よろず支援拠点にてSEOコンサルタントとしても活動。
SEOにおける「URLの正規化」とは、内容が同じまたは類似しているページやひとつのページに複数のURLが存在する場合に、代表として検索結果に表示するページ(URL)を検索エンジンに伝えることをいいます。
このような重複コンテンツの正規化は、本来検索エンジンが自動でおこなうものです。
ただ、意図しないページが正規化される可能性や重複コンテンツをうまく認識できない可能性もあるため、事前に手動で正規化をおこなっておくのが一般的となっています。
万が一、正規化が不十分だと、被リンクなどSEO評価の分散やインデックスの遅れなど、SEOへマイナスとなる可能性もあるでしょう。
ということで、今回のNobilistaブログでは、URLの正規化の概要やSEOにおいて重要な理由、URL正規化の設定方法についてわかりやすく解説したいと思います。
\本日より7日間限定/
クラウド型の検索順位チェックツールが無料で使い放題
SEO対策を行なう際は、必ず検索順位の計測が必要です。
SEO対策をする前と後で順位の変化を確認することで、SEO対策の効果測定が行いやすくなります。
また、検索順位を毎日記録するなら、当社で提供している検索順位チェックツール「Nobilista(ノビリスタ)」がおすすめ。
現在、7日間限定で0円で利用できるトライアルを実施中。
まずは本日から7日間、無料で順位チェックツールを試してみませんか?
重複コンテンツを避ける方法とは?判定基準や原因別の対策方法、SEOへの影響を解説
本来「正規化」とは、Googleがインデックスの過程でおこなう処理のひとつです。
Googleはページをインデックスする際に、内容が同じまたは類似したページやひとつのページにアクセスできる複数のURLを一度グループ化します。
グループのなかで代表としてインデックスするページをGoogleが選ぶこと、これが正規化です。
ただ、SEOでURLの正規化というと、重複コンテンツを想定して事前にインデックスしてほしい代表ページをGoogleに伝える「手動による正規化」の意味で使われることが多いでしょう。
ここでは、正規化のSEO効果や方法について解説する前に、まず大前提として知っておきたい4つの知識に触れておきます。
GoogleはページをURLごとに認識しています。
そのため、まったく同じ内容のページでもURLが異なれば、別のページと判断します。
たとえば、同じ記事を別々のカテゴリーに入れたとしましょう。
以下は、記事を「SEO(/seo/)」と「ECサイト(/ec-site/)」という2つのカテゴリーに入れたURLの例です。
https://example.com/ja/seo/technical-seo/
https://example.com/ja/ec-site/technical-seo/
この場合、見る側からするとまったく同じ記事が表示されますが、Googleは別々のページとして認識しているということになります。
SEOとURLの関係性とは?SEOに効果的なURLの設定方法を解説
Googleはページをインデックスする過程で重複コンテンツを洗い出し、そのなかから代表としてインデックスするページ「正規ページ(正規URL)」を選びます。
正規ページは、インデックスした後に検索結果に表示されるほか、おもな評価ページとなるのが特徴。
もちろん、クロールも高い頻度でおこなわれます。
Google では、重複する複数のページから正規 URL のみをインデックスに登録できます。
引用:Google – 正規 URL
一方、正規ページ以外は「重複ページ(重複URL)」と認識されます。
重複ページの特徴は以下です。
正規ページと重複ページの扱いには、大きな差があることがわかったと思います。
クローラーとは?意味や仕組み、巡回を促す対策、拒否する方法をわかりやすく解説
本来Googleは、自動で正規ページを選ぶことができます。
正規ページを選ぶ基準は以下をはじめ、さまざまなシグナルがあるようです。
とはいえ、すでにお伝えしたとおり、Googleも完ぺきではありません。
SEOへの影響も大きいため、手動での正規化はやはり必要でしょう。
canonical(カノニカル)とは?設定方法や書き方、重複URLの正規化によるSEOへの影響
困ったことに、重複URLは意図せず作られていることが多いです。
たとえば、Webサイトにある「サイト内検索機能」。
検索結果ページは以下のとおり、検索した単語ごとにURLが作られます。
▼東京都のサイト内検索で「人口」と検索した場合
▼東京都のサイト内検索で「税金」と検索した場合
もうひとつ例をあげるなら、ECサイトのソート(並べ替え)機能やフィルタ機能です。
ユーザーが特定の条件でソートすると、条件ごとにページ(URL)が自動生成されます。
▼楽天で「安い順」に並べ替えた際のURL
▼楽天で「新着順」に並べ替えた際のURL
細かく条件が指定できるソート機能やフィルタ機能がある場合、ユーザーの数や条件の数だけ重複URLが生成されると考えましょう。
SEOに強いECサイトの作り方とは?通販サイトで商品ページを検索上位表示させるためにやるべきこと
次に、URLの正規化とSEOの関係についてお話しします。
正規化が正しくできていない場合に、SEOにはどのような影響があるのでしょうか。
重複コンテンツが重複ページと認識されず、正規化されない状態。
すなわち、アクセス数や被リンク数などSEOにかかわる評価が、すべて重複コンテンツごとに分散してしまう状態といえます。
もちろん、Googleからの評価も別々になってしまうため、SEOにおいて不利になるのはいうまでもないでしょう。
被リンクとは?増やし方や獲得方法の例、SEOとの関係
不必要なページにもクロールすることで重要なページへのクロール、さらにはインデックスも比例して遅くなります。
インデックスが遅くなるということは、検索結果への表示も遅れるということ。
SEOは効果が出るまでに時間がかかる施策のため、インデックスの遅れはSEOでもマイナスといえるでしょう。
SEO対策の効果とは?効果が出るまでの期間や効果の高いSEO施策を紹介
正規ページ以外のURLは、基本的にインデックスされません。
つまり、Googleが間違えて正規ページを選んでいた場合や重複コンテンツでないものを重複ページとしていた場合。
本来のページが検索結果に表示されないといったことが起こります。
もちろん、SEOにおいては絶対に避けたいことです。
Googleにインデックスされない原因別の対策方法!クローラーが来ない問題の解決方法やインデックスを促進する方法
正規化は、大規模サイトで問題となりやすい、クロールバジェットにもかかわってきます。
「クロールバジェット」とは、Webサイトに割り当てられたクロールの上限です。
この上限を超えるとクロールが制限されてしまうため、インデックスの遅れにもつながります。
クロールバジェットの可能性があるWebサイトは以下の通りです。
補足として「リダイレクト」とは、特定のURLにアクセスすると強制的に別の指定ページに飛ぶような設定です。
そしてリダイレクトチェーンとは、このリダイレクトが連続して起こる状態。
数回程度のリダイレクトであれば問題ありませんが、あまりにもリダイレクトチェーンが続く場合やリダイレクトページにリダイレクトする「リダイレクトループ」はSEOでもマイナスとなるため避けましょう。
クロールバジェットについて、くわしくは以下の記事をご覧ください。
クロールバジェットとは?大規模サイトのSEOやGoogleの見解を解説
重複コンテンツに対して、悪いイメージを持っている方は多いと思います。
ただ、実のところ重複コンテンツ自体は、ガイドライン違反やGoogleペナルティの対象ではありません。
すでにお話したとおり、重複コンテンツ自体はよくあることであり、Webサイトの仕組みによってはどうしても発生するものだからです。
それはGoogleも認識しており、以下のように発言しています。
サイト上で重複コンテンツが生じることは通常のことであり、Google のスパムに関するポリシーの違反にはなりません。
引用:Google
Googleペナルティとは?解除方法や確認方法、原因と対策を解説
Google自身も正規化はおこないますが、正規ページの判断が難しいケースもあります。
手動での正規化が必要になりやすい事例を5つ紹介しましょう。
URLにつく「www(World Wide Web)」。
最近では、wwwがついていないURLもよく見かけます。
https://www.example.com/
https://example.com/
wwwのありなしは、どちらでもかまいません。
だからこそ、Google側での判断は難しいといえるでしょう。
ただ、最近はレンタルサーバーとの契約時やWordPressの初期設定でwwwの正規化をする必要がないケースも多いです。
試しに、アドレスバーにwwwありとなしのURLを打ち込んで確認をしてみましょう。
どちらかのURLにリダイレクトするようなら、正規化を気にする必要はありません。
wwwあり・wwwなしはどちらが良い?統一すべき理由や設定方法を解説
URL末尾につく「/(スラッシュ)」は、俗にトレイリングスラッシュといわれています。
https://example.com/
https://example.com
https://example.com/seo/
https://example.com/seo
スラッシュがあってもなくても同じページが表示されますが、URLが異なるため重複コンテンツ扱いになります。
ただし、Webサイトのほとんどは「スラッシュあり」にリダイレクトされることが多いため、www同様に正規化を気にする必要はないでしょう。
とはいえ、リダイレクトされるか念のためアドレスバーで確認をおすすめします。
もしリダイレクトされず同じページが表示される場合は、URLの正規化が必要です。
サイトの移転、リニューアルなどでドメイン(URL)が変わる際にも、手動での正規化をおすすめします。
ページの中身が同じで、異なるURL(旧URLと新規URL)が存在している状態とはまさに重複コンテンツの代表例です。
さらにGoogleの場合、評価がすでにある旧URLを正規ページとする可能性が高いため、ドメインの変更はとくに手動での正規化が欠かせないシーンといえるでしょう。
サイトリニューアル時にSEOで注意すべき点は?サイト移転やURL変更をする時のポイントも解説
コンテンツの大部分が似ているページ同士は、重複コンテンツとなる可能性が高いです。
たとえば、ECサイトの商品ページをサイズやカラーごとに分けている場合。
サイズやカラー以外はほとんど同じ内容になるため、もちろん重複ページとGoogleは判断するでしょう。
そしてこのとき正規ページを指定したい場合は、やはり手動での正規化が必要になります。
「?」のついたURLを見たことはあるでしょうか。
この「?」以降は「パラメータ」という要素で、ユーザーの操作によって自動生成されるページにつくものです。
https://example.com/blog/women?category=dresses&color=blue
たとえば、以下のような機能を使う際にパラメータはよく使われます。
パラメータも重複コンテンツと判断されることが多く、正規化が必要といえるでしょう。
「www」や「トレイリングスラッシュ」「パラメータ」など、URLの文字列の意味や知っておくとちょっとおもしろい話を以下の記事で紹介しています。
SEOの知識としても役に立つため、ぜひお時間があるときにご覧ください。
SEOとURLの関係性とは?SEOに効果的なURLの設定方法を解説
「http」と「https」に関しては、Googleがおこなう正規URLの判断基準のひとつのため、あえて手動でおこなう必要はないように思えます。
Google は、いくつかの要因(シグナル)に基づいて正規ページを選択します。
シグナルには、ページが HTTP と HTTPS のどちらで配信されているか、ページの品質が高いか、サイトマップに該当 URL が存在するか、rel=canonical ラベルが付けられているかなどがあります。
引用:Google がインデックス登録で正規 URL を選択する方法
また、Googleのジョン・ミューラー氏いわく、URL末尾の「.index.html」「.html」も早い段階でGoogleが「なし」で正規化してしまうようです。
こちらもあえて正規化する必要はないといえるでしょう。
常時SSL化(https)はSEOに効果あり!SEOとの関係性やSSL化されていないサイトがどうなるのか解説
現在レスポンシブデザインが主流ですが、スマホサイトとPCサイトが別URLだというWebサイトもまだまだあるでしょう。
スマホサイトとPCサイトは、基本的に重複コンテンツに該当します。
ただ、Googleは正規化においてデバイスに沿ったURLを選ぶことができるようです。
正規 URL とは、そのページの代表として最もふさわしいバージョンであり、大半のサイト訪問者が使用する「標準的なデバイスタイプ」(多くのサイトではモバイル デバイス)で適切に表示される URL を指します。
引用:Google
後述のスマホサイトとPCサイト向けの正規化はGoogleも推奨しており、スマホサイトを確実に伝えるという点ではおすすめです。
ただ、現在は必須でない可能性もあるということを、ここでは補足しておきます。
以下のようなインデックス関連の問題が起きていなければ、基本的に正規化は問題なくおこなえていると思ってよいでしょう。
自分のWebサイトの正規化がどのようになっているか知りたいという方は、Googleサーチコンソールの「URL検査ツール」から正規化の確認ができます。
くわしいチェック方法を見ていきましょう。
Googleサーチコンソールの「URL検査ツール」を使って、どのページが正規化されているか調べてみます。
すると以下の画像のような、インデックスの状況が表示されます。
上記のように「URLはGoogleに登録されています」とあれば、入力したページのURLが正規URLとなっているので問題はありません。
一方で「URLがGoogleに登録されていません」とある場合は、別のページが正規URLとされている可能性が高いです。
正規ページに指定されているURLを確認して、手動の正規化を考えましょう。
正規化の状況を確認するには「ページはインデックスに登録されていません:」に書かれている理由を見ます。
理由によって、正規化がどのような状況になっているかがわかります。
以下の理由は、正規ページが指定されておらず、Googleの判断で正規URLを決めている状態に表示されるものです。
重複しています。ユーザーにより、正規ページとして選択されていません
「ユーザーが指定した正規URL」の部分も「なし」となっています。
正確な正規ページを伝えるため、手動での正規化をおこないましょう。
正規ページは指定しているものの、Googleの判断でより適切だと思うページを正規URLとすることがあります。
その際の「ページはインデックスに登録されていません」の理由は以下です。
重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました
指定している正規URLと、Googleが正規URLに選択したものが違います。
また、この状況でよくあるのが、自分が指定した正規URLが間違っていたケースです。
いずれにせよ、手動での正規化をおこなうべきでしょう。
正規化の方法は、おもに4つです。
Webサイトの状態や正規化の内容によって、適した方法が変わるためよく確認しておきましょう。
重複ページが見られなくなってもよい場合は、ページを統合する「301リダイレクト」での正規化をおすすめします。
もちろん、リダイレクト元のページは見られなくなるため注意しましょう。
このときリダイレクト元の評価は、リダイレクト先に受け継がれます。
301リダイレクトがおすすめのケースは以下の通りです。
301リダイレクトの設定は「.htaccessファイル」を作成するか、WordPressであればプラグインの活用がおすすめです。
いずれも難しい場合は、次で紹介するcanonicalタグの正規化をおこないましょう。
301リダイレクトの具体的な方法は、以下の記事をご覧ください。
301リダイレクトとは?設定方法・確認方法やSEOとの関係、.htaccessの書き方を解説
正規化後も、重複ページは見られるようにしたいという場合は、「canonicalタグ」での正規化がおすすめです。
canonicalタグがおすすめのケースは以下の通り。
canonicalタグとは、htmlタグ(正確にはlink要素の属性値)の一種。
重複ページのhead内に以下のタグを記述することで、記述のあるページの正規URLをGoogleに伝えることができます。
<link rel=”canonical” href=”正規化したいページのURL”>
また日ごろから「自己参照canonical」を意識しておくこともおすすめです。
自己参照canonicalとは、正規ページにcanonicalタグを記述し、正規URLつまり記述しているページ自身のURLを記載することをいいます。
WordPressでは、新規ページにはこの自己参照canonicalがデフォルトで設定されるようになっているため、正規URLを伝え忘れるということはあまりないでしょう。
canonicalタグの具体的な設定方法は、以下の記事をご覧ください。
canonical(カノニカル)とは?設定方法や書き方、重複URLの正規化によるSEOへの影響
スマホサイトとPCサイトが別URLで存在している場合、正規化は「canonicalタグ」と併用して「alternateタグ」も使用しましょう。
スマホサイトにはcanonicalタグを、PCサイトにalternateタグを記述することで、Googleにただの重複コンテンツではなく、スマホサイトとPCサイトの関係であることを伝えることができます。
▼スマホサイトの<head>内
<link rel=”canonical” href=”PCサイトの正規化したいページURL”>
▼PCサイトの<head>内
<link rel=”alternate” media=”only screen and (max-width: 640px)” href=”スマホサイトのページURL”>
alternateタグ(Link rel=alternate)の意味とは?記述方法や多言語・スマホサイトなど事例を解説
大規模サイトやサイト移転におけるドメイン変更など、正規化したいページ数が多い場合は「サイトマップの送信」がおすすめです。
ただし、いくつか注意点があります。
まず、301リダイレクトやcanonicalタグよりも、正規化としての効力は弱いと覚えておきましょう。
もし、301リダイレクトやcanonicalタグが設定されていた場合、そちらの方が優先されるということです。
そして、重複ページ自体は残るので、クロールはされ続けます。
クロールバジェットやクロール関連の問題を解決するための正規化としては、ふさわしくありません。
XMLサイトマップ(sitemap.xml)とは?作り方やSEO効果、Googleへの送信方法を解説
URLの正規化をおこなったあとは、Googleサーチコンソールの「URL検査ツール」で再度確認してみましょう。
見方は、正規化が必要かどうか判断した方法と一緒です。
正規ページのURLを入力して、正規URLの部分が同じか確認してください。
そのほか、検索順位チェックツールのNobilista(ノビリスタ)を利用して、URLの正規化ができているかを確認することもできます。
Nobilistaでは、登録キーワードごとに、「PLP(Preferred Landing Page)」を登録することができます。
PLPをキーワードごとに設定することで、狙っているキーワードに対して、意図したURLがランクインしているかどうか(URL正規化ができているか)を把握することができます。
登録キーワードに対してPLPが一致しているかどうかは、レポート画面の一覧で確認することができ、意図したURLがランクインしていない場合はすぐ気づくことができます。
(×の表示が出ているキーワードは、意図したURLがランクインしていない。)
サーチコンソールを利用した方法は少し難易度が高いですが、Nobilistaを使うことで簡単にURL正規化のチェックが可能です。
まずは、「優先URL機能(PLP)」より機能の詳細をご覧ください。
クレカ登録不要で7日間使い放題
URLを正規化する際の注意点を2つご紹介します。
canonicalタグやサイトマップ送信など、正規化で指定するURLは間違えないようにしましょう。
また、内部リンクなどWebサイトで使用するURLは、正規URLと統一させてください。
正規URLがバラバラだったり、間違っていたりするとインデックスされない原因にもなります。
robots.txtとは、クローラーを制御するためのファイルです。
robots.txtを利用することで、クロールしてほしくないページを伝えることができるのですが、canonicalタグを使った正規化はクロールされることが前提となっています。
つまり、robots.txtがあるとうまく正規化ができません。
両者は併用しないようにしましょう。
robots.txtの書き方とは?確認方法やSEO意識した使用ケース、記述例も紹介
URLの正規化に関する、よくある質問にお答えします。
正規化が必要な重複コンテンツを放置することで、被リンクなど評価の分散やインデックスの遅れ、インデックスされない原因となる可能性があります。
SEOにおけるマイナスを事前に回避するためにも、重複コンテンツの正規化は欠かせないといえるでしょう。
正確な日数は不明ですが、体感だと数日程度で反映されるようです。
とはいえ、1週間ほどは様子を見ることをおすすめします。
おすすめ記事一覧
新着記事
カテゴリ
※クレジットカードの登録は不要です。
※トライアル終了後の自動課金はありません。