こんばんは、とろとろうぱうぱです。
久しくブログを更新していなかったことには、理由がありまして、この10日間、ずっとgoogleのサーチコンソールと格闘していました。本当は、「解決しました!同じ悩みがある方は、こうすれば解決できるよ」という記事にしたかったのですが、かなわず。。。
とりあえず、状況とやったことを整理して報告しますので、アドバイスがある方、コメントをお願いします。
- はてなブログの記事がgoogl検索されない?
- サーチコンソールの結果はどうなのか?
- 検出-インデック未登録とは?
- なんで、検出-インデック未登録になっている?
- インデックス未登録解消のための苦闘の歴史
- 2021年2月20日の状況
- bingではどうなの?
- まとめ
はてなブログの記事がgoogl検索されない?
この問いは、いろいろなところで報告されていますし、読者の方の中にも同じ悩みを持つ方もいらっしゃるのではないでしょうか?
google検索で自分のページが認識されているかどうかを確認する方法は、一番、手っ取り早いのはgoogleを開き、検索のキーワードに「site:自分のブログのトップページのアドレス」を入力することです。
私のブログであれば、
「site:https://torotoroupaupa.hatenablog.com/」
と入力します。こうすることで、自身のブログの中でgoogle検索で見つけることができるページ数を知ることが可能です。
私の現状は下記のとおりで、現在、記事だけでも43記事を投稿してるのに、21ページしかヒットせず。実際は、トップページやら月別ページやらカテゴリページやらあるので、50~60ページぐらいはありそうなものですが。
サーチコンソールの結果はどうなのか?
使っているかたはおなじみだと思いますが、google Search Console(サーチコーンソール)で状況を調べてみました。なお、知らない方のために簡単に説明すると、google Search Console(サーチコーンソール)はgoogleの検索順位や閲覧数、クリック数などを調べるのに使うツールです。アフィリエイトとかする人がすごく気にするツールですね。登録してみたいという方は下記のサイトなどを参考にして組みてください
このツールを使うと、検索順位だけでなく自分のブログがgoogle検索されるかどうかを判定することができます。その結果が下記のとおりです。やはり、googleが認識しているのは21ページしかありません。
ここで認識されている「有効」なページ数は、さきほどgoogleで検索した結果と同じく、21ページとなっています。ここで気になるのが「除外」の28ページ。この内訳を次は見てみましょう。
「除外」のページがどんな理由で除外されているかもサーチコンソールから知ることができます。除外理由は、「検出-インデック未登録」となっています。
ふむふむ、googleでサイトがあること自体は検出してくれているけど、インデックスが未登録ということですね。・・・つまり、どういうことや?
ここから長い格闘が始まりました。。。
検出-インデック未登録とは?
まず、この状態がどういう状態なのかを知識が全くないので、ネット上で調べまくりました。分かったのは、次の2点。
1.検索結果が出る原理
googleなどの検索結果が出る原理は、
1.クロールする(ネット上にあるページをさまよって、ホームページの情報を集める)
2.インデックスする(クロールの時に集まったものをgoogleが登録する)
の2つのステップを踏む。
2.検出ーインデックス未登録とは
「検出-インデックス登録」の状態は、
- サイトの入り口までは来てくれたけど、ページの中身までは見てくれなかった
- 中身を見るには見たけどインデックスはしてくれなかった
ということです。
なんで、検出-インデック未登録になっている?
ここがポイントですよね。Google の John Mueller(ジョン・ミューラー)氏が言うには、原因としては次の2点が考えられるそうです。
- サイトのリンクの問題(リンクがうまく貼れていない)
- コンテンツの問題(あまり、良い内容の記事ではない)
うーん。。。2はあるかもしれんけど、1は、はてなブログの人全員の共通のお話じゃないの?2も一致率を気を付けているから、そこまでヒドイ内容だとは思わないけどな。まあ、見直すか。
インデックス未登録解消のための苦闘の歴史
ここからは、苦闘の歴史をご紹介。
サイトマップが登録されていないせいじゃないの?
また、サーチコンソールのお話に戻ります。サーチコンソールには、自分のブログを見に来てもらいやすくするように「サイトマップ」を登録することができます。サイトマップはサイト内のページを分かりやすく一覧にしたものです。マップとあるとおり、ブログの地図みたいなものですね。
サイトマップをサーチコンソールに登録しておくと何が良いかというと、クロールしに来てくれた時、地図があるので、道順が分かりやすくなって綿密にブログを巡回してくれます。そのため、新しい記事をアップしたときに早く見つけてもらえやすくなるそうです。
しかし、ここで問題が発生。実は、はてなブログのサイトマップは、癖があることで有名です。なぜか、サイトマップが認識されにくく、苦労されている方が多いこと多いこと。対策しているページがわんさか出てきます。いろいろと調べたのですが、サイトマップのアドレスが複数の候補があるそうですね。
結論は、公式見解から「sitemap_index.xml」とのこと。早速、これをサーとコンソールに登録して送信。
わくわくして待ってみましたが、一向に改善せず。うーん。。。そっか。サイトは検出されているんやから、サイトマップの問題ではないわな。
なお、登録の仕方は、次の図を参照してください。簡単にできます。
- サーとコンソールを立ち上げ、「サイトマップ」を選択
- 「サイトマップのURLを入力する」の欄に「sitemap_index.xml」を入力
- 送信ボタンを押す
- 登録されるまで待つ(数日かかる場合あり)
URL検査を実行
インデックス未登録の場合、サーチコンソールで手動で登録すればよいとの情報を入手。早速やってみました。やり方は、簡単。
- サーチコンソールの上のほうにある「~内のすべてのURLを検査」の欄に手動で登録したいURLを入力
- インデックス登録をリクエストを押す
詳しくは、下記の図を見てもらえば、だれでもできます。
気を付けてもらいたいのは、ULR検査による手動登録は、1日で行える上限回数が定められているので、一気にたくさんの登録はできません。公式に何回なのかが明示されたページが見つけられなかったので、感覚的で申し訳ないのですが、おそらく20~30回程度が上限だと思います。
URL検査を行って問題がなければ、数分から数時間程度でgoogleにインデックスされるとのこと。おっし、これで大丈夫なはず!
・・・1日たっても、音沙汰無し。どういうこっちゃ。
コンテンツを見直す
先に書きましたが、googleの人が言っていました。コンテンツが悪いとインデックスしないよと。えー、じゃあ、コンテンツが悪いのか。コピーチェックで判定された一致率とかではないですよね。
一致率の下げ方については、下記を参考にしてくださいね。
同じような悩みを抱えている人を探しまくりました。その結果、コンテンツを直す場合、次の2点をやってみるとよいとのこと
- タイトルを少し変えてみる
- 500字くらい字数を増やす
わらにすがる思いで、やってみました。
・・・効果なし。
一致率を再度確認
もしかして、似たような記事があるのを実は見逃していて、一致率が悪いということはないの?と思い、コピーチェックサイトで自分の記事を再度、チェックしてみました。あれ?55%?高いやん。
詳細を見ているみると、はてなキーワードとブログ村で引っかかっていました。つまり、ブログ村とはてなキーワードでは、googleにインデックスされているということですね。先にこっちが登録されたのが原因なの?
そう思って、再度、記事を書き直して、一致率を下げてみました。
結果は・・・ダメでした。もうなんなん!!もう、わからん、たすけてー。
2021年2月20日の状況
っていうのが、今の状態です。あとは、サイト内のリンクが切れている場合ですが、どうやって調べて良いかわかりません。そもそも、まったくいじっていないので、ここが原因とは思えないのですが。
また、他の方のはてなブログを見てみました。構成が私のページとほとんど同じ方を中心に確認したのですが、新記事をアップしてだいたいの人が数日でgoogleにインデックスされていました。なんで、私のブログではできないのか本当にわかりません。
bingではどうなの?
他の検索エンジンといえば、yahooとbingがありますよね。このうち、yahooはgoogleの検索エンジンを使っているので、今回の結果と同じになるはず。では、bingではどうかを確認してみました。
結果は、全てのページをインデックスしてくれてました。となると、やっぱりgoogleの問題なのかー。
まとめ
なぜか、googleに嫌われてしまっています。ここまで来たら気になるので、インデックス未登録の原因を見つけて、皆さんに開示したいと思います。もう意地ですわー。