こちらの記事で書いた、「
重複するメタデータ(descriptions)」に関しての原因と対策などの詳細。
対策は後半に書くが、テンプレートのカスタマイズなので、
ブログ(主に忍者ブログ)のカスタマイズの参考にもなると思う。
この問題はGoogleウェブマスターの「コンテンツ分析 - 診断」の項目で確認できる。
問題がなければ表示する項目無しという表示になる。
で、問題があったので「重複するメタデータ(descriptions)」と表示されていたわけだ。件数(ページ数)は18件でGooglebot更新時(4/18)の記事数に符合する。つまり、全てのエントリー記事が該当することになる。
メタデータ(descriptions)とは
まずは「メタデータ(descriptions)」という説明からしたいと思う。
メタデータとはページの各種情報を伝達するための隠しデータで<META ~~>という項目がそれに該当する。
ウェブ関連のサーバーやサービス・アプリケーションは、このメタデータをページ表示の際に参考にする。具体例をあげると、ウェブブラウザなどはメタデータに記載された文字コードセットを参考にページ表示する際の文字コードを選択する、など重要な情報を提供する機能だ。
Googlebotはページのコンテンツを収集・解析するが、その際に参考データとしてメタデータを参照する。<META~>の中のkeywordや、今回のdescriptionsなどがGooglebotの参照する項目だ。
そのメタデータの中で「descriptions」は、ページの概略や要約などを記載する項目になる。検索エンジンによっては、この情報を検索結果の概要に表示する。
検索サイトのポリシー
殆どのインターネットユーザーは調べたいものがあると、検索サイトから該当キーワードを入力して調査を開始する。日本ではYahoo!もあるが、最大手はGoogleだろう。
サイト運営者としては、その最大手であるGoogleでの検索結果に表示される事を期待し、SEOと総称される手法・手段でより上位に表示されるように対策を講じる。
しかし、それら対策も行き過ぎると検索結果に悪影響を及ぼすことになる。検索サイト、特にGoogleはそれらの行き過ぎた行為(スパム)に対して非常に敏感で、スパムと判定した場合には容赦なくペナルティが課せられる。
具体的にどんな行為・手法がスパムと判断されるのか、キーワード関連でざっと思いつたものを列挙してみる。
- 無関係・無意味なキーワードの記載
- 過度のキーワードの詰め込み (1つのキーワードは全体の5%以内が目安)
- 表示されないキーワードの記載 (隠しキーワードなど)
- 無関係な文言でのリンク
このように、内容にそぐわない単語・文章などがキーワードスパムと判断される。検索サイトは検索結果の品質が最大の特徴となり、その品質を維持するためにはこれらの不正の排除は当然だろう。
当然ながらそれら不正・不当な行為をしているサイト/ページに対してはペナルティを課している。最大のペナルティが○○八分(Google八分など)と言われる、検索結果からの排除だろう。八分にされると該当サイトは全てのインデックスが削除され、サイト名などでも検索できなくなる。
そのほかにも検索結果の順位を大幅に下げられる(検索圏外になる場合も)などがある。結果として検索サイトからのアクセスは期待できなくなる。サイトをやってる方としては、かなりの痛手になる。
*Googleの言い分「キーワードの乱用」
http://www.google.com/support/webmasters/bin/answer.py?hl=jp&answer=66358
重複するメタデータとは
本来「descriptions」の項目にはページの概要や要約を記載するルールになっている。しかし複数ページで同じ文言を記載するのは、そのルールに則っていないことになる。よって、Googleからも、同じキーワード・フレーズによるキーワードスパムと判断されたというわけだ。SEOのつもりでやっても、実際は間違ったSEOを行っていることになる。知らなかったとは言え反省してる…。
原因と対策
原因:テンプレートの仕組み
なぜ全く同じフレーズが複数ページに記載されてしまうのか、原因はテンプレートにあった。
忍者ブログの私の使ったテンプレートは設定の「ユーザー情報」→「ブログの説明」の項目が、そのまま各ページの概要(METAのdescriptionsの項目)として表示されるようになっていた。忍者ブログや同等のサービスを提供しているブログは、その仕組み(独自システムの仕様)から同じような結果になっているブログも多いようだ。
調べてみると、同じようなテンプレートが原因でスパム判定されているブログも多かった。
対策:テンプレート改造
同じような問題が発生しているページを調べていると、対策も色々と紹介されていた。
そのなかで、私の選んだ対策は非常に単純なものだ。「descriptions」のデータにページのタイトルを追加する、これで似たような説明だが完全に同じではない、という内容になる。実際にはページタイトルではなく記事・カテゴリなどの名称を充てている。(参考にした情報では、この程度で効果があるらしい)
実際のカスタマイズを次に示す。忍者ブログ独自の手法だが、他のブログでも該当箇所を自分のブログの機能と読み替えれば応用できると思う。やっていることは非常に単純で一箇所書き換えるだけで済んでしまう。
しかし、多少はプログラムやスクリプトの概念を理解していないと難しいかもしれない。とは言え、HTMLが分かる人なら「変数」「制御式」の2つを理解してしまえば、すぐに利用できると思う。
HTMLのヘッダーで<meta ~description~>が記載されている部分を変更
- 改造前の文 (ブログの説明文がそのまま表示される)
<meta name="description" content="<!--$g_explanation-->">
- 改造後の文 (ブログの説明文の前にページのタイトルを付加)
<meta name="description" content="<!--if_not_toppage--><!--$g_page_title--> : <!--/if_not_toppage--><!--$g_explanation-->">
構文説明
- <!--if_not_toppage--> トップページでなければ、以降を表示。
- <!--/if_not_toppage--> トップページでなければ、ここまでを表示。
- <!--$g_page_title--> ここにページのタイトルを表示
- <!--$g_explanation--> ここに「ブログの説明」を表示。
上記の文が実際に表示された時には次のような表示になる。
- トップページの場合
<meta name="description" content="ブログの説明">
- トップページ以外の場合
<meta name="description" content="ページタイトル:ブログの説明">
調べてないのでわからないが「SEO対策済みテンプレート」などと明記されているテンプレートなどは、この部分の対策が済んでいるのかもしれない。興味のある方は調べてみて欲しい。
以上、簡単なことをダラダラと書いてしまった。
分からないことがあれば、気軽にコメント欄から質問を下さい。訂正情報もお待ちしております。
関連記事:
PR