前回の導入部では書き忘れていた「
Sitemap」ファイルについて。
sitemapファイルとは検索エンジン・その他のボットなどが理解できるサイト構造が記述されたファイル。
今回はそのサイトマップの書式や作成方法を紹介したいと思います。
まず、書式は
Sitemaps.org で公開されている「
sitemapプロトコル 」に則るのがベスト。
これは、いわゆる「XML形式のサイトマップ」というものになる。
XML自体は、HTMLやCSSなどの他のマークアップ言語や各種スクリプト言語を扱ったことがある人なら簡単に理解できる形式になっている。基本的に「情報を設定」して、その情報の「属性(種類)を指定」していくだけである(形式は逆だが)。マークアップランゲージの中では簡単な部類に入るので、意欲のある方は自作やツール作成にチャレンジしてみては如何だろうか。
また、XML形式サイトマップを簡単に作成してくれるツール/サービスもある。
サーバーにサイトマップファイルをアップロードできる場合は利用してみる価値はあると思う。
FC2 サイトマップ (FC2 SEO対策ツール)
サイトマッププラスドットコム
他にも探せば色々と出てくるので、お気に入りのツールを探してみて欲しい。
(残念ながら忍者ブログのブログはリンクを上手く扱ってくれない様で、自動作成ツールの利用は殆どできない)
検索サイトは他にもtxt(テキスト)形式やRSS・Atom形式のフィーダも読めたりする。
続いて、txtとフィーダの各形式の解説、とXMLサイトマップの簡単な書式解説。
RSS/Atomフィーダ形式
ファイルをアップロードできなかったり、XML形式のサイトマップが用意できない場合。ブログでRSSもしくはAtomのフィードを公開しているなら、それで代用できる。ただしフィーダを代用する場合は、フィーダに記載される記事数が問題になる場合がある。通常フィーダは最新記事5件や10件など、新しいものから一定数だけしか表示・伝達できない。検索ボットの訪問の間隔が長い場合、一日で数件の記事を書いたりすると読み損ねる記事が発生する場合がある。
通常はいずれのブログ記事もリンクが張られているので辿っていけるが、そう言われるとサイトマップを作成・登録する意味も無くなる気がする。
本来の意味でサイトマップを利用するなら、XML形式サイトマップを用意するか、下のtxt形式を用意して欲しい。フィーダを利用するのはあくまで代用できるだけ、と私は思っている。
テキスト形式 (txt形式)
txt形式の場合、各ページのURLを単純に並べて書くだけでいい。1行に1ページ(URL)で改行を入れて書いていく。非常に簡単に作れるので、XMLサイトマップなどを作るのが難しい場合は、簡単に作れるtxt形式を利用することもできる。
いずれの形式も上述のsitemaps.orzで仕様が制定・公開されているので参考にして欲しい。
*補足
XML形式サイトマップの簡単な書き方
宣言部分で、使用するXMLバージョンと文字セット・サイトマッププロトコルを宣言する。
本体部分で、各ページのURL・最終更新日時・更新頻度・重要度などを記述していく。
本体部分は、基本的に<loc>以外の情報は省略できる。省略された情報は自動で標準設定が使われる(ボット次第だが)。
<URL></URL>で囲まれた範囲が1つのURL(ページ)を記載する単位になる。1セットの<URL>に1つの<loc>が必須の項目となる。付加情報は<loc></loc>タグに続けて、指定したい情報のタグで括って記載する。
シンプルな構成
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> ← ここまで 2行が宣言部分
<url> ← ここから本体 - 1URLの記述開始
<loc>http://neet4u.blog.shinobi.jp/</loc> ← URLを指定
<priority>0.8</priority> ← 重要度の付加情報
</url> ← 1URLの記述終了
<url> ← 次のURLの記述開始 ~略
<loc>http://neet4u.blog.shinobi.jp/Entry/1/</loc>
</url>
</urlset> ← ここまでがXMLサイトマップですよ、の印
これを「sitemap.xml」の名称でアクセスできるように公開すれば、外部から利用できるようになる。
関連記事:
PR