SEO対策最初の設定

SEO対策最初の設定 - robots.txt

- 2月 26, 2019

SEO対策最初の設定 - robots.txt

robots.txt とは

クローラーと呼ばれる、サイトの巡回してインデックス登録してくれる機能に対して、クロールされるサイトの巡回して良い場所、ダメな場所等を通知してあげる為の設定みたいなもの。

　要約すると：検索エンジンに載せて良いサイト、載せてはいけないサイトを定義する事。

　※クローラーによっては、これを無視してクロール、インデックス登録してくるものもあるので注意が必要

一番最初にする設定

User-agent: *
Disallow:

User-agentは対象とするクローラの事。
例えば日本だと、Google、Bingが有名。

Disallowは、サイトのディレクトリ（URL)を指定します。

例

User-agent: *

Disallow:/example/

こうすると、http://anysite というサイトがあったとして・・・

User-agent:* 　　　　全てのクローラーは
Disallow:/example/ http://anysite/example へのアクセスは許可しない

というような解釈となる。
（逆に言うと、http://anysite/exmaple 以外は全てインデックスして良い　となる）

が、行儀の良いクローラーには有効だけれども、行儀の悪いクローラーはそもそもrobots.txtの定義など関係なくスクレイピングして、インデックス登録するものもあるので、SEO対策的な意味で使うのが良い。

少し、スクレイピングについて書いたけれど、そもそも昨今、違法コピーが横行して、サイトにサイトにバンバン上がっているコンテンツは、この悪意を持ったスクレいピンによるものが多い。

実際、無法にスクレイピングするサイトには意味が無いのだけれども、意思表示的な設定はあるので、機会があれば、そっちも取り上げたいと思う。

このブログの人気の投稿

データスパイダーで気軽に配列通しのマッチングを行う方法 DataSpiderで配列のようなマッチングを気軽に行う方法 Excelで、店マスターや、商品マスターシートのような物があって、データにある商品コードや、店コード等から、商品名や、店名を取得したい事がある場合、DataSpiderでFor分を使ってマッチングをさせると、とてつもなく処理に長い時間がかかってしまう。直ぐに思いつくのが、配列変数のようなものに値を一度セットしてしまい、処理を高速にしたいと思いがちだが..... DataSpiderの変数には、配列変数というような物が無い為、配列のような物に値を保持したいと思うと、標準の機能だと、下記のようになる。 DataSpiderで、配列チックな変数に値を保持したいと思うと、変数を必要分だけ複数用意して、変数代入コンポーネント内で、値をセットするような事になる。でも、この方法だと、保持が必要なデータの数が確定していないと、必要な数の変数が特定出来ないし、そもそも、変数を沢山準備するだけでも大変だ。この方法で、変数に値を設定し、配列通しで値をマッチングするような事をしようとすると、とても途方もない作業になるし、データスパイダーは、For-Loopを使用してIF分で、変数代入や、マッピングコンポーネントを切り替えるみたいにすると、とても処理が遅くなってしまう為、データ量が多いときは実用的で無くなり、とても大変だ。そのような場合、次に紹介する方法を使用すると、高速且つ、変数の数を気にせずに、配列通しのマッチングが可能だ。配列に格納したようなマッチングを高速に行いたい場合のデザイン方法データ上の商品コードなどを高速に置換する方法は、ForコンポーネントとIFコンポーネントを組み合わせて使用するのではなく、マッパー（Mapping）コンポーネント内で、CSVファイルによる置換コンポーネントを使用すれば良い。この方法だと、DataSpiderでは驚く程変換処理が早い。今回は、データスパイダーで、SQL等データベース上での容易なマッチングが行えない環境下で、高速にマッチング処理を行う方法についての紹介でした。

ファイナルアンラッキー

Translate