ネットワーク情報のTake Five wwwサーバーでの注意点(1)
07 «  2008 / 08  » 09
 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
 コンピュータ、ネットワーク、ルーター、サーバー、ネットワークビジネス、OS ネットワーク情報に関するテーマを日記にしてます。                                                 
 2008/04/06 Sun 19:11:37  E d i t
ロボットというと機械のロボットを連想されるでしょうが、
全文検索型サーチエンジンのデータ収集ロボットです。

巡回するように依頼しなくても勝手にアクセス
しにきます。

ウェッブサーバー内に見ては困るような情報を
おいておいた場合には、ロボットに持っていかれる
ような場合があります。

User-Agent:*
Disallow:/

と記載したrobots.txtのファイルを\public_htmlの
ディレクトリに置けばロボットの検索は避けることが
できます。

またはMETAタグで、ロボット検索をいろいろ指示する
ことができます。

<HTML>
<HEAD><META NAME="robots" CONTENT="index,follow">
<META NAME="description" ページの説明文80字〜100字">
<META NAME="keywords" CONTENT="キーワード1,キーワード2,キーワード3">
<TITLE>ここにタイトル</TITLE>
</HEAD>
<BODY>

例1
<meta name="robots" content="index,follow">
ロボットが現在訪れているページをインデックスし
さらにそこにあるリンク先のページもインデックスする。
設定しない場合、この設定になります。

例2
<meta name="robots" content="noindex,follow">
ロボットが現在訪れているページをインデックスせずに
リンク先のページをインデックスする。

例3
<meta name="robots" content="index,nofollow">
ロボットが現在訪れているページのみをインデックスする。
リンクは追わない。

例4
<meta name="robots" content="noindex,nofollow">
ロボットが現在訪れているページもインデックスせずリンクも追わない。

その他下記ウェッブサイトでも詳しく記載されております。

http://dokodemo.rankuappu.com/syono5.html






未分類 |  0 trackback  |  -- comment  
トラックバック
この記事のトラックバックURL
http://finespot.blog99.fc2.com/tb.php/52-f601648b
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック