网趣商城

>-- 开店经验 > --

论robots协议使用方法和重要性

分类

搜索推广 ( 913 )

开店经验 ( 806 )

知识库 ( 436 )

软件教程 ( 413 )

购物系统相关

Shop7z终极版限时特惠进行中...

如何选择我需要的版本

购买正式版与使用免费版的区别

特惠云主机优惠促销中...

常见问题

开店经验

论robots协议使用方法和重要性

来源：本站类别：开店经验日期： 2015/10/4

　　很多站长最头疼的一个问题就是，搜索引擎蜘蛛为什么不光顾自己的网站，或者光顾频率比较低。这样对网站收录的影响是比较大的，直接影响到网站的排名。

　　先谈一下搜索引擎蜘蛛的工作原理吧，蜘蛛又称网络爬虫、网页蜘蛛、网络机器人，更生动的叫网页追逐者。一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。　　

　　网络爬虫

　　你知道万维网中有多少蜘蛛吗?下面介绍一下全球知名的蜘蛛,NO1:谷歌蜘蛛：google 谷歌蜘蛛最新名称为“compatible; Googlebot/2.1;” “Googlebot-Mobile”，看名字是抓取wap内容的:，全球最大的搜索引擎公司。NO2：百度蜘蛛：Baiduspider 常见百度旗下同类型蜘蛛还有下面这些Baiduspider-mobile(wap引擎)、Baiduspider-image(搜图引擎 )、Baiduspider-video(视频引擎)Baiduspider-news(新闻引擎),中文搜索引擎最强的公司。NO3：360蜘蛛：360Spider。NO4:SOSO蜘蛛,NO4:Sosospider 雅虎蜘蛛,NO:5“Yahoo! Slurp China”或者Yahoo!NO6: 有道蜘蛛：YoudaoBot，YodaoBot,NO7: 搜狗蜘蛛：Sogou News Spider，这些是全球最出名的蜘蛛，其实还有好多我就不一一列举了。

　　蜘蛛特点就是通过结网来捕获猎物，所以我们的网站就跟猎物一样等蜘蛛来捕获，如果网站内容新颖独特，更新内容频率高蜘蛛就会经常光顾你的网站。但是也不能让蜘蛛随便抓取，比如后台地址，所以就有了robots这个协议，这个很重要如果robots.txt协议写的好可以事半功倍。下面介绍一下robots.txt协议怎么写可以迎合蜘蛛的口味：

　　User-agent: *

　　开头字母必须是大写的，后面加英文形式下的冒号，然后后面是空格。

　　*表示通配符号。这里指通配所有的搜索引擎。

　　Disallow: / 表示禁止搜索引擎爬取所有页面，/表示目录。

　　Disallow: 表示不禁止

　　Disallow: /admin/禁止爬取admin后台目录。

　　Disallow: /admin 禁止抓取包含admin的路径后面不带/表示只要路径中包含admin蜘蛛就不会抓取。

　　Allow: 表示允许

　　Allow: /admin/s3.html 允许抓取admin目录下的s3.html 这个文件。

　　Disallow: /.css$ 表示以.css结尾的文件都不允许抓取，带上$表示特定的文件。

　　3.robots.txt协议写法注意点

　　注意：