百度robots文件使用说明

2020-08-08 淮安装修公司

robots文件存在于站根目录,是用来告诉百度蜘蛛那些应该抓取,那些不应该抓取。正确使用robots文件有助于做好seo优化,robots文件的核心词汇就是allow和disallow用法。百度官是认可这个文件的,在百度站长平台上也有robots这个栏目,点击进入,就可以看到你站robots文件是否编写正确了。

百度robots文件使用说明

1、t可以告诉百度您站的那些页面可以被抓取,那些页面不可以被抓取。

2、您可以通过Robots工具来创建、校验、更新您的t文件,或查看您站t文件在百度生效的情况。

3、Robots工具暂不支持s站点。

4、Robots工具目前支持48k的文件内容检测,请保证您的t文件不要过大,目录最长不超过250个字符。

上图我给的一个例子中,disallow语句有问题,原因是把英文的冒号写成了中文的冒号。

当然直接输入站根目录加上t文件也可以

User-agent:* 是用来置顶那些搜索引擎蜘蛛可以抓取的,一般默认设置

Disallow:/category/*/page/ 分类目录下面翻页后的链接,比如,进入校赚分类目录 推广运营经验目录后,在翻页一次,就成了 stcash./category/tuiguangyunying/page/2形式了

Disallow:/?s=* Disallow:/*/?s=*搜索结果页面和分类目录搜索结果页面,这里没必要再次抓取。

Disallow:/wp-admin/ Disallow:/wp-content/ Disallow:/wp-includes/ 这三个目录是系统目录,一般都是屏蔽蜘蛛抓取

Disallow:/*/trackback  trackback的链接

Disallow:/feed Disallow:/*/feed Disallow:/ments/feed订阅链接

Disallow:/?p=* 文章短链接,会自动301跳转到长连接

例如,朱海涛博客之前就被收录过短连接

Disallow:/*/ment-page-* Disallow:/*?replyto* 这两个我在之前文章有过说明,来自于评论链接,很容易造成重复收录。

在t文件的最后还可以制定sitemap文件 Sitemap:://***./t

sitemap地址指令,主流是txt和xml格式。在这里分享一段张戈所写txt格式的simemap文件。

将上述代码保存到txt文件,上传到根目录,并且在t文件中指定即可

这里给大家共享下我的t文件

User-agent: *

Disallow:/wp-admin/

Disallow: /*/ment-page-*

Disallow: /*?replyto*

Disallow: /wp-content/

Disallow: /wp-includes/

Disallow: /category/*/page/

Disallow: /*/trackback

Disallow: /feed

Disallow: /*/feed

Disallow: /ments/feed

Disallow: /?s=*

Disallow: /*/?s=*\

Disallow: /attachment/

Disallow: /tag/*/page/

Sitemap: ://.stcash./l

来源:校赚朱海涛(:)原创文章如转载,请注明本文链接: ://.stcash./5564

南宁哪里有白癜风医院
小孩脾胃虚弱怎么办
商洛什么医院治疗白癜风
为你推荐