架构师_程序员_码农网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 7482|回复: 0

[建站知识] 如何屏蔽搜索引擎抓取网站页面?

[复制链接]
发表于 2016-1-13 10:16:38 | 显示全部楼层 |阅读模式

作网站运营尤其是网站排名优化的时候,我们总想着如何来引导搜索引擎蜘蛛来爬行网页,收录。然而,很多时候一些网站因为所真对的用户群体和目标地区不同,并不希望获得搜索引擎的光顾,这个时候我们要如何来解决呢?今天和笔者小丹一起来研究一下吧!   

当我们看到要屏蔽抓取的时候,大多数SEOer想到的都是robots.txt文件。因为在我们的认知中,robot文件可以有效的杜姐搜索引擎抓取某些页面。但是要知道,虽然这个方式很不错,但是更多时候小丹认为它比较适合于在网站没有完成,为了避免之后的死链或者考察期而存在的。   

若单单为了屏蔽某个搜索引擎的抓取,我们大可不必为空间造成负累,只要使用一点简单的代码即可。例如,我们要屏蔽百度蜘蛛的抓取

即可。当然这仅仅是屏蔽百度抓取的方式,如果想要任何一个搜索引擎,只要将Baiduspider更换为改搜索引擎的蜘蛛即可。   

常见搜索引擎蜘蛛名称如下:   

1、baiduspider    百度的综合索引蜘蛛   

2、Googlebot     谷歌蜘蛛   

3、Googlebot-Image    专门用来抓取图片的蜘蛛      

4、Mediapartners-Google     广告联盟代码的蜘蛛   

5、Yahoo Slurp    雅虎蜘蛛   

6、Yahoo! Slup China     雅虎中国蜘蛛   

7、Yahoo!-AdCrawler     雅虎广告蜘蛛   

8、YodaoBot    网易蜘蛛   

9、Sosospider     腾讯SOSO综合蜘蛛   

10、sogou spider     搜狗综合蜘蛛   

11、MSNBot Live    综合蜘蛛   

但,如果你要屏蔽所有的搜索引擎,那么就要使用robot文件了:

到这里很多朋友获取应该明白了,在代码中禁止建立网页快照的命令是noarchive。所以,如果我们对于搜索引擎有限制,就根据自己的禁止快照对象,将代码加在网页的与直接即可;反之,在不要添加任何一条代码,就可以保证各大搜索引擎能够正常访问网站并且建立快照。     

(转载请注明转自:www.wangzhan.net.cn/news/n1913.htm,谢谢!珍惜别人的劳动成果,就是在尊重自己!)




上一篇:Linux常用chmod命令用法
下一篇:苹果ISO APP抓取HTTPS包
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

免责声明:
码农网所发布的一切软件、编程资料或者文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:help@itsvse.com

QQ|手机版|小黑屋|架构师 ( 鲁ICP备14021824号-2 )|网站地图

GMT+8, 2024-5-2 21:51

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表