架构师_程序员_码农网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

搜索
查看: 1620|回复: 3

[SEO] 谷歌蜘蛛(爬虫)Googlebot 服务器 IP 段

[复制链接]
发表于 2024-11-29 10:02:24 | 显示全部楼层 |阅读模式
需求:针对谷歌蜘蛛(爬虫)Googlebot 访问加入到白名单里面,不对该 IP 段进行限流。

查看 Google 搜索中心文档,可以查看抓取工具的 IP 地址段,Google 抓取工具分为三类:Googlebot、特殊情况下的抓取工具、用户触发的抓取器。

可以调用接口查询 IP 范围:

超链接登录可见。
超链接登录可见。
超链接登录可见。
超链接登录可见。

QQ截图20241129095900.jpg

使用 .NET/C# 程序进行抓取汇总,代码如下:

如下图:

QQ截图20241129100139.jpg

Googlebot:超链接登录可见。
验证 Googlebot 和其他 Google 抓取工具:超链接登录可见。





上一篇:在 JavaScript 校验字符串是否为IPv4或者IPv6
下一篇:【AWS】API Gateway 中 REST API 和 HTTP API 区别
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2024-11-29 10:16:33 | 显示全部楼层
Bingbot 必应蜘蛛(爬虫)IP 段:超链接登录可见。
参考:超链接登录可见。

码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2024-11-29 10:21:41 | 显示全部楼层
360蜘蛛IP:超链接登录可见。


180.153.232.0/24
180.153.234.0/24
180.153.236.0/24
180.163.220.0/24
42.236.101.0/24
42.236.102.0/24
42.236.103.0/24
42.236.10.0/24
42.236.12.0/24
42.236.13.0/24
42.236.14.0/24
42.236.15.0/24
42.236.16.0/24
42.236.17.0/24
42.236.46.0/24
42.236.48.0/24
42.236.49.0/24
42.236.50.0/24
42.236.51.0/24
42.236.52.0/24
42.236.53.0/24
42.236.54.0/24
42.236.55.0/24
42.236.99.0/24
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2024-11-29 10:24:05 | 显示全部楼层
搜索引擎爬虫:好机器人,坏机器人
蜘蛛机器人,又称网络蜘蛛或搜索引擎爬虫,是一种在互联网上自动执行重复任务的工具。它们会读取所抓取网页上的几乎所有内容。机器人收集的数据会以各种方式进行处理和利用,因此,机器人是一种双刃剑。它们可以带来极大的好处,增强互联网功能和业务运营,但也可能造成危害,带来安全风险和道德问题,具体取决于使用方式和目的。

众多网络爬虫和机器人,例如 Googlebot、Bingbot、百度机器人(Baiduspider)、Slurp 机器人(Yahoo 机器人)、Yandexbot、Sogou 机器人、Alexa 爬虫、DuckDuckBot、Slackbot、Facebook Bot、GPTBot 等,不断地搜索互联网。

防火墙中的白名单搜索引擎爬虫(机器人):超链接登录可见。
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

免责声明:
码农网所发布的一切软件、编程资料或者文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:help@itsvse.com

QQ|手机版|小黑屋|架构师 ( 鲁ICP备14021824号-2 )|网站地图

GMT+8, 2025-6-15 17:42

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表