ASP.NET网络爬虫

小小灰帽 · 发表于 2017-11-6 18:36:20

网络上很多爬虫都是用python写的，前段时间，也写了个aps.net的简单爬虫，可以爬取你想要爬的数据。现在很多网站都做了反爬的机制，这让爬虫抓取数据难度变得很大。大多数网站的反爬方式大概有几种：有加验证码的，记录IP地址，黑名单等，还有一些更高级的反爬手段。
这个爬虫也有做了一些应对反爬的措施，绕过验证码，使用代理等，下面贴上部分代码，和大家一起探讨学习，不对的地方请大家指正！
这个爬虫主要是针对某个网站进行爬取。
a无标题.png

输入网址后，可以根据网址将数据爬取回来，再通过XPath将数据进行筛选清洗，获得自己想要的数据

登录可见。

要绕过反爬，可以用代理IP去访问，可以在网上先下载或者抓取一份高匿IP，然后随机切换代理IP去抓取

登录可见。

上面这段代码是先判断切换的IP是否能访问
具体代码看源码吧，把源码提供出来！

源码下载

游客，如果您要查看本帖隐藏内容请回复

小小灰帽 · 发表于 2017-11-7 09:30:14

小渣渣发表于 2017-11-6 18:44
帮你整理了一下帖子内容

谢谢，刚想删除一条重复的呢！辛苦了！

18479403 · 发表于 2019-12-13 10:32:09

我想知道你写的那个存储过程是什么样的，老哥。

小渣渣 · 发表于 2017-11-6 18:44:57

帮你整理了一下帖子内容

lightweight · 发表于 2017-11-7 15:00:04

谢谢分享，来看看

dotnet_charlay · 发表于 2017-11-8 15:46:42

看看源码先

do827261756 · 发表于 2017-11-10 17:14:31

ASP.NET网络爬虫

小猴子哦 · 发表于 2017-12-8 22:15:43

学习学习

zherp · 发表于 2017-12-10 08:25:22

ASP.NET网络爬虫不错的思路!

cd37ycs · 发表于 2017-12-23 20:54:35

ASP.NET网络爬虫

调皮酉 · 发表于 2019-4-16 11:46:03

感谢分享，学习一下。

		自动登录	找回密码
密码			注册[Register]

[WinForm] ASP.NET网络爬虫

评分

相关帖子

浏览过的版块