博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
通过爬虫快速获取可用代理IP
阅读量:5809 次
发布时间:2019-06-18

本文共 1670 字,大约阅读时间需要 5 分钟。

做安全测试时经常需要通过切换IP来探测或者绕过一些安全防护策略,有一些网站会提供免费或者付费的代理IP,而无论是免费还是付费的都不能完全保证代理服务器的可用性,如果一个个手动尝试将会是一件很痛苦的事情。因此我们可以通过脚本,自动化地从这些网站上抓取代理IP并测试其可用性,最终过滤出一批可用的代理IP。

代码托管在

Introduction

Proxy Server Crawler is a tool used to crawl public proxy servers from proxy websites. When crawled a proxy server(ip::port::type), it will test the functionality of the server automatically.

Currently supported websites:

Currently supported testing(for http proxy)

  • ssl support

  • post support

  • speed (tested with 10 frequently used sites)

  • type(high/anonymous/transparent)

Requirements

  • Python >= 2.7

  • Scrapy 1.3.0 (not tested for lower version)

  • node (for some sites, you need node to bypass waf based on javascript)

Usage

cd proxy_server_crawlerscrapy crawl chunzhen

log

[ result] ip: 59.41.214.218  , port: 3128 , type: http, proxy server not alive or healthy.[ result] ip: 117.90.6.67    , port: 9000 , type: http, proxy server not alive or healthy.[ result] ip: 117.175.183.10 , port: 8123 , speed: 984 , type: high[ result] ip: 180.95.154.221 , port: 80   , type: http, proxy server not alive or healthy.[ result] ip: 110.73.0.206   , port: 8123 , type: http, proxy server not alive or healthy.[  proxy] ip: 124.88.67.54   , port: 80   , speed: 448 , type: high       , post: True , ssl: False[ result] ip: 117.90.2.149   , port: 9000 , type: http, proxy server not alive or healthy.[ result] ip: 115.212.165.170, port: 9000 , type: http, proxy server not alive or healthy.[  proxy] ip: 118.123.22.192 , port: 3128 , speed: 769 , type: high       , post: True , ssl: False[  proxy] ip: 117.175.183.10 , port: 8123 , speed: 908 , type: high       , post: True , ssl: True

License

The MIT License (MIT)

转载地址:http://wqjbx.baihongyu.com/

你可能感兴趣的文章
第六课:数据库的基本工具
查看>>
关于二叉树重构的思索
查看>>
$_SERVER['SCRIPT_FLENAME']与__FILE__
查看>>
skynet实践(8)-接入websocket
查看>>
系统版本判断
查看>>
My97DatePicker 日历插件
查看>>
0603 学术诚信与职业道德
查看>>
小点心家族第3位成员——楼层定位效果
查看>>
Knockout.Js官网学习(enable绑定、disable绑定)
查看>>
hive基本操作与应用
查看>>
excel快捷键设置
查看>>
poj3692
查看>>
python之信号量【Semaphore】
查看>>
html5纲要,细谈HTML 5新增的元素
查看>>
Android应用集成支付宝接口的简化
查看>>
[分享]Ubuntu12.04安装基础教程(图文)
查看>>
[Vim] 搜索模式(正则表达式)
查看>>
#HTTP协议学习# (二)基本认证
查看>>
Android开发之线性布局详解(布局权重)
查看>>
WCF
查看>>