久草在线高清视频_成人午夜毛片_美女毛片儿_国产精品v片在线观看不卡_成人一区久久_国产一精品久久99无吗一高潮

突破反爬蟲(chóng)的利器——開(kāi)源動(dòng)態(tài)ip池

突破反爬蟲(chóng)的常用方法是使用代理ip。對(duì)于初學(xué)者或個(gè)人來(lái)說(shuō),購(gòu)買(mǎi)一些代理ip的成本略高。因此,最近編寫(xiě)了一個(gè)開(kāi)源項(xiàng)目IPProxys,為個(gè)人提供代理IP。
 
IpProxys原理:通過(guò)抓取各大代理網(wǎng)站提供的免費(fèi)代理ip,進(jìn)行去重,驗(yàn)證ip的可用性,將有效IP存儲(chǔ)在sqlite中,為爬蟲(chóng)獲取IP提供HTTP接口。
 
IPProxys項(xiàng)目已經(jīng)上傳到github,鏈接是https://github.com/qiyeboy/IPProxys.以下是整個(gè)項(xiàng)目的描述。
 
Api包:主要實(shí)現(xiàn)http服務(wù)器,提供api接口(通過(guò)get請(qǐng)求返回json數(shù)據(jù))。
 
數(shù)據(jù)文件夾:主要指數(shù)據(jù)庫(kù)文件和qqwry.dat的存儲(chǔ)位置(可以查詢ip的地理位置)。
 
Db包:主要封裝一些數(shù)據(jù)庫(kù)操作。
 
蜘蛛包是爬蟲(chóng)的核心功能,在代理網(wǎng)站上抓取代理ip。
 
測(cè)試包:測(cè)試一些用例,不參與整個(gè)項(xiàng)目的運(yùn)行。
 
Util包:提供一些工具類(lèi)。其中ipAddress.py查詢IP的地理位置。
 
驗(yàn)證包:用于測(cè)試ip地址是否可用。
 
Config.py:主要是配置信息(包括配置ip地址的解析方法和數(shù)據(jù)庫(kù)的配置)。
 
整個(gè)項(xiàng)目代碼量很小,大家可以根據(jù)自己的需要進(jìn)行修改,也可以提出自己的想法和建議,幫助我完善這個(gè)項(xiàng)目。
 
如何使用IPProxys項(xiàng)目?
 
1.將項(xiàng)目目錄克隆到當(dāng)前文件夾。
 
$ git克隆
 
2.切換項(xiàng)目目錄。
 
$ cd IPProxys
 
3.運(yùn)行腳本。
 
python IPProxys.py
 
窗口運(yùn)行效果如下圖所示:
 
 
項(xiàng)目依賴關(guān)系:
 
需要安裝Sqlite數(shù)據(jù)庫(kù)。
 
安裝請(qǐng)求庫(kù):pip安裝請(qǐng)求。
 
install lxml:apt-get install python-lxml。
 
ipProxys運(yùn)行時(shí),外部爬蟲(chóng)如何獲取IP?
 
外部爬蟲(chóng)只需要向IPProxys所在主機(jī)的端口8000發(fā)送GET請(qǐng)求。獲取請(qǐng)求的參數(shù)
 
動(dòng)態(tài)IP模擬器
 
 
 
 
主站蜘蛛池模板: 色婷婷色综合 | 黄网站免费在线观看 | 99精品视频免费观看 | 免费看成人片 | 日韩成人精品视频 | 欧美色图首页 | 成人毛片免费播放 | 玖玖精品视频 | 国产二区精品在线观看 | 午夜免费网站 | 色免费在线 | 国产一区二区三区在线看 | 亚洲高清在线观看 | 亚洲国产成人精品女人久久久 | 成人精品网站在线观看 | 成人欧美一区二区三区在线观看 | 欧日韩在线 | 美女又黄又免费的视频 | www.色婷婷| 毛片大片 | 国产视频一区二区三区四区 | 亚洲三级免费电影 | 成人h视频在线观看 | 日韩一区二区成人 | 日韩av电影在线播放 | 美女成人网 | 一级特黄录像免费播放全99 | 日本在线小视频 | 中字一区| a免费在线观看 | 看全色黄大色黄大片男爽一次 | 亚洲国产精品视频 | 国产一区二区成人 | 日韩在线播放av | 亚洲精彩免费视频 | 九九国产 | 精品国产不卡一区二区三区 | 日韩h视频 | 91精品久久久久久久久99绯色 | 久久精品一级 | 国产第二页 |