麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Python > 正文

python 爬蟲 批量獲取代理ip的實例代碼

2020-01-04 15:00:06
字體:
供稿:網(wǎng)友

實例如下所示:

import urllib.requestimport os, re,sys,timetry: from StringIO import StringIOexcept ImportError: from io import StringIOloca = re.compile(r"""ion":"/D+", "ti""")#偽裝成瀏覽器header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}class Getip(): def __init__(self,diqu):  self.ur ={"xicidaili國內(nèi)普通代理 --1線":"http://www.xicidaili.com/nt/",            "ip84國內(nèi)普通代理 --2線":'http://www.ip84.com/dlpn-http/',            'xicidaili國內(nèi)高匿名代理 --1線':'http://www.xicidaili.com/nn/',           'ip84國內(nèi)高匿名代理 --2線':'http://www.ip84.com/dlgn-http/',        'xicidaili國外高匿名代理 --1線':'http://www.xicidaili.com/wn/',        'ip84國外高匿名代理 --2線':'http://www.ip84.com/gwgn-http/',    'xicidaili國外普通代理 --1線':'http://www.xicidaili.com/wt/',    'haodailiip國內(nèi)混合代理 --3線':'http://www.haodailiip.com/guonei/',    'haodailiip國外混合代理 --3線':'http://www.haodailiip.com/guoji/',        }  self.diqu = diqu  def urlopen(self,url):  global header  try:   req = urllib.request.Request(url, None, header)   res=urllib.request.urlopen(req)     return res  except:   pass def getip(self,ren):  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP頁面  ip_proxy_re = re.compile(r"""/d{1,3}/./d{1,3}/./d{1,3}/./d{1,3}:/d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''    url = self.ur[self.diqu]+str(ren)    ip_proxy_re = re.compile(r'(/d{1,3}/./d{1,3}/./d{1,3}/./d{1,3})/s*</td>/s*<td>/s*(/d{1,})/s*</td>/s*<[^/u4E00-/u9FA5]+>([/u4E00-/u9FA5]*/s*[/u4E00-/u9FA5]*/s*[/u4E00-/u9FA5]*)/s*<')  #################################通用正則匹配的  格式 是  (IP,端口,地區(qū)) 地區(qū)有可能包含換行和空格  try:   data = self.urlopen(url).read().decode('utf-8')  except:   return None    self.rel = []    ip = ip_proxy_re.findall(data)  ##########返回的IP 就是 正則匹配的結(jié)果(IP,端口,地區(qū)) 地區(qū)有可能包含換行和空格    return ip  if __name__ == '__main__': g=Getip("xicidaili國內(nèi)普通代理 --1線") import pprint for x in range(4):  ips = g.getip(1)  print('獲取到ip地址一共:',len(ips))  pprint.pprint(ips)

以上這篇python 爬蟲 批量獲取代理ip的實例代碼就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持VEVB武林網(wǎng)。


注:相關(guān)教程知識閱讀請移步到python教程頻道。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 免费a级黄色毛片 | 美女在线视频一区二区 | 欧美日韩国产成人在线观看 | 美女黄影院| 国产美女视频一区 | 国产精品视频二区不卡 | 日韩视频一区二区在线观看 | 高清av免费| 欧美成年性h版影视中文字幕 | 国产精品久久久久久久久久久久午夜 | japanesexxxx24videofree| 国产一区二区不卡 | 性爱免费在线视频 | 欧美a视频在线观看 | 国产午夜精品一区二区三区四区 | 高颜值美女啪啪 | 亚洲成人免费电影 | 国产一级性生活视频 | 中国7777高潮网站 | 欧美成人精品 | 成人一级在线 | 看毛片电影 | 羞羞视频在线免费 | 99国产精品欲a| 视频一区二区精品 | 亚洲视频网 | av在线官网 | 午夜爽爽爽男女免费观看hd | 国产噜噜噜噜久久久久久久久 | 亚洲一区成人在线 | 欧美日韩成人一区二区 | 毛片区 | av免费提供 | www国产成人免费观看视频 | 色诱亚洲精品久久久久久 | xnxx 美女19| 欧美一区二区三区免费不卡 | 日韩黄色免费观看 | 日韩精品网站在线观看 | 真人一级毛片免费 | 国产在线欧美日韩 |