麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 學院 > 開發設計 > 正文

實戰 使用scrapy 爬取代理 并保存到數據庫

2019-11-06 07:18:51
字體:
來源:轉載
供稿:網友

   爬取網站: www.PRoxy360.com

   爬取思路: 1.分析首頁,2 分析要爬取的目標 3,保存數據

   1 首先分析頁面

開始爬取

創建爬蟲項目

scrapy startproject daili

創建爬蟲

cd daili

scrapy genspider dd proxy360.cn

創建了一個名叫dd的爬蟲

在 items.py 下設置需要爬取的內容

這里爬取ipimport scrapyclass DailiItem(scrapy.Item):    # define the fields for your item here like:    # name = scrapy.Field()    ip =scrapy.Field()    pass然后進入爬蟲目錄在spiders下的 dd.py
# -*- coding: utf-8 -*-import scrapyfrom daili.items import DailiItem  #導入item.py定義的類名class DdSpider(scrapy.Spider):    name = "dd"    allowed_domains = ["www.proxy360.cn"]
    nations = ['Brazil','Chain','Japan','Vietanm'] #定義好要爬取的名字的后綴    start_urls = []    for nation in nations:  使用for 循環依次加載上        start_urls.append('http://www.proxy360.cn/Region/'+nation  )    def parse(self, response):    #找到要爬取div        sc = response.xpath('//div[@class="proxylistitem"]')        for sub in sc:              開始依次爬取            item = DailiItem()     #調用item定義的類名            item["ip"]= sub.xpath('.//span[1]/text()').extract()[0]            yield item            爬取的內容返回到pipelines。py里配置  setting.py
USER_AGENT = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
ITEM_PIPELINES = {    'daili.pipelines.DailiPipeline': 300,}進入到pipelines.py
import pyMySQL   # 使用pymysql 連接 如果沒有  使用pip install pymysql 下載class DailiPipeline(object):    def __init__(self):        self.conn = pymysql.connect(host="127.0.0.1",user ="root",passWord= "root",db="get")       連接數據庫  host 連接地址 user 賬號  password密碼     def process_item(self, item, spider):        try:            title = item["ip"] #獲取 從dd。py傳遞過來的 內容            sql ="insert into daili(ip) VALUES ('"+title+"')"  傳到數據庫            print sql            self.conn.query(sql)            return item        except Exception as e:            pass        def close_spider(self):            self.conn.close()  關閉數據庫連接


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 色就色 综合偷拍区91网 | 高清做爰免费无遮网站挡 | 精品亚洲夜色av98在线观看 | 午夜视频在线观看免费视频 | 欧美大电影免费观看 | 少妇激情视频 | 亚洲一区二区三区日本久久九 | 加勒比色综合 | 高清国产免费 | 国产精品久久久久久久不卡 | 欧美男女爱爱视频 | 免费观看视频网站 | 狠狠操视频网站 | 电影av在线 | 国产精品视频免费在线观看 | 久久久久免费精品国产小说色大师 | 国产va在线观看 | 全黄性性激高免费视频 | 超碰97人人艹 | 在线a亚洲视频播放在线观看 | 成年免费观看视频 | 久在线观看福利视频69 | 精品亚洲在线 | 欧洲黄视频 | 色综合欧美 | 国产伦久视频免费观看视频 | 黄色网战入口 | 久久精品国产亚洲7777小说 | 日本a∨精品中文字幕在线 被啪羞羞视频在线观看 | 中文字幕电影免费播放 | 视频一区二区三区在线播放 | 国产91极品 | 狠狠操夜夜爱 | 一区二区三区在线观看免费 | 黄色片在线观看网站 | 91 久久| 精品国产乱码久久久久久丨区2区 | 国产精品久久久久久一区二区三区 | 国产成人自拍av | 国产无遮挡一区二区三区毛片日本 | 亚洲精久久 |