<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      分布式爬蟲

      分布式爬蟲介紹

      什么是分布式爬蟲?

      分布式爬蟲是將多臺電腦構建成一個機群,然后將爬蟲程序部署在機群內的每臺電腦上進行執行爬取任務,最終將所有的數據進行

      分布式爬蟲的作用

      提高爬取效率

      分布式爬蟲的簡單實現

      由于原生scrapy的五大組件的不能實現共享,數據無法整合,所以必須通過scrapy和scrapy_redis組件結合進行實現

      Scrapy_redis組件

      作用:

      給原生scrapy框架提供可以被共享的管道和調度器

      實現流程

      1、基于CrawlSpider創建一個項目:爬取陽光網信息

      2、修改爬蟲文件:

      • 導包  from scrapy_redis.spiders import RedisCrawlSpider ,讓爬蟲類繼承” RedisCrawlSpider“類
      • 注釋 allowed_ddomainx和 start_urls,添加新屬性: redis_key = "name" # name為被共享的調度器隊列的名稱 
      • 完成數據解析代碼編寫

      3、修改配置文件:settings.py

      • 設置管道類為可以被共享的管道,即scrapy_redis中的管道類  ITEM_PIPELINES = { 'scrapy_redis.pipelines.RedisPipeline':300 ,} 
      • 設置調度器:
      # 增加一個去重容器配置,作用:使用Redis的Set集合存儲請求的數據,從而實現去重數據的持久化
      DUPEFILTER_CALSS = "scrapy_redis.dupefilter.REPPDupeFilter"
      
      # 使用scrapy_redis的調度器
      SCHEDULER = "scrapy_redis.scheduler.Scheduler"
      # 配置調度器是否持久化,即爬蟲結束后,是否清除Redis中的請求隊列和去重指紋數據,為True時,表示不再對爬取過的數據進行爬取
      SCHEDULER_PERSIST = True

      4、配置redis的配置文件: redis.conf

      # 關閉ip訪問限制
      #bind 127.0.0.1 ::1
      
      # 關閉保護模式  yes:其他客戶端只能讀取不能寫入數據   no:可讀可寫
      protected-mode no

      5、啟動redis-server

      redis-server 配置文件

      scrapy_redis組件安裝 :   pip install scrapy_redis  

      由于我們需要使用scrapy_redis組件的實現共享管道和調度器,所以需要繼承scrapy_redis中的” RedisCrawlSpider“類

      from scrapy_redis.spiders import RedisCrawlSpider
      class FbsSpider(RedisCrawlSpider):
          pass

      將起始url和域名列表進行注釋,添加參數:

          # allowed_domains = ['www.xxx.com']
          # start_urls = ['http://www.xxx.com/']
          redis_key = "sun"  # sun為任意設置

       

      posted @ 2020-06-09 18:04  繁華無殤  閱讀(490)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 精品人妻码一区二区三区| 一区二区三区鲁丝不卡| 亚洲熟妇熟女久久精品一区| 亚洲综合精品第一页| 好硬好湿好爽好深视频| 激情内射亚洲一区二区三区| 亚洲精品一区二区三区蜜| 男人猛躁进女人免费播放| 日韩av裸体在线播放| 免费人成网站免费看视频| 免费一本色道久久一区| 四房播色综合久久婷婷| 亚洲中文字幕久久精品码| 久久久久人妻精品一区二区三区| 国产精品一区二区国产馆| 好男人好资源WWW社区| 久久www免费人成看片中文| 国产国产乱老熟女视频网站97 | 激情 自拍 另类 亚洲| 精品人妻一区二区| www欧美在线观看| 精品国产成人a在线观看| 青草视频在线观看视频| 北岛玲亚洲一区二区三区| 亚洲av成人无码精品电影在线| 高清破外女出血AV毛片| 无码国内精品久久人妻蜜桃| 99精品国产一区二区三区不卡| 久久午夜私人影院| 彭州市| 青青草国产自产一区二区| 最新av中文字幕无码专区| 麻豆成人av不卡一二三区| 国产专区一线二线三线码| 亚洲熟妇丰满多毛xxxx| 日韩乱码卡一卡2卡三卡四| 久久精品娱乐亚洲领先| AV喷水高潮喷水在线观看COM| 国产成人亚洲精品狼色在线| 丁香花成人电影| 久久精品亚洲精品国产区|