成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

Python中scrapy下載保存圖片的示例

瀏覽:12日期:2022-06-14 17:27:01

在日常爬蟲練習中,我們爬取到的數據需要進行保存操作,在scrapy中我們可以使用ImagesPipeline這個類來進行相關操作,這個類是scrapy已經封裝好的了,我們直接拿來用即可。

Python中scrapy下載保存圖片的示例

在使用ImagesPipeline下載圖片數據時,我們需要對其中的三個管道類方法進行重寫,其中 — get_media_request 是對圖片地址發起請求

— file path 是返回圖片名稱

— item_completed 返回item,將其返回給下一個即將被執行的管道類

Python中scrapy下載保存圖片的示例

那具體代碼是什么樣的呢,首先我們需要在pipelines.py文件中,導入ImagesPipeline類,然后重寫上述所說的3個方法:

from scrapy.pipelines.images import ImagesPipelineimport scrapyimport os class ImgsPipLine(ImagesPipeline): def get_media_requests(self, item, info):yield scrapy.Request(url = item[’img_src’],meta={’item’:item}) #返回圖片名稱即可 def file_path(self, request, response=None, info=None):item = request.meta[’item’]print(’########’,item)filePath = item[’img_name’]return filePath def item_completed(self, results, item, info):return item

方法定義好后,我們需要在settings.py配置文件中進行設置,一個是指定圖片保存的位置IMAGES_STORE = ’D:ImgPro’,然后就是啟用“ImgsPipLine”管道,

ITEM_PIPELINES = { ’imgPro.pipelines.ImgsPipLine’: 300, #300代表優先級,數字越小優先級越高}

設置完成后,我們運行程序后就可以看到“D:ImgPro”下保存成功的圖片。

Python中scrapy下載保存圖片的示例

完整代碼如下:

spider文件代碼:

# -*- coding: utf-8 -*-import scrapyfrom imgPro.items import ImgproItem class ImgSpider(scrapy.Spider): name = ’img’ allowed_domains = [’www.521609.com’] start_urls = [’http://www.521609.com/daxuemeinv/’] def parse(self, response):#解析圖片地址和圖片名稱li_list = response.xpath(’//div[@class='index_img list_center']/ul/li’)for li in li_list: item = ImgproItem() item[’img_src’] = ’http://www.521609.com/’ + li.xpath(’./a[1]/img/@src’).extract_first() item[’img_name’] = li.xpath(’./a[1]/img/@alt’).extract_first() + ’.jpg’ # print(’***********’) # print(item) yield item

items.py文件

import scrapy class ImgproItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() img_src = scrapy.Field() img_name = scrapy.Field()

pipelines.py文件

from scrapy.pipelines.images import ImagesPipelineimport scrapyimport osfrom imgPro.settings import IMAGES_STORE as IMGS class ImgsPipLine(ImagesPipeline): def get_media_requests(self, item, info):yield scrapy.Request(url = item[’img_src’],meta={’item’:item}) #返回圖片名稱即可 def file_path(self, request, response=None, info=None):item = request.meta[’item’]print(’########’,item)filePath = item[’img_name’]return filePath def item_completed(self, results, item, info):return item

settings.py文件

import randomBOT_NAME = ’imgPro’ SPIDER_MODULES = [’imgPro.spiders’]NEWSPIDER_MODULE = ’imgPro.spiders’ IMAGES_STORE = ’D:ImgPro’ #文件保存路徑LOG_LEVEL = 'WARNING'ROBOTSTXT_OBEY = False#設置user-agentUSER_AGENTS_LIST = ['Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1','Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5','Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3','Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3','Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3','Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3','Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24','Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24' ]USER_AGENT = random.choice(USER_AGENTS_LIST)DEFAULT_REQUEST_HEADERS = { ’Accept’: ’text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8’, ’Accept-Language’: ’en’, # ’User-Agent’:'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36', ’User-Agent’:USER_AGENT} #啟動pipeline管道ITEM_PIPELINES = { ’imgPro.pipelines.ImgsPipLine’: 300,}

以上即是使用ImagesPipeline下載保存圖片的方法,今天突生一個疑惑,爬蟲爬的好,真的是牢飯吃的飽嗎?還請各位大佬解答!更多相關Python scrapy下載保存內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python scrapy
相關文章:
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
欧美人与性动xxxx| 这里只有精品视频在线观看| 欧美亚洲一区| 久久久www成人免费无遮挡大片| 麻豆高清免费国产一区| 亚洲一区国产一区| 亚洲婷婷国产精品电影人久久| 91麻豆蜜桃一区二区三区| 日韩欧美一级片| 奇米777欧美一区二区| 亚洲一区高清| 亚洲欧美日韩国产中文在线| 欧美福利一区| 欧美成人r级一区二区三区| 亚洲福利一二三区| 亚洲美女色禁图| 亚洲免费观看在线观看| 亚洲激情偷拍| 中文字幕一区二| 黄色亚洲免费| 国产精品热久久久久夜色精品三区 | 欧美a一区二区| 老司机午夜免费精品视频| 夜夜亚洲天天久久| 午夜亚洲视频| 天天亚洲美女在线视频| 一本大道久久a久久精品综合| 日韩激情在线观看| 欧美性生活久久| 久久99精品一区二区三区三区| 久久精品一区二区三区中文字幕| 亚洲午夜久久久久久久久电影院 | 国产一区二区三区免费观看| 777午夜精品视频在线播放| 国产一区免费电影| 日韩欧美国产综合| 91视频精品在这里| 中文字幕中文在线不卡住| 日韩视频精品| 日韩国产高清影视| 欧美精品久久99久久在免费线| 国产成人亚洲综合a∨猫咪| 欧美电影免费观看高清完整版在线 | 国产拍欧美日韩视频二区| 国产精品二区二区三区| 亚洲日本免费电影| 亚欧美中日韩视频| 精彩视频一区二区三区| 欧美一级日韩一级| 欧美久久电影| 亚洲美女偷拍久久| 久久久久久网| 国产一区欧美一区| 久久视频一区二区| 亚洲激情专区| 五月激情综合婷婷| 欧美日韩一区二区三区在线看| 国产黄色精品网站| 久久综合一区二区| 亚洲国产专区校园欧美| 日韩精品欧美精品| 日韩欧美一区中文| 黄色亚洲精品| 免费在线看成人av| 精品国产一区二区精华| 国产在线精品一区二区中文| 亚洲综合无码一区二区| 欧美私模裸体表演在线观看| 粉嫩高潮美女一区二区三区| 久久精品一区二区| 国产精品毛片在线| 狠狠狠色丁香婷婷综合激情 | 亚洲一区视频在线观看视频| 日本久久电影网| 成人福利电影精品一区二区在线观看| 亚洲欧洲av在线| 欧洲av一区二区嗯嗯嗯啊| 成人国产电影网| 一区二区三区在线高清| 欧美日韩卡一卡二| 欧美激情日韩| 香蕉影视欧美成人| 欧美一二三四区在线| 狠狠久久婷婷| 日韩av电影天堂| 久久久国产精品麻豆| 每日更新成人在线视频| 国产1区2区3区精品美女| 中文字幕佐山爱一区二区免费| 色94色欧美sute亚洲线路一ni | 久久久久国产精品午夜一区| 成人综合激情网| 一区二区三区.www| 精品国产伦理网| 久久午夜精品| 午夜久久一区| 日本不卡在线视频| 国产色婷婷亚洲99精品小说| 久久久久久自在自线| av亚洲精华国产精华精| 亚洲国产精品麻豆| 日韩欧美一二三| 国产精品有限公司| 成人av网站免费观看| 亚洲超丰满肉感bbw| 久久综合九色综合97婷婷| 久久婷婷一区| 欧美精品观看| 精品一二三四区| 亚洲精品久久7777| 日韩三区在线观看| 国产精品一区毛片| 欧美凹凸一区二区三区视频| 蜜桃av噜噜一区| 国产精品国产三级国产a| 777色狠狠一区二区三区| 一本色道久久99精品综合| 国产盗摄精品一区二区三区在线| 亚洲免费资源在线播放| 欧美r级电影在线观看| 久久香蕉精品| 精品96久久久久久中文字幕无| 国产精品一区二区无线| 一区av在线播放| 久久精品欧美日韩| 欧美日本在线播放| 国产精品久久国产愉拍| 91丨porny丨国产入口| 久久99精品一区二区三区| 亚洲精品亚洲人成人网在线播放| 精品国产乱码久久久久久老虎 | 亚洲成av人片在线观看| 国产精品久久网站| 日韩免费高清av| 色香色香欲天天天影视综合网| 亚洲人成久久| 欧美日本三区| jlzzjlzz亚洲日本少妇| 精品综合久久久久久8888| 亚洲五码中文字幕| 亚洲天堂精品视频| 欧美极品另类videosde| 日韩午夜在线观看视频| 欧美日韩精品一区视频| 久久国产欧美精品| 一本久道综合久久精品| 国语对白精品一区二区| eeuss鲁片一区二区三区在线观看 eeuss鲁片一区二区三区在线看 | 久久久久网站| 夜夜嗨一区二区三区| 欧美日韩精品不卡| 成人黄色片在线观看| 国产在线不卡一区| 青青草国产精品亚洲专区无| 亚洲午夜电影在线观看| 亚洲欧美日韩人成在线播放| 久久色中文字幕| 欧美成人性战久久| 欧美二区在线观看| 欧美系列在线观看| 老司机精品导航| 国产精品久久久久久久久久直播 | 日韩一区二区免费高清| 欧美日韩在线亚洲一区蜜芽| 色综合久久精品| 亚洲一区精彩视频| 国产女主播一区二区| 国产精品乱子乱xxxx| 国产视频欧美| 在线亚洲激情| 99亚洲一区二区| 一区二区三区四区五区精品| 91久久精品国产91久久性色tv| 欧美日韩福利| 欧美日韩国产色综合一二三四| 91亚洲资源网| 色综合久久中文字幕| 成人av在线影院| 99精品视频一区二区三区| 国产99久久精品| 成人在线视频一区二区| 国产成人午夜精品5599| 高清日韩电视剧大全免费| 东方欧美亚洲色图在线| 成人免费看视频| 91蜜桃视频在线| 欧美一区网站| 91视频在线观看| 欧美激情 亚洲a∨综合| 欧美三级网页| 一区精品久久| 国产欧美丝祙| 久久人人九九| 欧美日韩精品一区视频| 4hu四虎永久在线影院成人| 欧美一区二区黄| 2021久久国产精品不只是精品| 久久精品综合网| 自拍av一区二区三区| 亚洲大片一区二区三区|