成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術(shù)文章
文章詳情頁

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

瀏覽:2日期:2022-06-16 18:40:50
一、項(xiàng)目需求

爬取排行榜小說的作者,書名,分類以及完結(jié)或連載

二、項(xiàng)目分析

目標(biāo)url:“https://www.qidian.com/rank/hotsales?style=1&page=1”

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

通過控制臺(tái)搜索發(fā)現(xiàn)相應(yīng)信息均存在于html靜態(tài)網(wǎng)頁中,所以此次爬蟲難度較低。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

通過控制臺(tái)觀察發(fā)現(xiàn),需要的內(nèi)容都在一個(gè)個(gè)li列表中,每一個(gè)列表代表一本書的內(nèi)容。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

在li中找到所需的內(nèi)容

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

找到第兩頁的url“https://www.qidian.com/rank/hotsales?style=1&page=1”“https://www.qidian.com/rank/hotsales?style=1&page=2”對(duì)比找到頁數(shù)變化開始編寫scrapy程序。

三、程序編寫

創(chuàng)建項(xiàng)目太簡(jiǎn)單,不說了

1.編寫item(數(shù)據(jù)存儲(chǔ))

import scrapyclass QidianHotItem(scrapy.Item): name = scrapy.Field() #名稱 author = scrapy.Field() #作者 type = scrapy.Field() #類型 form= scrapy.Field() #是否完載

2.編寫spider(數(shù)據(jù)抓取(核心代碼))

#coding:utf-8from scrapy import Requestfrom scrapy.spiders import Spiderfrom ..items import QidianHotItem#導(dǎo)入下需要的庫class HotSalesSpider(Spider):#設(shè)置spider的類 name = 'hot' #爬蟲的名稱 qidian_header={'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'} #設(shè)置header current_page = 1 #爬蟲起始頁 def start_requests(self): #重寫第一次請(qǐng)求url='https://www.qidian.com/rank/hotsales?style=1&page=1'yield Request(url,headers=self.qidian_header,callback=self.hot_parse)#Request發(fā)起鏈接請(qǐng)求#url:目標(biāo)url#header:設(shè)置頭部(模擬瀏覽器)#callback:設(shè)置頁面抓起方式(空默認(rèn)為parse) def hot_parse(self, response):#數(shù)據(jù)解析#xpath定位list_selector=response.xpath('//div[@class=’book-mid-info’]')#獲取所有小說for one_selector in list_selector: #獲取小說信息 name=one_selector.xpath('h4/a/text()').extract()[0] #獲取作者 author=one_selector.xpath('p[1]/a[1]/text()').extract()[0] #獲取類型 type=one_selector.xpath('p[1]/a[2]/text()').extract()[0] # 獲取形式 form=one_selector.xpath('p[1]/span/text()').extract()[0] item = QidianHotItem() #生產(chǎn)存儲(chǔ)器,進(jìn)行信息存儲(chǔ) item[’name’] = name item[’author’] = author item[’type’] = type item[’form’] = form yield item #送出信息 # 獲取下一頁URL,并生成一個(gè)request請(qǐng)求 self.current_page += 1 if self.current_page <= 10:#爬取前10頁next_url = 'https://www.qidian.com/rank/hotsales?style=1&page='+str(self.current_page)yield Request(url=next_url,headers=self.qidian_header,callback=self.hot_parse) def css_parse(self,response):#css定位list_selector = response.css('[class=’book-mid-info’]')for one_selector in list_selector: # 獲取小說信息 name = one_selector.css('h4>a::text').extract()[0] # 獲取作者 author = one_selector.css('.author a::text').extract()[0] # 獲取類型 type = one_selector.css('.author a::text').extract()[1] # 獲取形式 form = one_selector.css('.author span::text').extract()[0] # 定義字典 item=QidianHotItem() item[’name’]=name item[’author’] = author item[’type’] = type item[’form’] = form yield item

3.start.py(代替命令行)

在爬蟲項(xiàng)目文件夾下創(chuàng)建start.py。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

from scrapy import cmdline#導(dǎo)入cmd命令窗口cmdline.execute('scrapy crawl hot -o hot.csv' .split())#運(yùn)行爬蟲并生產(chǎn)csv文件

出現(xiàn)類似的過程代表爬取成功。

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

hot.csv

Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單

總結(jié)

本次爬蟲內(nèi)容還是十分簡(jiǎn)單的因?yàn)橹挥昧藄pider和item,這幾乎是所有scrapy都必須調(diào)用的文件,后期還會(huì)有middlewarse.py,pipelines.py,setting.py需要編寫和配置,以及從javascript和json中提取數(shù)據(jù),難度較大。

到此這篇關(guān)于Python scrapy爬取起點(diǎn)中文網(wǎng)小說榜單的文章就介紹到這了,更多相關(guān)Python爬取起點(diǎn)中文網(wǎng)內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
欧美电影影音先锋| 亚洲国产日韩欧美| 在线观看视频免费一区二区三区| 日韩一区二区三区av| 欧美日韩成人在线| 蜜臀国产一区二区三区在线播放| 亚洲专区欧美专区| 亚洲综合成人在线视频| 欧美性色综合| 国产精品久久久久婷婷| 欧美精品首页| 中文字幕免费在线观看视频一区| 94-欧美-setu| 国产嫩草影院久久久久| 欧美不卡一卡二卡免费版| 久久精品一区二区三区不卡| 94-欧美-setu| 国产午夜精品久久久久久久| 99久久国产综合精品麻豆 | 精品福利av导航| a亚洲天堂av| 久久久久久久综合狠狠综合| 欧美成人一品| 国产精品久久久久久久浪潮网站| 激情视频一区二区| 亚洲免费观看高清完整版在线| 在线亚洲激情| 男人操女人的视频在线观看欧美| 欧美片在线播放| 成人激情免费视频| 久久精品在线免费观看| 伊人久久综合| 亚洲成a人片在线不卡一二三区| 久久综合久久久| 黑人精品欧美一区二区蜜桃| 欧美一区二区三区性视频| 成人免费av资源| 国产日韩v精品一区二区| 国内激情久久| 亚洲一区二区三区三| 色婷婷综合久久久中文一区二区| 精品一区二区三区蜜桃| 日韩欧美黄色影院| 欧美午夜一区| 亚洲高清视频在线| 欧美精品在线一区二区三区| a在线欧美一区| 日韩码欧中文字| 久久久久网站| 国产91丝袜在线18| 国产精品毛片高清在线完整版| 宅男噜噜噜66一区二区| 人人狠狠综合久久亚洲| 日韩精品一区二区在线观看| 狠狠入ady亚洲精品经典电影| 亚洲成在线观看| 91精品国产一区二区| 欧美先锋影音| 免费成人美女在线观看.| 欧美xxxx老人做受| 亚洲美女少妇无套啪啪呻吟| 精品一区二区三区av| 欧美激情一区在线观看| 久久久久在线| 97久久精品人人爽人人爽蜜臀| 亚洲精品中文在线影院| 51久久夜色精品国产麻豆| 91片在线免费观看| 亚洲欧美日韩在线不卡| 欧美美女网站色| 国产专区一区| 开心九九激情九九欧美日韩精美视频电影| 精品国产91亚洲一区二区三区婷婷| 亚洲精品自在在线观看| 国模一区二区三区白浆| 中文字幕在线视频一区| 欧美午夜精品一区| 欧美日韩国语| 久久精品99国产精品日本| 国产欧美日产一区| 日本乱人伦aⅴ精品| 午夜精品久久久久99热蜜桃导演| 亚洲国产va精品久久久不卡综合 | 亚洲视频导航| 国产福利91精品一区二区三区| 亚洲丝袜精品丝袜在线| 69堂亚洲精品首页| 99精品热6080yy久久| 国产美女精品人人做人人爽| 亚洲男女一区二区三区| 欧美一区二区三区在线电影| 一区二区三区av| 丁香婷婷综合激情五月色| 亚洲综合色在线| 日韩欧美区一区二| 国产精品视频| 99r国产精品| 蜜桃视频在线一区| 国产精品系列在线| 欧美一级片在线| 麻豆91精品| 欧美日韩伊人| 国产成人亚洲综合色影视| 亚洲国产精品久久不卡毛片 | 日韩一区二区三区四区五区六区| 99亚洲精品| 91在线小视频| 捆绑变态av一区二区三区| 亚洲精品中文字幕在线观看| 亚洲精品一区二区精华| 欧美系列一区二区| 亚洲精选一区| 99精品视频在线播放观看| 看片的网站亚洲| 一区二区三区精品在线观看| 国产亚洲自拍一区| 欧美一区午夜精品| 久久一区亚洲| 99热这里只有成人精品国产| 99精品一区二区三区| 精品一区二区三区的国产在线播放 | 亚洲自拍另类| 欧美日韩精品久久| 粉嫩高潮美女一区二区三区 | 国产精品毛片| 91捆绑美女网站| 国产剧情一区二区三区| 肉色丝袜一区二区| 亚洲乱码国产乱码精品精小说| 国产亚洲精久久久久久| 日韩一级欧美一级| 欧美视频在线一区二区三区| 先锋影音国产一区| 99精品国产福利在线观看免费 | 精品一区二区三区免费毛片爱| 亚洲国产中文字幕在线视频综合| 国产精品久久久久久久久快鸭| 精品va天堂亚洲国产| 欧美一卡在线观看| 欧美男女性生活在线直播观看| 蜜桃伊人久久| 国产精品美女| 在线一区视频| 日韩视频在线播放 | 亚洲免费在线| 亚洲精品色图| 国产一区二区三区自拍| 99视频在线精品| 高清成人在线观看| 国产精品白丝av| 精品一区二区三区在线播放| 日韩国产欧美视频| 天使萌一区二区三区免费观看| 一区二区三区四区蜜桃 | 亚洲在线视频一区| 亚洲午夜精品17c| 亚洲综合激情另类小说区| 亚洲精选视频在线| 亚洲欧美精品午睡沙发| 亚洲男同性恋视频| 亚洲欧美日韩国产成人精品影院| 中文字幕在线不卡视频| 国产精品盗摄一区二区三区| 国产精品视频免费| 国产精品久久久久天堂| 国产精品国产三级国产有无不卡| 亚洲国产高清aⅴ视频| 国产精品美女久久久久aⅴ| 国产精品久久久久久久久久久免费看 | 亚洲成人激情社区| 亚洲大片在线观看| 一区二区三区产品免费精品久久75| 亚洲视频免费看| 亚洲美女视频一区| 亚洲主播在线观看| 亚洲成a人在线观看| 日韩国产一二三区| 久久国产婷婷国产香蕉| 国产在线乱码一区二区三区| 国产精品1024久久| av激情成人网| 狠狠久久婷婷| 亚洲精品日本| 免费精品视频| 欧美综合欧美视频| 91精品国产综合久久久蜜臀粉嫩| 欧美精品日日鲁夜夜添| 日韩一本二本av| 国产午夜久久久久| 一色桃子久久精品亚洲| 亚洲三级在线观看| 亚洲午夜精品久久久久久久久| 香蕉久久夜色精品国产使用方法| 天堂在线一区二区| 久久成人羞羞网站| 懂色中文一区二区在线播放| 99精品在线观看视频| 国内外成人免费视频| 亚洲一区一卡| 欧美色老头old∨ideo|