文章詳情頁

python - scrapy爬蟲不能循環(huán)運(yùn)行？

瀏覽：99日期：2022-07-28 11:08:58

問題描述

scrapy只能爬取一個(gè)頁面上的鏈接，不能持續(xù)運(yùn)行爬完全站，以下是代碼，初學(xué)求指導(dǎo)。

class DbbookSpider(scrapy.Spider): name = 'imufe' allowed_domains = [’http://www.imufe.edu.cn/’] start_urls=(’http://www.imufe.edu.cn/main/dtxw/201704/t20170414_127035.html’) def parse(self, response):item = DoubanbookItem()selector = scrapy.Selector(response)print(selector)books = selector.xpath(’//a/@href’).extract()link=[]for each in books: each=urljoin(response.url,each) link.append(each)for each in link: item[’link’] = each yield itemi = random.randint(0,len(link)-1)nextPage = link[i]yield scrapy.http.Request(nextPage,callback=self.parse)

問題解答

回答1：

是不是爬得太快讓封了

Python 編程

上一條：mysql - Python創(chuàng)建相同結(jié)構(gòu)的多個(gè)數(shù)據(jù)庫表，表名是循環(huán)添加的。下一條：module - python模塊from import語句相對導(dǎo)入，加不加點(diǎn)號有什么區(qū)別？

相關(guān)文章：

1. 在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實(shí)現(xiàn)存在即更新應(yīng)該使用哪個(gè)標(biāo)簽?2. mysql - 怎么生成這個(gè)sql表？3. mysql儲(chǔ)存json錯(cuò)誤4. 哭遼求大佬解答控制器的join方法怎么轉(zhuǎn)模型方法5. mysql - 表名稱前綴到底有啥用？6. Navicat for mysql 中以json格式儲(chǔ)存的數(shù)據(jù)存在大量反斜杠，如何去除？7. 編輯成功不顯示彈窗8. 怎么php怎么通過數(shù)組顯示sql查詢結(jié)果呢，查詢結(jié)果有多條，如圖。9. mysql - 數(shù)據(jù)庫表中，兩個(gè)表互為外鍵參考如何解決10. sql語句 - 如何在mysql中批量添加用戶？

排行榜

					
					angular.js - angular TypeError: Cannot read property ’id’ of undefined？
javascript - 求助：vue2.0中使用element ui遇到的問題
mysql - sysbench cpu測試的結(jié)果看不懂，求解
angular.js - 使用angularjs的路由調(diào)用界面，從controller上可以調(diào)用，但是頁面上獲取不到數(shù)據(jù)。
javascript - canvas toDataURL()跨域問題
在MySQL中，執(zhí)行了DELIMITER // 這個(gè)語句后分號還有什么作用？
javascript - 切換掉當(dāng)前頁面后該頁面的js動(dòng)畫會(huì)暫停？
sql語句 - 如何在mysql中批量添加用戶？
javascript - gif動(dòng)圖導(dǎo)致頁面閃爍的問題
mac OSX10.12.4 (16E195)下Mysql 5.7.18找不到配置文件my.cnf
在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實(shí)現(xiàn)存在即更新應(yīng)該使用哪個(gè)標(biāo)簽?
				

熱門標(biāo)簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

python - scrapy爬蟲不能循環(huán)運(yùn)行？