文章詳情頁

python - Scrapy如何得到原始的start_url

瀏覽：148日期：2022-06-27 15:45:21

問題描述

Scrapy爬蟲時(shí)，由于重定向或是其他原因，會導(dǎo)致原始的start_url發(fā)生改變，怎樣才能得到原始的start_url?

def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse) def parse(self, response): item = YourItem() item[’start_url’] = 原始請求的start_url yield item

問題解答

回答1：

參考文章：Scrapy爬蟲常見問題總結(jié)

利用Request中的meta參數(shù)傳遞信息

def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse, meta={’start_url’:start_url}) def parse(self, response): item = YourItem() item[’start_url’] = response.meta[’start_url’] yield item

Python 編程

上一條：python - 使用TensorFlow創(chuàng)建邏輯回歸模型訓(xùn)練結(jié)果為nan下一條：正則表達(dá)式 - 在python中怎么匹配IP地址

相關(guān)文章：

1. Python處理Dict生成json2. sql語句 - 如何在mysql中批量添加用戶？3. python - 請問這兩個(gè)地方是為什么呢？4. 請教一個(gè)mysql去重取最新記錄5. 怎么php怎么通過數(shù)組顯示sql查詢結(jié)果呢，查詢結(jié)果有多條，如圖。6. mysql 非主鍵做范圍查找實(shí)現(xiàn)原理的一點(diǎn)困惑7. mysql 可以從 TCP 連接但是不能從 socket 鏈接8. java - jdbc如何返回自動(dòng)定義的bean9. 事務(wù) - mysql共享鎖lock in share mode的實(shí)際使用場景10. javascript - 按鈕鏈接到另一個(gè)網(wǎng)址怎么通過百度統(tǒng)計(jì)計(jì)算按鈕的點(diǎn)擊數(shù)量

排行榜

					
					javascript - VUE v-for多層嵌套循環(huán)怎么取父級的值啊
事務(wù) - mysql共享鎖lock in share mode的實(shí)際使用場景
java - tomcat一直在starting怎么破
javascript - 切換掉當(dāng)前頁面后該頁面的js動(dòng)畫會暫停？
sql語句 - 如何在mysql中批量添加用戶？
javascript - if(input.type==’text’&&type != ’text’){return false;}這是什么意思？
docker內(nèi)創(chuàng)建jenkins訪問另一個(gè)容器下的服務(wù)器問題
在mac下出現(xiàn)了兩個(gè)docker環(huán)境
javascript - 使用 vuex-router-sync寄存路由信息，this.$router params 不能賦值？
Android 關(guān)于圖片壓縮的問題。
javascript - 請問一下react-native 布局的時(shí)候，尺寸的大小是如何確定的呢？
				

熱門標(biāo)簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

python - Scrapy如何得到原始的start_url