文章詳情頁(yè)

Python urllib庫(kù)如何添加headers過(guò)程解析

瀏覽：7日期：2022-07-09 09:45:31

對(duì)于請(qǐng)求一些網(wǎng)站，我們需要加上請(qǐng)求頭才可以完成網(wǎng)頁(yè)的抓取，不然會(huì)得到一些錯(cuò)誤，無(wú)法返回抓取的網(wǎng)頁(yè)。下面，介紹兩種添加請(qǐng)求頭的方法。

方法一：借助build_opener和addheaders完成

import urllib.requesturl='http://www.meizitu.com'#注意：在urllib 中headers是元組headers=('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE')opener=urllib.request.build_opener()opener.addheaders=[headers]data=opener.open(url)print(data.read())

注意：此處的headers要寫為一個(gè)元組類型才可以。寫為字典類型的話會(huì)報(bào)錯(cuò)！

方法二、創(chuàng)建一個(gè)Request實(shí)例對(duì)象

# 案例1import urllib.requesturl='http://www.meizitu.com'#注意：在urllib 中這種的headers 是需要是字典的headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE'}req=urllib.request.Request(url=url,headers=headers)file=urllib.request.urlopen(req)#出現(xiàn)有些解碼錯(cuò)誤的話，加上“ignore”就可以啦print(file.read().decode('utf-8',’ignore’))

注意：此處的headers要寫為一個(gè)字典類型才可以。

創(chuàng)建一個(gè)Reques對(duì)象，把需要的headers,url，proxy 都放進(jìn)去，或者在post 請(qǐng)求中還可以把編碼過(guò)后的data 值放進(jìn)去，再用urlopen 打開，就比較方便了。

另外，這種方法還可以用add_headers（）來(lái)添加headers，代碼如下：

import urllib.requesttry: url='http://www.meizitu.com' req=urllib.request.Request(url=url) req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE') file=urllib.request.urlopen(req,timeout=10.1) print(file.read().decode('utf-8',’ignore’))except Exception as e: print('時(shí)間超時(shí)',str(e))

總結(jié)：通過(guò)以上兩種方法，可以完成請(qǐng)求頭的相關(guān)參數(shù)設(shè)置，但是得注意headers是用字典類型來(lái)傳入還是元組類型。

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：Python threading模塊condition原理及運(yùn)行流程詳解下一條：Python collections.deque雙邊隊(duì)列原理詳解

相關(guān)文章：

1. ASP基礎(chǔ)入門第四篇(腳本變量、函數(shù)、過(guò)程和條件語(yǔ)句)2. HTML5實(shí)戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)3. jsp 實(shí)現(xiàn)的簡(jiǎn)易mvc模式示例4. jscript與vbscript 操作XML元素屬性的代碼5. JSP開發(fā)之hibernate之單向多對(duì)一關(guān)聯(lián)的實(shí)例6. 基于PHP做個(gè)圖片防盜鏈7. XML在語(yǔ)音合成中的應(yīng)用8. Jsp servlet驗(yàn)證碼工具類分享9. ASP將數(shù)字轉(zhuǎn)中文數(shù)字(大寫金額)的函數(shù)10. php使用正則驗(yàn)證密碼字段的復(fù)雜強(qiáng)度原理詳細(xì)講解原創(chuàng)

排行榜

					
					ASP.NET MVC實(shí)現(xiàn)橫向展示購(gòu)物車
Java 泛型全解析
Python和Selenium-未知錯(cuò)誤：在點(diǎn)（663，469）元素不可單擊其他元素將獲得點(diǎn)擊：
java字符串格式化輸出實(shí)例講解
Python 如何將integer轉(zhuǎn)化為羅馬數(shù)(3999以內(nèi))
AUC計(jì)算方法與Python實(shí)現(xiàn)代碼
Python post請(qǐng)求實(shí)現(xiàn)代碼實(shí)例
Java SiteMesh新手學(xué)習(xí)教程代碼案例
python讀取文件指定行內(nèi)容實(shí)例講解
Python自動(dòng)創(chuàng)建Excel并獲取內(nèi)容
基于Python爬取素材網(wǎng)站音頻文件