成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

爬蟲圖片 - 請教各位:python爬蟲編碼問題,版本3.6,win10 64位下?

瀏覽:176日期:2022-07-14 15:35:50

問題描述

這是報錯信息:

Traceback (most recent call last): File 'D:pypic_downfrom2255ok.py', line 45, in <module> html = getHtml(url_all[i]) File 'D:pypic_downfrom2255ok.py', line 32, in getHtml html = response.read().decode()UnicodeDecodeError: ’utf-8’ codec can’t decode byte 0xb3 in position 184: invalid start byte

改了好多地方,主要可能是目標網站是gb2312編碼,這個程序在別的網站是可以正常下載圖片的,換上現在的網站就有問題還請各位多多指教,問題出在哪里?試了幾個方法都不行源碼如下:爬蟲圖片 - 請教各位:python爬蟲編碼問題,版本3.6,win10 64位下?

#coding=utf-8import urllib.requestfrom urllib.request import urlopen, urlretrieve import urllibimport urllib.parseimport reimport osfrom bs4 import BeautifulSoupurl_all =[’http://www.shop2255.com/showpro/2603.html’,’http://www.shop2255.com/showpro/1558.html’,’http://www.shop2255.com/showpro/1564.html’,’http://www.shop2255.com/showpro/2411.html’,’http://www.shop2255.com/showpro/2409.html’,’http://www.shop2255.com/showpro/1561.html’,’http://www.shop2255.com/showpro/2414.html’,’http://www.shop2255.com/showpro/2609.html’,’http://www.shop2255.com/showpro/2413.html’,’http://www.shop2255.com/showpro/2604.html’,’http://www.shop2255.com/showpro/2605.html’,’http://www.shop2255.com/showpro/2606.html’,’http://www.shop2255.com/showpro/2608.html’,’http://www.shop2255.com/showpro/2607.html’,’http://www.shop2255.com/showpro/2610.html’]def getHtml(url): response = urlopen(url) html = response.read().decode('gbk') return htmldef getImg(html): reg = ’src='http://www.piao2010.com/wenda/(.+?.jpg)'’ imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglistfor i in range(len(url_all)): html = getHtml(url_all[i]) list=getImg(html.decode()) x = 0 for imgurl in list:print(x)file_path = url_all[i](filepath,tempfilename) = os.path.split(file_path)(filename,extension) = os.path.splitext(tempfilename)if not os.path.exists(’d:%s’ % filename): os.mkdir(’d:%s’ % filename)# os.mkdir(’D:%s’ % filename2)local=r’D:%s%s.jpg’ % (filename,imgurl.splite('/')[-1])urllib.request.urlretrieve(imgurl,local)x+=1print('done')

問題解答

回答1:

# coding: utf-8import urllibimport requestsfrom pyquery import PyQuery as Qimport osbase_url = ’http://www.shop2255.com/’url_all =[’http://www.shop2255.com/showpro/2603.html’]for url in url_all: _, file_name = os.path.split(url) dir_name, _ = os.path.splitext(file_name) if not os.path.exists(dir_name):os.mkdir(dir_name) r = requests.get(url) for _ in Q(r.text).find(’img’):src = Q(_).attr(’src’)image_url = src if src.startswith(’http’) else os.path.join(base_url, src)_, image_name = os.path.split(image_url)image_path = os.path.join(dir_name, image_name)urllib.urlretrieve(image_url, image_path)回答2:

首先在你這個代碼里面 local=r’D:%s%s.jpg’ % (filename,imgurl.splite('/')[-1])中split寫成了splite.

還有 urllib.request.urlretrieve(imgurl,local)這個imgurl不是一個合法的 url,只是一個相對 url, 要改成絕對 url,需要加上 base_url = ’http://www.shop2255.com/’

還有生成的文件路徑好像也有問題.

# -*- coding: utf-8 -*-import urllib.requestfrom urllib.request import urlopen, urlretrieveimport urllibimport urllib.parseimport reimport osfrom bs4 import BeautifulSoupbase_url = ’http://www.shop2255.com/’url_all =[’http://www.shop2255.com/showpro/2603.html’,’http://www.shop2255.com/showpro/1558.html’,’http://www.shop2255.com/showpro/1564.html’,’http://www.shop2255.com/showpro/2411.html’,’http://www.shop2255.com/showpro/2409.html’,’http://www.shop2255.com/showpro/1561.html’,’http://www.shop2255.com/showpro/2414.html’,’http://www.shop2255.com/showpro/2609.html’,’http://www.shop2255.com/showpro/2413.html’,’http://www.shop2255.com/showpro/2604.html’,’http://www.shop2255.com/showpro/2605.html’,’http://www.shop2255.com/showpro/2606.html’,’http://www.shop2255.com/showpro/2608.html’,’http://www.shop2255.com/showpro/2607.html’,’http://www.shop2255.com/showpro/2610.html’]def getHtml(url): response = urlopen(url) # print(response.read()) html = response.read().decode('gbk') print(html) return htmldef getImg(html): reg = ’src='http://www.piao2010.com/wenda/(.+?.jpg)'’ imgre = re.compile(reg) imglist = re.findall(imgre, html) return imglistfor i in range(len(url_all)): html = getHtml(url_all[i]) # 注意: 我這里沒有你那個錯誤,我只需要改這個就行了 # list = getImg(html.decode()) list = getImg(html) # print(list) x = 0 for imgurl in list:print(x)file_path = url_all[i](filepath, tempfilename) = os.path.split(file_path)(filename, extension) = os.path.splitext(tempfilename)if not os.path.exists(’d:%s’ % filename): os.mkdir(’d:%s’ % filename)# os.mkdir(’D:%s’ % filename2)local = r’D:%s%s.jpg’ % (filename, imgurl.split('/')[-1])try: urllib.request.urlretrieve(base_url + imgurl, local)except: print('can’t retrieve the' + base_url + imgurl)x += 1print('done')

標簽: Windows系統 win10
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
欧美一级片在线| 亚洲综合精品四区| 伊人精品在线| 国产午夜亚洲精品不卡| 国产成人亚洲精品青草天美| 欧美性xxxxxxxx| 美女一区二区三区| 久久一区免费| 日韩精品电影在线观看| 男女精品网站| 亚洲不卡av一区二区三区| 国产一区二区三区的电影| 亚洲精品成人少妇| 亚洲一区在线直播| 亚洲二区在线观看| 久热精品在线| 日本成人在线视频网站| 老牛国产精品一区的观看方式| 亚洲国产一区二区在线播放| 亚洲少妇一区| 午夜日韩在线观看| 91电影在线观看| 精品一区二区免费| 日韩女优电影在线观看| 972aa.com艺术欧美| 国产欧美一区二区精品忘忧草| 欧美福利网址| 亚洲品质自拍视频网站| 国产视频一区免费看| 亚洲国产精品久久不卡毛片 | 亚洲欧洲精品天堂一级| 精品福利av| 亚洲一卡二卡三卡四卡无卡久久| 性娇小13――14欧美| 奇米影视一区二区三区| 精品视频一区二区不卡| 国产精品一区二区三区乱码 | 亚洲小少妇裸体bbw| 色噜噜狠狠色综合中国| 国产美女在线精品| 国产日韩综合av| 亚洲高清在线观看一区| 亚洲一区二区三区四区不卡| 久久精品一区二区国产| 精品写真视频在线观看| 精品久久久久香蕉网| 国产精品久久| 亚洲国产综合人成综合网站| 91国偷自产一区二区三区成为亚洲经典 | 国产精品网友自拍| 欧美成人嫩草网站| 亚洲免费三区一区二区| 久久一本综合频道| 成人午夜av电影| 国产精品无圣光一区二区| 国产欧美韩日| 国产一区二区伦理| 久久精品人人做| 一区二区精品国产| 久久国产精品一区二区| 欧美精品一区二区三区很污很色的| 懂色av一区二区三区蜜臀| 中文字幕乱码一区二区免费| 亚洲综合社区| 成人爽a毛片一区二区免费| 中文字幕一区二区三区视频| 欧美一级网站| 国产白丝网站精品污在线入口| 欧美高清在线视频| 色先锋资源久久综合| av网站一区二区三区| 亚洲狠狠丁香婷婷综合久久久| 欧美性受xxxx| 欧美久久影院| 日韩av网站在线观看| 欧美成人激情免费网| 亚洲人体一区| 国产老肥熟一区二区三区| 国产精品福利一区| 欧美剧情片在线观看| 国产精品99免费看| 秋霞电影网一区二区| 久久久久成人黄色影片| 亚洲一区二区三区高清不卡| 国产91清纯白嫩初高中在线观看| 亚洲欧美国产高清| 欧美精品1区2区| 亚洲激情在线| 粉嫩av一区二区三区在线播放| 亚洲激情校园春色| 欧美一区二区三区不卡| 99www免费人成精品| 国产99精品在线观看| 亚洲专区一二三| 精品国产乱码久久| 色先锋资源久久综合| 97久久超碰精品国产| 久久精品国产亚洲高清剧情介绍| 国产精品看片你懂得| 欧美精品乱码久久久久久按摩| 好吊色欧美一区二区三区四区| 久久99这里只有精品| 亚洲少妇中出一区| 欧美变态tickling挠脚心| 久久久久在线| 欧美日韩亚洲一区| 国产在线看一区| 一区二区久久久久| 久久视频一区二区| 在线一区二区三区做爰视频网站| 国产一在线精品一区在线观看| 麻豆国产一区二区| 亚洲乱码国产乱码精品精的特点 | 97精品久久久午夜一区二区三区| 日韩精品电影在线观看| 国产精品每日更新| 日韩免费一区二区| 欧美探花视频资源| 亚洲少妇在线| 海角社区69精品视频| 大白屁股一区二区视频| 日韩高清在线一区| 亚洲欧美日韩久久| 日韩免费看的电影| 欧美婷婷六月丁香综合色| 99精品热视频只有精品10| 欧美高清视频一区| 成人黄色免费短视频| 极品少妇xxxx精品少妇偷拍| 首页国产丝袜综合| 一区二区三区在线影院| 欧美国产日韩亚洲一区| 欧美电影免费观看高清完整版在线观看 | 韩日精品在线| 国产精品一区专区| 蜜桃视频一区二区三区在线观看| 亚洲欧美另类久久久精品| 国产人久久人人人人爽| 欧美岛国在线观看| 欧美剧情片在线观看| 老司机午夜精品视频| 国产美女精品| 亚洲精品乱码| 亚洲无毛电影| 欧美成人tv| 99久免费精品视频在线观看| 国产精品18久久久久久久网站| 奇米影视在线99精品| 亚洲一区二区三区四区在线免费观看 | 欧美精品乱人伦久久久久久| 亚洲国产精品久久久久久女王| 91麻豆自制传媒国产之光| 粉嫩蜜臀av国产精品网站| 国产精一品亚洲二区在线视频| 蜜桃久久av一区| 美女精品自拍一二三四| 日韩av不卡在线观看| 五月天激情综合网| 亚洲高清在线精品| 亚洲成年人影院| 亚洲国产日产av| 亚洲无人区一区| 夜夜亚洲天天久久| 亚洲日本在线看| 中文字幕一区二区视频| 国产精品护士白丝一区av| 国产精品卡一卡二卡三| 国产精品看片你懂得| 国产精品久久国产精麻豆99网站| 国产日韩欧美综合一区| 久久综合色之久久综合| 久久久不卡网国产精品二区 | 国产精品萝li| 中文字幕制服丝袜成人av| 亚洲欧洲另类国产综合| 亚洲天堂网中文字| 亚洲日本青草视频在线怡红院| 亚洲精品日韩一| 一区二区三区四区亚洲| 性做久久久久久| 日韩和欧美一区二区三区| 日韩电影网1区2区| 麻豆成人综合网| 国产精品一区二区久久精品爱涩| 国产精品羞羞答答xxdd| 成人激情av网| 91视频国产观看| 欧美日韩精品免费观看| 国产自产精品| 亚洲精品日韩在线观看| 性8sex亚洲区入口| 在线观看亚洲精品视频| 7777精品伊人久久久大香线蕉 | 久久精品国产一区二区三区免费看| 国产在线看一区| av在线免费不卡| 欧美日韩三级电影在线| 99精品久久久| 欧美亚洲禁片免费| 欧美一级欧美三级在线观看|