成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

python爬取豆瓣電影排行榜(requests)的示例代碼

瀏覽:3日期:2022-06-27 17:18:00

’’’ 爬取豆瓣電影排行榜 設計思路: 1、先獲取電影類型的名字以及特有的編號 2、將編號向ajax發送get請求獲取想要的數據 3、將數據存放進excel表格中’’’

環境部署:

軟件安裝:

Python 3.7.6

官網地址:https://www.python.org/

安裝地址:https://www.python.org/ftp/python/3.7.6/python-3.7.6-amd64.exe

PyCharm 2020.2.2 x64 位

官網地址:https://www.jetbrains.com/pycharm/download/#section=windows

參考教程:https://www.jb51.net/article/197466.htm

模塊安裝(打開cmd或powershell進行下面的命令安裝【前提需要有python】):安裝requests模塊、lxml模塊(發送請求,xpath獲取數據)

pip install requests #(主要用來發送請求,獲取響應)pip install lxml #(主要引用里面的etree里面的xpath方法)

安裝xpathhelper插件(可以在網頁中復制相應的節點xpath路徑并查看)

1、下載地址:

鏈接: https://pan.baidu.com/s/1zfpnrnFtZaxrgqrUX9y5Yg

提取碼: fmsu

2、window平臺下: · 把文件的后綴名crx改為rar,然后解壓到同名文件夾中 · 打開谷歌的擴展程序 ——> 進入到管理管理擴展程序中 · 打開開發者模式,通過加載已解壓的擴展程序,將插件導入3、ios平臺下: · 直接將crx文件拖進擴展程序中

安裝xlwt模塊(將數據存放進excel表格)

pip install xlwt

項目中需要引入的模塊:

import requestsfrom lxml import etreeimport xlwtimport time

使用流程:

在列表中填寫所需要獲取的電影類型名 輸入開始時獲取的start以及獲取多少數據的limit 填寫所要輸出的excel表格的名字(代碼中默認douban.xls) 程序運行結束后打開excel驗證數據是否獲取 觀察自己所需的數據

完整代碼:

# encoding=utf8# 編程者 :Alvin’’’ 爬取豆瓣電影排行榜 設計思路: 1、先獲取電影類型的名字以及特有的編號 2、將編號向ajax發送get請求獲取想要的數據 3、將數據存放進excel表格中’’’import requestsfrom lxml import etreeimport xlwtimport timeclass DouBan(): # 初始化數據,獲取最外層的數據 def __init__(self, name_list): self.headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.3', 'Connection': 'close', 'Referer': 'https://movie.douban.com/' } # 獲取最外層的數據,并拿到url中的type中的name 和 類型 self.url = ’https://movie.douban.com/chart’ self.dydata_list = [] # 電影的類型名 self.name_list = name_list # 實例化excel表格對象 self.wb = xlwt.Workbook() # 通過電影的類型名字獲取對應的類型號 def get_data_typenum(self, name): for data in self.dydata_list: if data[’name’] == name: typenum =data[’dytype’] else: continue return typenum # 獲取數據 def get_data_p1(self): response = requests.get(self.url , headers = self.headers) # 判斷長度是否足夠大 # print(len(response.content.decode())) return response.content.decode() # 獲取下一層的頁面數據 def get_data_p2(self, typenum, num, limit): url = ’https://movie.douban.com/j/chart/top_list’ params = { ’type’: typenum, ’interval_id’: ’100:90’, ’action’:’’, ’start’: num*20, ’limit’: limit } response = requests.get(url,params=params,headers=self.headers) # print(response.json()) return response.json() # 處理數據 def data_parse_p1(self, data): html = etree.HTML(data) data_list = html.xpath(’//div[@class='types']/span/a/@href’) # 用于收集類型名字 name_list = [] dytype_list = [] # 用于收集類型號 for data in data_list: name = data.split(’?’)[-1].split(’&’)[0].split(’=’)[-1] dytype = data.split(’?’)[-1].split(’&’)[1].split(’=’)[-1] name_list.append(name) dytype_list.append(dytype) for (name,dytype) in zip(name_list,dytype_list): dydict = {} dydict[’name’] = name dydict[’dytype’] = dytype self.dydata_list.append(dydict) # print(self.dydata_list) return self.dydata_list def data_parse_p2(self, data_list,name): print(len(data_list)) douban = self.wb.add_sheet(name) style = xlwt.XFStyle() # 初始化一個style對象,用來保存excel的樣式 font = xlwt.Font() # 創建一個font對象,用來保存對字體進行的操作 font.name = ’微軟雅黑’ # 字體設置為’微軟雅黑’ font.bold = True # 字體加粗 al = xlwt.Alignment() # 創建一個對齊對啊想,用來改變文本內容的字體 style.font = font # 將字體信息保存到style對象中 style.alignment = al # 水平對齊方式、水平居中 al.horz = 0x02 # 垂直對齊方式、垂直居中 al.vert = 0x01 # 電影的標題 douban.col(0).width = 256 * 25 # 電影演員的名字 douban.col(1).width = 256 * 50 # 電影上映的年份 douban.col(2).width = 256 * 15 # 電影上映的國家 douban.col(3).width = 256 * 15 # 電影的標簽 douban.col(4).width = 256 * 20 # 電影的評分 douban.col(5).width = 256 * 8 # 豆瓣中該電影的頁面鏈接 douban.col(6).width = 256 * 40 douban.write(0, 0, ’電影標題’, style) douban.write(0, 1, ’電影演員名字’, style) douban.write(0, 2, ’電影上映年份’, style) douban.write(0, 3, ’電影上映國家’, style) douban.write(0, 4, ’電影標簽’, style) douban.write(0, 5, ’電影評分’, style) douban.write(0, 6, ’豆瓣中該電影的頁面鏈接’, style) row = 1 for data in data_list: # 電影的標題 title = data[’title’] # 電影演員的名字 actors = data[’actors’] # 電影上映的年份 release_date = data[’release_date’] # 電影上映的國家 regions = data[’regions’][0] # 電影的標簽 types = data[’types’] # 電影評分 score = data[’score’] # 豆瓣查看的鏈接 link = data[’url’] douban.write(row, 0, title) douban.write(row, 1, actors) douban.write(row, 2, release_date) douban.write(row, 3, regions) douban.write(row, 4, types) douban.write(row, 5, score) douban.write(row, 6, link) row += 1 self.wb.save(’douban.xls’) # 運行程序 def run(self, num, limit): # 獲取第一層中的所需要的類型名字和數字 self.data_parse_p1(self.get_data_p1()) for name in self.name_list: typenum = self.get_data_typenum(name) # 向指定的分類進行數據的訪問 data_list = self.get_data_p2(typenum,num,limit) # 對獲取的數據進行解析保存 self.data_parse_p2(data_list,name)if __name__ == ’__main__’: # 需要查看的類型 douban = DouBan([’喜劇’,’懸疑’,’驚悚’]) # 需要查看的開始值start,以及需要查看的數量limit douban.run(0,100) time.sleep(2)

效果圖pycharm 運行臺

python爬取豆瓣電影排行榜(requests)的示例代碼

excel表格顯示

python爬取豆瓣電影排行榜(requests)的示例代碼

本案例筆者的想法是打算先獲取到每一個電影類型的前100個數據,然后在excel表格中進行評分的篩選,最后觀察現階段某個電影類型中哪些電影在豆瓣電影中評分較高的

到此這篇關于python爬取豆瓣電影排行榜(requests)的文章就介紹到這了,更多相關python爬取豆瓣電影內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: 豆瓣 Python
相關文章:
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
精品国产乱码久久久久久久久 | 精品不卡在线| 欧美蜜桃一区二区三区| 亚洲va韩国va欧美va| 亚洲一级一区| 国产精品美女久久久久久久网站| 国产乱码精品一区二区三区五月婷| 在线视频一区二区三区| 天堂在线一区二区| 香蕉免费一区二区三区在线观看| 亚洲黄色性网站| 99成人精品| 一区二区三区中文字幕| 99精品国产在热久久婷婷| 亚洲欧美日韩国产中文在线| 亚洲第一区色| 亚洲日本免费电影| 99精品视频免费全部在线| 亚洲女同一区二区| 国产精品美女| 三级不卡在线观看| 色婷婷精品久久二区二区蜜臀av| 日韩不卡一二三区| 欧美无砖砖区免费| 国产精品综合一区二区| 日韩精品一区二区三区中文不卡| av不卡一区二区三区| 国产日本欧洲亚洲| 亚洲国产专区| 午夜视频在线观看一区二区三区| 老司机亚洲精品| 美女性感视频久久| 91精品国产一区二区人妖| 国产河南妇女毛片精品久久久| 日韩欧美国产系列| 欧美精品尤物在线| 一色桃子久久精品亚洲| 国产精品一区视频| 日本不卡免费在线视频| 欧美日韩国产一二三| 丁香婷婷综合激情五月色| 欧美精品一区二区三区四区 | 91小视频免费看| 久久久www成人免费无遮挡大片| 欧美久久一级| 亚洲另类中文字| 久久久久久夜| 国产一区二区三区电影在线观看| 精品处破学生在线二十三| 欧美精品成人一区二区在线观看| 亚洲美女免费在线| 久久久久久久波多野高潮日日| 韩国毛片一区二区三区| 久久久久9999亚洲精品| 国产欧美日韩视频一区二区三区| 日本91福利区| 日韩亚洲欧美高清| 国产精品啊啊啊| 亚洲第一狼人社区| 欧美裸体一区二区三区| 欧美在线国产| 一区二区三区自拍| 欧美日韩亚洲综合在线| 91同城在线观看| 亚洲一区二区欧美日韩 | 极品少妇一区二区三区| 丝袜国产日韩另类美女| 欧美一区二区久久| 国产综合久久| 日本vs亚洲vs韩国一区三区二区 | 欧美岛国在线观看| 欧美二区在线| 亚洲一区二区三区四区不卡| 5858s免费视频成人| 欧美日韩1区| 日韩一区欧美二区| 精品国产伦理网| 国产精品日韩一区二区三区| 狠狠色丁香久久婷婷综| 国产精品视频一二| 欧日韩精品视频| 欧美福利影院| 免费观看日韩av| 久久久99久久| 色欲综合视频天天天| 99久久免费精品高清特色大片| 一区二区三区在线视频观看58| 欧美另类变人与禽xxxxx| 亚洲午夜一区| 久久国产精品色| 国产精品青草综合久久久久99| 91久久精品国产91性色tv| 91蜜桃传媒精品久久久一区二区| 亚洲va欧美va人人爽| 久久蜜桃av一区精品变态类天堂 | 国精产品一区一区三区mba桃花 | 亚洲精品中文字幕在线观看| 欧美男人的天堂一二区| 亚洲大胆视频| 国产精品一二三区| 亚洲午夜在线电影| 欧美一区二区美女| 亚洲欧美视频一区二区三区| 99国产精品久久久久久久久久| 日韩精品成人一区二区三区| 国产午夜亚洲精品不卡| 欧美视频一区二区三区| 亚洲国产99| 成人性视频免费网站| 三级一区在线视频先锋| 日本一区二区三区电影| 欧美视频你懂的| 99国产精品久久久久老师 | 久久亚洲精品欧美| 91美女在线视频| 精品一区二区三区视频在线观看| 亚洲欧美国产毛片在线| 日韩一区二区在线观看视频播放| 国产农村妇女精品一二区| 成人久久视频在线观看| 免费视频最近日韩| 亚洲色图视频网站| 精品国产乱码久久久久久浪潮| 久久婷婷丁香| 影音先锋中文字幕一区| 不卡av免费在线观看| 美女mm1313爽爽久久久蜜臀| 国产精品二三区| 欧美成人猛片aaaaaaa| 欧美性猛交xxxx乱大交退制版| 亚洲人人精品| 91首页免费视频| 国产精品一二三四| 麻豆国产欧美一区二区三区| 亚洲一区二区在线观看视频| 国产精品理论片在线观看| 日韩你懂的电影在线观看| 91国产成人在线| 性伦欧美刺激片在线观看| 国产精品hd| 成人黄色小视频| 精品一区二区免费视频| 婷婷成人综合网| 亚洲精品国久久99热| 国产日韩精品一区二区三区| 欧美xfplay| 91麻豆精品国产91久久久资源速度| 老**午夜毛片一区二区三区| 国产精品久久久免费| 黄色在线成人| 欧美日韩综合精品| 91免费看视频| 不卡av电影在线播放| 国产福利不卡视频| 国产一区福利在线| 久草在线在线精品观看| 欧美a级一区二区| 日韩在线一区二区三区| 亚洲一区二区偷拍精品| 一区二区三区在线播| 亚洲美女少妇撒尿| ●精品国产综合乱码久久久久| 国产欧美日韩在线观看| 欧美精品一区二区三区一线天视频| 日韩一区二区免费在线电影| 91精品欧美一区二区三区综合在| 欧美日韩一二区| 欧美日韩中文一区| 色狠狠一区二区三区香蕉| 色婷婷久久久久swag精品| 久久一区二区三区av| 久久精品伊人| 毛片一区二区| 中文亚洲字幕| 国产三级精品在线不卡| 亚洲一区黄色| 免费在线亚洲欧美| 久久一二三四| 欧美性欧美巨大黑白大战| 欧美日韩亚洲丝袜制服| 欧美日韩国产高清一区| 欧美精品一卡两卡| 欧美一区二区在线免费播放| 日韩视频国产视频| 精品成人一区二区三区| 久久精品亚洲国产奇米99| 国产精品免费视频一区| 亚洲日本电影在线| 亚洲狠狠丁香婷婷综合久久久| 亚洲国产wwwccc36天堂| 奇米影视一区二区三区| 韩国女主播成人在线观看| 国产精品一区二区x88av| 成人激情文学综合网| 欧美国产精品| 亚洲人成人一区二区三区| 麻豆久久久9性大片| 欧美日韩精品免费| 日韩欧美中文一区二区| 日本一区二区免费在线 |