成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

如何基于Python爬取隱秘的角落評論

瀏覽:213日期:2022-07-19 08:16:10

“一起去爬山吧?”

這句臺詞火爆了整個朋友圈,沒錯,就是來自最近熱門的《隱秘的角落》,豆瓣評分8.9分,好評不斷。

如何基于Python爬取隱秘的角落評論

感覺還是蠻不錯的。同時,為了想更進一步了解一下小伙伴觀劇的情況,永恒君抓取了愛奇藝平臺評論數據并進行了分析。下面來做個分享,給大伙參考參考。

1、爬取評論數據

因為該劇是在愛奇藝平臺獨播的,自然數據源從這里取比較合適。永恒君爬取了《隱秘的角落》12集的從開播日6月16日-6月26日的評論數據。

使用 Chrome 查看源代碼模式,在播放頁面往下面滑動,有一個 get_comments 的請求,經過調試分析,這個接口就是獲取評論數據的接口,后面連接上一系列的參數即可獲取評論的數據。

如何基于Python爬取隱秘的角落評論

其中關鍵的就是last_id這個參數,是用來控制評論分頁的,需要通過上一個頁面最后一條評論的id來進行獲取。

爬蟲部分代碼

def get_comment_html(movieId, movieName, lastId):#將獲取評論的json源碼,保存到txt文件中 url = 'http://sns-comment.iqiyi.com/v3/comment/get_comments.action?' params = { 'types':'time', 'business_type':'17', 'agent_type':'118', 'agent_version':'9.11.5', 'authcookie':'authcookie' } for item in params: url = url + item + '=' + params[item] + '&' url = url + 'content_id=' + movieId+ '&last_id=' + lastId #url 為拼接好的評論地址 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36', 'Accept': 'application/json, text/javascript', 'Referer': 'https://www.iqiyi.com/v_19rxtiliso.html?vfm=2008_aldbd&fv=p_02_01', } response = requests.get(url, headers=headers) filename = movieId + movieName+'.txt' if response.status_code == 200:with open(filename,'a',encoding=’utf-8’) as f: f.write(response.text+'n') #將獲取的評論json源碼保存到txt文件,一次寫入一行,表示獲取的這一頁的評論else: print('request error') print('爬取第{}頁評論'.format(file_lines(filename))) time.sleep(0.5) last_id = parseData(response.text) #解析并獲取下一個id if last_id != 'End': get_comment_html(movieId, movieName, parseData(response.text)) else: print('已到結尾') #continue#結束整個程序 return None

最終將12集爬取下來的包含評論數據的json源碼保存到txt文件當中,解析提取評論的時間、用戶名、性別、評論內容等信息,經過去重、去空白等數據清理工作,最終獲得28010條評論信息。

如何基于Python爬取隱秘的角落評論

2、分析展示數據

在海量的數據中,我們可以分析出我們想看到的結果。為了更好的數據處理和可視化展示,這里永恒君用了Pandas和Pyecharts 這兩個庫。

1)評論用戶性別方面

女生占了大部分,占比60.89%,比男性用戶要多不少。

如何基于Python爬取隱秘的角落評論

2)每一集的評論數量

接下來,我們再來看一下,每一期的評論數量,看是否能夠得出一些不一樣的數據。

from pyecharts.charts import Bar ##導入需要使用的圖表from pyecharts import options as opts ##導入配置項comment_num3 = df['集數'].value_counts().sort_index()x_line3 = comment_num3.index.to_list()y_line3 = comment_num3.values.tolist()bar1=( Bar(init_opts=opts.InitOpts(width=’800px’, height=’350px’)) ##定義為柱狀圖 .add_xaxis(x_line3) ##X軸的值 .add_yaxis(’評論數’,y_line3) ##y的值和y的一些數據配置項 .set_global_opts(title_opts=opts.TitleOpts(title=’《隱秘的角落》1-12集評論數量’)) ) bar1.render('bar3.html') ###輸出html文件

如何基于Python爬取隱秘的角落評論

除了第一集的評論數特別多之外,可以看到,上半段的評論數明顯要比下半段的要多,是否意味著大家普遍覺得前期的要更好看一些?

如何基于Python爬取隱秘的角落評論

3)開播十天之內的評論數量走勢

接下來我們來看看從6月16日開播之后,網友們對該劇的評論數量走勢情況。

from pyecharts.charts import Line ##導入需要使用的圖表from pyecharts import options as opts ##導入配置項comment_num = df['留言時間'].str.split(’ ’).str[0].value_counts().sort_index()x_line1 = [i.replace(’2020-’,’’) for i in comment_num.index.to_list()] y_line1 = comment_num.values.tolist()# 繪制面積圖line1 = Line(init_opts=opts.InitOpts(width=’1200px’, height=’600px’))line1.add_xaxis(x_line1)line1.add_yaxis(’’, y_line1,markpoint_opts=opts.MarkPointOpts(data=[ opts.MarkPointItem(type_=’max’, name=’最大值’), opts.MarkPointItem(type_=’min’, name=’最小值’)])) line1.set_global_opts(title_opts=opts.TitleOpts(’《隱秘的角落》開播10天內評論走勢’), xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=’30’)), #visualmap_opts=opts.VisualMapOpts(max_=12673) ) line1.set_series_opts(label_opts=opts.LabelOpts(is_show=True), linestyle_opts=opts.LineStyleOpts(width=2))line1.render('Line.html')

如何基于Python爬取隱秘的角落評論

可以看到,從6月16日開播后,評論數量一路走高在6月25日達到了一個階段的高點。

4)一天之中大家都在什么時間段看這部劇?

通過統計16日-26日每日0-23時的評論數量,來看看大家一般都在什么時候看劇

from pyecharts.charts import Bar ##導入需要使用的圖表from pyecharts import options as opts ##導入配置項comment_num2 = df['留言時間'].str.split(’ ’).str[1].str.split(':').str[0].value_counts().sort_index()x_line2 = comment_num2.index.to_list()y_line2 = comment_num2.values.tolist()bar1=( Bar(init_opts=opts.InitOpts(width=’800px’, height=’350px’)) ##定義為柱狀圖 .add_xaxis(x_line2) ##X軸的值 .add_yaxis(’評論數’,y_line2) ##y的值和y的一些數據配置項 .set_global_opts(title_opts=opts.TitleOpts(title=’《隱秘的角落》0-23時評論數量’)) ) bar1.render('bar2.html') ###輸出html文件

如何基于Python爬取隱秘的角落評論

可以看到,晚上20點-23時為最集中看劇的時間段,其次中午12-14點也有一波小高峰,總體更多的人是下午看劇的人多。

這是否也是你看劇的時間段呢?

5)評論的字數情況

永恒君一般看劇基本都不寫評論的或者也是簡單幾個字,但是在這里,我特地看了一下評論字數的分布,

def comment_word_group(strings): #評論字數分組函數 if len(strings)<=10: length = 0 elif len(strings) > 10 and len(strings)<=30: length = 1 elif len(strings) >30 and len(strings) <=50: length = 2 else: length = 3 return lengthdf['留言數量組別'] = df['留言內容'].apply(lambda x:comment_word_group(x))#評論字數分組lengthData = df.groupby([’留言數量組別’])['留言內容'].count()#評論字數分組統計from pyecharts.charts import Bar ##導入需要使用的圖表from pyecharts import options as opts ##導入配置項attr = ['10字以內','10~30字','30~50字','50字以上'] #X軸v1 = lengthData.values.tolist() #Y軸bar1=( Bar(init_opts=opts.InitOpts(width=’800px’, height=’350px’)) ##定義為柱狀圖 .add_xaxis(attr) ##X軸的值 .add_yaxis(’評論數量’,v1) ##y的值和y的一些數據配置項 .set_global_opts(title_opts=opts.TitleOpts(title=’《隱秘的角落》評論字數分布’)) ) bar1.render('bar.html') ###輸出html文件

如何基于Python爬取隱秘的角落評論

絕大部分的評論字數都是在10個字以內,但也有約25%的評論字數在10-30個之內,還是讓永恒君有點意外,是否說明該劇火爆也是有原因的,激起了不少伙伴的共鳴。

6)評論核心關鍵詞

最后,永恒君將通過wordcloud庫制作詞云來看看,大家對該劇的整體評價,以及該劇的核心關鍵詞。

#詞云from PIL import Imagefrom wordcloud import WordCloud,ImageColorGenerator,STOPWORDSimport jiebaimport matplotlib.pyplot as pltimport numpy as npcontents = df['留言內容'].str.cat(sep=' ')contentssw = set(STOPWORDS)sw.add('這個')sw.add('什么')cut_text2 = ' '.join(jieba.lcut(contents))background_image = np.array(Image.open('bg.png'))wc = WordCloud(font_path=r’C:WindowsFontssimhei.ttf’,background_color=’White’,max_words=3000,width=1000,height=500,scale=1,stopwords=sw,#停用詞mask = background_image)#font_path:設置字體,max_words:出現的最多詞數量,mask參數=圖片背景,必須要寫上,另外有mask參數再設定寬高是無效的wc.generate(cut_text2)wc.to_file('a2.jpg')#將圖繪制出來plt.imshow(wc)plt.axis('off') plt.show()

如何基于Python爬取隱秘的角落評論

可以看到,“朝陽”、“嚴良”、“張東升”、“普普”、“好看”、“喜歡”、“小孩”、“原著”等關鍵詞都是大伙在熱議的。

不得不說,近年來如此火熱的、而且質量不錯的國產劇確實不多了。永恒君看前幾集的時候,突然又有大學時候看《越獄》的那個味道,看了一集就想看下一集,停不下來。

如果你現在還沒有來得及看,建議抽個時間去看看吧~~~

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
久久精品国产网站| 国产精华液一区二区三区| 性做久久久久久免费观看| 欧美1区视频| 日韩精品一区二区三区四区视频| 日韩高清不卡一区二区| 一道本一区二区| 国产亚洲欧美激情| 麻豆成人在线观看| 国产欧美日韩一区二区三区| 国产亚洲欧美中文| 国产精品123| 欧美在线观看禁18| 午夜精品一区二区三区电影天堂| 亚洲午夜av| 精品日韩在线观看| 日韩电影在线观看一区| 精品1区2区3区4区| 久久久蜜桃精品| 国产一区二区在线影院| 久久国产主播| 亚洲精品视频一区二区| 午夜精品久久| 精品国产99国产精品| 国产真实乱子伦精品视频| 91精品福利视频| 午夜精品久久久久久久久| 日韩午夜免费| 中文字幕制服丝袜一区二区三区| 粉嫩一区二区三区性色av| 欧美精品日韩一区| 日本特黄久久久高潮| 狼狼综合久久久久综合网 | 国产精品国产精品国产专区不蜜 | 亚洲东热激情| 国产精品天天看| 91蜜桃在线免费视频| 日韩美女主播在线视频一区二区三区 | 国产精品蜜臀av| 色综合中文字幕国产 | 大尺度一区二区| 欧美一区二区视频网站| 精品一区二区三区久久| 在线成人免费视频| 国产成人精品免费视频网站| 91麻豆精品91久久久久久清纯| 美女爽到高潮91| 色偷偷久久人人79超碰人人澡| 亚洲va国产va欧美va观看| 老司机午夜精品视频| 日韩国产欧美三级| 91久久免费观看| 美女被吸乳得到大胸91| 欧美日韩精品专区| 国产在线精品视频| 欧美一区二区在线观看| 成人免费看的视频| 亚洲精品一区二区三区福利| 不卡的av在线播放| 久久久久久免费毛片精品| 99re这里只有精品视频首页| 久久午夜老司机| 99久久精品国产毛片| 日本一区二区视频在线| 在线观看福利一区| 亚洲国产欧美另类丝袜| 久久久精品网| 老司机免费视频一区二区三区| 欧美日韩在线亚洲一区蜜芽| 国产精品资源在线观看| 欧美成人三级在线| 欧美福利电影在线观看| 伊人一区二区三区| 色综合激情久久| 九九九精品视频| 欧美一区二区三区四区久久| 成人国产精品免费观看动漫| 久久久亚洲午夜电影| 激情久久综合| 亚洲国产wwwccc36天堂| 在线观看日产精品| 成人黄色电影在线| 亚洲天堂成人在线观看| 久久伊人一区二区| 国v精品久久久网| 国产精品久久久久久久岛一牛影视| 亚洲视频精品| 午夜久久电影网| 欧美一级精品大片| 免费成人结看片| 精品日韩欧美一区二区| 黄色免费成人| 日本sm残虐另类| 日韩一区二区视频在线观看| 欧美日韩免费观看一区| 亚洲激情av在线| 欧美三级一区二区| 99re热视频这里只精品| 亚洲精品国产一区二区精华液| 久久精品在线| 国产精品自拍av| 国产精品免费视频一区| 欧美黄色aaaa| 亚洲1区2区3区视频| 日韩视频免费观看高清完整版 | 国产亚洲在线观看| 韩日欧美一区二区三区| 久久久久久99久久久精品网站| 在线看无码的免费网站| 免费成人在线播放| 国产亚洲一区二区三区在线观看 | 免费国产一区二区| 亚洲一区二区四区| 精品美女在线观看| 婷婷中文字幕一区三区| 99久久国产综合精品色伊| 91久久精品午夜一区二区| 在线成人av影院| 久久综合狠狠综合久久激情 | 国产传媒久久文化传媒| 国产一区二区三区视频在线播放| 成人一区二区三区视频| 免费久久99精品国产自在现线| 国产裸体歌舞团一区二区| 国产精品久久午夜夜伦鲁鲁| 久久综合中文| 成人免费视频网站在线观看| 一区二区三区四区视频精品免费| 欧美一区二区三区视频| 一区二区三区av| 成人免费观看男女羞羞视频| 一个色综合av| 日韩欧美成人一区二区| 亚洲一区国产| 9久草视频在线视频精品| 日本欧洲一区二区| 国产精品视频看| 欧美怡红院视频| 亚洲国产成人不卡| 成人黄色电影在线| 免费在线看一区| 亚洲精品国产无天堂网2021| 欧美一区二区人人喊爽| 亚洲永久在线| 91片在线免费观看| 韩日精品视频一区| 亚洲一区二区在线视频| 久久久久久久久岛国免费| 欧美日韩午夜在线视频| 亚洲黑丝在线| 99精品一区二区三区| 蜜桃视频一区二区三区 | 欧美高清视频一区| 国产一区二区免费在线| 一区二区三区91| 久久久亚洲午夜电影| 欧美精品乱人伦久久久久久| 亚洲自啪免费| 欧美国产综合视频| 国产999精品久久| 日韩专区在线视频| 亚洲激情综合网| ...xxx性欧美| 国产蜜臀97一区二区三区| ww久久中文字幕| 欧美一区二区三区免费观看视频| 色婷婷精品大在线视频 | 国产精品久久久亚洲一区| 尤物在线精品| 欧美日韩一区在线视频| 91美女片黄在线观看91美女| 成人av在线电影| 高清av一区二区| 国产成人综合在线观看| 国产精品资源网站| 狠狠色丁香久久婷婷综| 精品一区二区三区免费观看| 久久99精品国产.久久久久久| 久久精品国产久精国产爱| 美女网站色91| 麻豆一区二区99久久久久| 日韩精品乱码免费| 亚洲一区二区三区免费视频| 洋洋成人永久网站入口| 亚洲一级不卡视频| 亚洲同性同志一二三专区| 中文字幕不卡在线观看| 国产日韩欧美一区二区三区综合| 日韩欧美亚洲国产精品字幕久久久| 亚洲视频高清| 影音先锋久久资源网| 97久久久精品综合88久久| 99re8在线精品视频免费播放| 国产一区二区日韩精品| 美腿丝袜亚洲综合| 一区二区三区国产精华| 国产精品婷婷午夜在线观看| 精品国产麻豆免费人成网站| 欧美一区二区三区四区久久| 欧美午夜精品电影|