成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

Python selenium如何打包靜態網頁并下載

瀏覽:2日期:2022-07-14 11:46:11

需求:單純的將page.source寫入文件的方式,會導致一些圖片無法顯示,對于google瀏覽器,直接將頁面打包下載成一個mhtml格式的文件,則可以進行離線下載。對應python selenium 微信公眾號歷史文章隨手一點就返回首頁?郁悶之下只好將他們都下載下來。:https://www.jb51.net/article/193111.htm

遇到的問題:

1、單純使用webdriver.ActionChains無法完成下載動作,未能操作windows窗口。

2、沒有找到相關能直接下載.mhtml的命名接口。

3、pywin32置頂窗口的使用不順利。

解決思路:

1、使用selnium打開瀏覽器,不要操作,讓其保持置頂

2、使用pyautogui、pyperclip操作鍵盤、鼠標、剪切板進行下載文件。

準備材料:

需要將自動化操作的一些圖片截取下來,以作為后期圖片匹配使用。

Python selenium如何打包靜態網頁并下載

實現:

1、打開爬取好的鏈接,遍歷所有需要下載的頁面

# 讀取文件filename = r’data/01 爬取微信公眾號歷史文章/urls 二律背反的一燈如豆-out.xlsx’df = pd.read_excel(filename,dtype=object)df = df.reindex(columns=[’日期’, ’標題’, ’原創’, ’地址’,’完成情況’,’儲存地址’])#df = df.head(5)dfsel = (df[’標題’] !=’隨文’) & (df[’完成情況’] != 1)save_folder = r'I:codepythondata01 爬取微信公眾號歷史文章01 二律背反的一燈如豆' + ''# 設置保存格式為 mhtml,減少要操作文件保存下拉框的情況options = webdriver.ChromeOptions()options.add_argument(’--save-page-as-mhtml’)# 啟動瀏覽器driver = webdriver.Chrome(options=options)wait = WebDriverWait(driver,10)df.loc[dfsel,'完成情況'],df.loc[dfsel,'儲存地址'] = zip(*df[dfsel].apply(download_mhtml_with_not_check, axis=1,args=(driver,wait)))

2、編寫相關下載頁面函數

# 在timeout秒內,返回中心值,間隔時長time_setp# 封裝一個pyautogui限時查找函數#def finde_gui_element(png,timeout = 5,time_setp=0.2): i = 1 if timeout <=0 : timeout = 5 if time_setp <=0 : time_setp = 0.2 while True: if i > timeout/time_setp: return None center = pyautogui.locateCenterOnScreen(png,grayscale=False,confidence=0.9) if center == None: time.sleep(0.2) else: return center i = i + 1

主要自動化操作代碼:

def download_mhtml_with_not_check(x,driver,wait): name = ’’ try: url = str(x[’地址’]) driver.get(url) # 獲取瀏覽器標題,用于檢測是否是置頂頁 wait.until(EC.presence_of_element_located((By.XPATH,’//h2[@id='activity-name']’))) title = driver.find_element_by_xpath(’//h2[@id='activity-name']’).text print(’no:’,x.name,’url:’,url,’title:’,title) wait.until(EC.presence_of_element_located((By.XPATH,’//div[@id='page-content']’))) #進入下載 pyautogui.hotkey(’ctrl’, ’s’) # 等待一下對話框彈出 time.sleep(1) bt = finde_gui_element(r’datapngsave.png’) #查找保存按鍵 if bt == None: return (0,’’) else: # 根據標題組合成具體路徑 name = save_folder + ’ ’ + title + ’.mhtml’ #print(name) pyperclip.copy(name) pyautogui.hotkey(’ctrl’, ’v’) time.sleep(0.1) pyautogui.hotkey(’Enter’) # 檢查是否彈出另存為 bt = finde_gui_element(r’datapngconfirmsaveas.png’,timeout=0.5) if bt != None: # 說明出現重復明明,點擊覆蓋 pyautogui.hotkey(’Tab’) pyautogui.hotkey(’Enter’) return (1,name) bt = finde_gui_element(r’datapngcancle.png’,timeout=0.5) if bt != None: #還愛,說明出現了一些異常 pyautogui.hotkey(’esc’) pyautogui.hotkey(’esc’) pyautogui.leftClick(bt) return (-1,name) # 加多一個esc防止出現窗口還在 pyautogui.hotkey(’esc’) except Exception as e: print(str(e)) return (-2,name) return (1,name)

最后寫入excel:

Python selenium如何打包靜態網頁并下載

通過vba代碼,將單元格地址添加上超鏈接:

Option ExplicitSub add_hype() Dim ws As Worksheet, arr As Variant, i As Long Set ws = ThisWorkbook.Worksheets(1) arr = ws.UsedRange.Value ws.Cells.Hyperlinks.Delete For i = 2 To UBound(arr) If CStr(arr(i, 2)) = '隨文' Then Else If CStr(arr(i, 5)) = '1' Then ws.Hyperlinks.Add Anchor:=ws.Cells(i, 6), Address:=CStr(arr(i, 6)) End If End If Next i End Sub

完成。

不足之處:

1、通過autogui操作,難免會遇到彈窗的情況,需要增加活動窗體置頂,但是一直沒有找到有效的方法。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
国产精品国产三级国产aⅴ中文| 亚洲自拍偷拍九九九| 久久免费99精品久久久久久| 91亚洲精品一区二区乱码| 中文字幕一区免费在线观看 | 在线天堂一区av电影| 成人激情免费网站| 久久国产尿小便嘘嘘尿| 亚洲天堂免费在线观看视频| 日韩一区二区免费高清| 欧美午夜免费电影| 久久不射网站| 亚洲国产精品一区| 国产主播一区| 欧美国产三区| 欧美影院一区| 欧美久久久久久| 欧美激情五月| 亚洲欧美一级二级三级| 波多野结衣中文字幕一区二区三区| 九九**精品视频免费播放| 免费观看一级欧美片| 中文字幕一区二区视频| 亚洲国产成人午夜在线一区| 久久综合狠狠综合久久激情| 日韩亚洲欧美在线观看| 欧美美女激情18p| 欧美日韩一级黄| 欧美自拍丝袜亚洲| 色av综合在线| 91成人在线精品| 久久久久久国产精品一区| 美日韩免费视频| 午夜亚洲视频| 欧美亚洲动漫制服丝袜| 欧美主播一区二区三区美女| 欧美视频一区在线观看| 色综合久久99| 色狠狠综合天天综合综合| 亚洲一区日韩在线| 欧美99久久| 欧美一区国产一区| 99久久久无码国产精品| 国产精品一二一区| 粉嫩久久99精品久久久久久夜| 成人亚洲一区二区一| 欧美日韩18| 国产精品久久国产三级国电话系列 | 亚洲不卡一区二区三区| 欧美aaaaaa午夜精品| 国产一区在线观看视频| 97久久超碰精品国产| 极品少妇一区二区三区| 国产乱码精品一区二区三区不卡| 色婷婷久久久综合中文字幕| 91精品国产高清一区二区三区蜜臀| 精品美女一区二区三区| 国产精品久久久久四虎| 午夜久久电影网| 国产成人aaa| 亚洲一二三区在线| 91福利区一区二区三区| 久久久久青草大香线综合精品| 亚洲欧美在线观看| 麻豆精品一区二区av白丝在线| 国产成人高清视频| 亚洲精品一区二| 欧美日韩另类国产亚洲欧美一级| 久久久久久日产精品| 亚洲超碰97人人做人人爱| 国产成人自拍网| 亚洲大胆女人| 制服视频三区第一页精品| 国产精品网站在线| 精品制服美女丁香| 国内精品福利| 欧美视频在线不卡| 最新日韩av在线| 精品一区二区久久久| 黑人中文字幕一区二区三区 | 欧美国产一区视频在线观看| 日韩高清电影一区| 欧美日韩国语| 欧美日韩一级二级| 亚洲自拍偷拍综合| 91丨porny丨户外露出| 久久国产欧美精品| 国产精品久久久久三级| 国产成人综合视频| 久久精品一本| 亚洲欧美一区二区视频| 国产aⅴ精品一区二区三区色成熟| 亚洲高清视频一区| 欧美精品一区二区三区高清aⅴ | 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 国产精品videossex久久发布| 欧美日韩一区二区在线观看 | 在线不卡中文字幕播放| 亚洲电影第三页| 欧美精品一区二区视频 | 亚洲gay无套男同| 欧美成人高清| 久久伊人蜜桃av一区二区| 久久国内精品自在自线400部| 99国产精品| 国产精品全国免费观看高清 | 女人天堂亚洲aⅴ在线观看| 日韩精品一区二区三区在线观看 | 另类图片国产| 国产欧美日韩一区二区三区在线观看| 日韩av网站免费在线| 日韩午夜免费视频| 国产精品国产三级国产专播品爱网| 狠狠色丁香婷综合久久| 在线欧美一区二区| 欧美aaaaaa午夜精品| 国产精品一区二区三区免费观看| 国产精品视频线看| 色综合久久综合中文综合网| 欧美电影一区二区| 国产一区二区三区免费看| 在线精品视频一区二区三四| 日韩电影网1区2区| 久久亚洲美女| 日韩和欧美一区二区三区| 国产精品一级| 亚洲一区二区三区美女| 亚洲一区图片| 亚洲少妇30p| 一区二区三区精品国产| 亚洲一区在线观看免费 | 亚洲国产精品一区| 一区二区三区高清在线| 性伦欧美刺激片在线观看| 五月婷婷久久丁香| 欧美群妇大交群的观看方式| 美腿丝袜在线亚洲一区| 欧美性大战久久久久久久蜜臀| 另类中文字幕网| 欧美精品v国产精品v日韩精品| 国产一区二区三区久久久 | 2020国产精品| 国产成人一级电影| 欧美久久久久中文字幕| 国产精品一区二区黑丝| 欧美一区二区三区啪啪| 国产福利一区在线| 久久久久亚洲蜜桃| 亚洲精品社区| 婷婷成人激情在线网| 欧美日韩aaa| 成人永久aaa| 久久久蜜桃精品| 牛牛国产精品| 亚洲啪啪综合av一区二区三区| 久久青草久久| 日本欧美一区二区在线观看| 91精品国产综合久久久久久| 99久久精品免费看国产| 亚洲欧洲另类国产综合| 久久久久久夜| 国产成人免费视频精品含羞草妖精| 精品久久国产97色综合| 亚洲精品一区二区三区av| 久久国产麻豆精品| 国产色产综合色产在线视频| 一区二区日韩免费看| 国产精品一二三| 成人免费一区二区三区在线观看| 色综合久久88色综合天天免费| 懂色av中文一区二区三区| 一区二区三区日韩欧美| 6080yy午夜一二三区久久| 最新国产乱人伦偷精品免费网站| 亚洲色图制服诱惑 | 99在线热播精品免费| 亚洲成人一区二区| 欧美成人乱码一区二区三区| 91免费版pro下载短视频| 国产精品国产自产拍在线| 色噜噜狠狠一区二区三区果冻| 91美女精品福利| 免费高清在线一区| 日韩一区欧美一区| 7878成人国产在线观看| 日韩亚洲视频在线| jiyouzz国产精品久久| 日本欧美肥老太交大片| 欧美成人欧美edvon| 国产日韩欧美一区在线| 欧美激情第六页| 暖暖成人免费视频| 成人视屏免费看| 国产99一区视频免费| 国产一区二区不卡在线| 国产一区91精品张津瑜| 韩国av一区二区三区四区 | 久久xxxx精品视频| 久久99伊人| 久久国产精品一区二区三区|