文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽：158日期：2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1：

說的是什么意思？百思不得其解啊。。。

selenium自動化，click能模仿用戶點擊，就跟你自己在頁面上點擊一樣，一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有，那就先click再獲取源代碼。

Python 編程

上一條：Python從URL中提取域名下一條：python - sklearn如何訓練大規模數據集

相關文章：

1. css3 - rem布局下，用戶瀏覽器的最小字號是12px怎么辦？2. javascript - 循環嵌套多個promise應該如何實現？3. mysql優化 - 關于mysql分區4. css - 移動端字體設置問題5. html5 - 如何實現帶陰影的不規則容器？6. vue.js - vue 打包后 nginx 服務端API請求跨域問題無法解決。7. javascript - ionic2 input autofocus 電腦成功，iOS手機鍵盤不彈出8. node.js - 在vuejs-templates/webpack中dev-server.js里為什么要exports readyPromise?9. 前端 - IE9 css兼容問題10. objective-c - iOS開發支付寶和微信支付完成為什么跳轉到了之前開發的一個app?

排行榜

					
					docker綁定了nginx端口 外部訪問不到
windows - mongoVUE 連接MongoDB3.2.0可用不？？？？？
objective-c - iOS開發支付寶和微信支付完成為什么跳轉到了之前開發的一個app?
css3 - rem布局下，用戶瀏覽器的最小字號是12px怎么辦？
java - C語言算法題-韓信點兵  求解？
vue.js - vue 打包后 nginx 服務端API請求跨域問題無法解決。
mysql優化 - 關于mysql分區
javascript - 循環嵌套多個promise應該如何實現？
html5 - 如何實現帶陰影的不規則容器？
javascript - ionic2 input autofocus 電腦成功，iOS手機鍵盤不彈出
css - 移動端字體設置問題
				

熱門標簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

selenium - 請教一下 Python 爬蟲工具