文章詳情頁(yè)

javascript - node爬取微博

瀏覽：209日期：2022-06-24 14:18:08

問題描述

剛接觸node,想寫個(gè)爬蟲，爬取新浪微博評(píng)論，但是發(fā)現(xiàn)頁(yè)面是由JS動(dòng)態(tài)生成的，用http模塊爬取不到，然后用phantomjs爬取，（聽說(shuō)會(huì)比較慢，運(yùn)行了近15分鐘，這也太慢了，不知是否寫錯(cuò)），還是不行，問一下有什么辦法能夠爬取類似于新浪微博的網(wǎng)頁(yè)嗎？

問題解答

回答1：

自己寫過微博的爬取,有兩種思路

仔細(xì)看一下應(yīng)該是有接口去獲取相應(yīng)數(shù)據(jù)的然后用正則去匹配

微博提供了開發(fā)者API接口的,雖然用著比較麻煩

微博

上一條：javascript - 微信小程序調(diào)用外部地圖程序下一條：javascript - vue-cli項(xiàng)目中，獲取微信access_token時(shí)遇到的跨域問題

相關(guān)文章：

1. macos - 無(wú)法source activate python272. 運(yùn)行python程序時(shí)出現(xiàn)“應(yīng)用程序發(fā)生異常”的內(nèi)存錯(cuò)誤？3. javascript - 微信 H5 授權(quán) 返回鍵4. github - 求助大神啊，win10 git clone error，折騰了幾天都不行，以前原本好好的，突然就這樣了5. android - 如何實(shí)現(xiàn)QQ pad 點(diǎn)擊右側(cè)輸入框，只頂右側(cè)的布局，左側(cè)布局不動(dòng)6. javascript - npm run build后調(diào)用api返回index.html7. css - 關(guān)于background-position百分比的問題？8. html - vue里面:src在IE（9-11）下不顯示圖片9. javascript - node得到req不能得到boolean10. 小白學(xué)python的問題關(guān)于%d和%s的區(qū)別

排行榜

					
					javascript - 微信 H5 授權(quán) 返回鍵
css - 關(guān)于background-position百分比的問題？
android - Genymotion 模擬器可以做屏幕適配檢測(cè)嗎？
javascript - npm run build后調(diào)用api返回index.html
css - angular前端如何讓ng-repeat的內(nèi)容并排一行，跑起來(lái)呢？
macos - 無(wú)法source activate  python27
運(yùn)行python程序時(shí)出現(xiàn)“應(yīng)用程序發(fā)生異常”的內(nèi)存錯(cuò)誤？
java - 處理數(shù)據(jù)關(guān)聯(lián)關(guān)系，使用數(shù)據(jù)庫(kù)表外鍵和代碼內(nèi)維護(hù)相比的優(yōu)缺點(diǎn)？
小白學(xué)python的問題 關(guān)于%d和%s的區(qū)別
android - 如何實(shí)現(xiàn)QQ pad  點(diǎn)擊右側(cè)輸入框，只頂右側(cè)的布局，左側(cè)布局不動(dòng)
github -  求助大神啊，win10 git clone error，折騰了幾天都不行，以前原本好好的，突然就這樣了
				

熱門標(biāo)簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

javascript - node爬取微博