node.js - node async寫(xiě)的爬蟲(chóng)小程序請(qǐng)求高手指導(dǎo)
問(wèn)題描述
var cnodeUrl = 'https://segmentfault.com/';// 存放所有主題鏈接鏈接var topicUrls = [];/** * 所有的url請(qǐng)求完成后,ep控制異步結(jié)束,進(jìn)入每一個(gè)主題 */ep.after(’topic_html’, topicUrls.length, function(topics) { var concurrencyCount = 0; // 記錄并發(fā)數(shù) /** * 進(jìn)入主題,取得題目 * @callback topics [{title:’’}] */ var fetchUrl = function(myurl, callback) {var fetchStart = new Date().getTime();concurrencyCount++;console.log(’現(xiàn)在的并發(fā)數(shù)是’, concurrencyCount, ’,正在抓取的是’, myurl);superagent.get(myurl).end(function(err, ssres) { if (err) {callback(err, myurl + ’ error happened!’); } var time = new Date().getTime() - fetchStart; console.log(’抓取 ’ + myurl + ’ 成功’, ’,耗時(shí)’ + time + ’毫秒’); concurrencyCount--; var $ = cheerio.load(ssres.text); var reslut = {title: $(’.question__author>a>strong’).text(),answer: $(’#answers-title’).text() }; callback(null, result);}) } // 控制最大并發(fā)數(shù)為5,在結(jié)果中取出callback返回來(lái)的整個(gè)結(jié)果數(shù)組。 async.mapLimit(topicUrls, 5, function (myurl, callback) {fetchUrl(myurl, callback); }, function (err, result) {console.log(’===== result: ======n’, result);//res.send(result); });})// 獲得所有主題鏈接 topicUrlssuperagent.get(cnodeUrl).end(function(err, sres) { if(err) {return next(err); } var $ = cheerio.load(sres.text); $(’.stream-list’).each(function(idx, element) {var $element = $(element).find(’.title>a’);var href = url.resolve(cnodeUrl, $element.attr(’href’));topicUrls.push(href); }) console.log(’get authorUrls successful!n’, topicUrls); ep.emit(’topic_html’, ’get topicUrls successful’);})
得到的結(jié)果是:

請(qǐng)教一下哪里出了問(wèn)題?
問(wèn)題解答
回答1:重寫(xiě)了下:
var async = require(’async’);var cheerio = require(’cheerio’);var superagent = require(’superagent’);var url = require(’url’);var cnodeUrl = 'https://segmentfault.com/';// 存放所有主題鏈接鏈接var topicUrls = [];// 獲得所有主題鏈接 topicUrlssuperagent.get(cnodeUrl).end(function(err, sres) { if(err) {return next(err); } var $ = cheerio.load(sres.text); $(’.stream-list__item’).each(function(idx, element) {var $element = $(element).find(’.title>a’);var href = url.resolve(cnodeUrl, $element.attr(’href’));topicUrls.push(href); }) // 控制最大并發(fā)數(shù)為5,在結(jié)果中取出callback返回來(lái)的整個(gè)結(jié)果數(shù)組。 async.mapLimit(topicUrls, 5, function (myurl, callback) {fetchUrl(myurl, callback); }, function (err, result) {console.log(’===== result: ======’, result); });})function fetchUrl(myurl,callback) { var fetchStart = new Date().getTime(); superagent.get(myurl).end(function(err, ssres) {if (err) { callback(err, myurl + ’ error happened!’);}var time = new Date().getTime() - fetchStart;console.log(’抓取 ’ + myurl + ’ 成功’, ’,耗時(shí)’ + time + ’毫秒’);// concurrencyCount--;var $ = cheerio.load(ssres.text);var reslut = { title: $(’.question__author>a>strong’).text(), answer: $(’#answers-title’).text()};callback(null, reslut); })}
你上面的代碼,我感覺(jué)你是參考
https://github.com/alsotang/node-lessons/blob/master/lesson4/app.js
這個(gè)課程寫(xiě)的吧,應(yīng)該是你用的eventproxy方式不正確
相關(guān)文章:
1. 我在導(dǎo)入模板資源時(shí)遇到無(wú)法顯示的問(wèn)題,請(qǐng)老師解答下2. 運(yùn)行python程序時(shí)出現(xiàn)“應(yīng)用程序發(fā)生異常”的內(nèi)存錯(cuò)誤?3. html - 網(wǎng)頁(yè)的a標(biāo)簽到底要不要寫(xiě)上域名?4. css - 移動(dòng)端 盒子內(nèi)加overflow-y:scroll后 字體會(huì)變大5. thinkphp6使用驗(yàn)證器 信息如何輸出到前端頁(yè)面6. javascript - h5微信中怎么禁止橫屏7. macos - 無(wú)法source activate python278. python - sqlalchemy更新數(shù)據(jù)報(bào)錯(cuò)9. html5 - 前端面試碰到了一個(gè)緩存數(shù)據(jù)的問(wèn)題,來(lái)論壇上請(qǐng)教一下10. PHPExcel表格導(dǎo)入數(shù)據(jù)庫(kù)怎么導(dǎo)入

網(wǎng)公網(wǎng)安備