第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

請問在node中如何實現(xiàn)http小爬蟲?

請問在node中如何實現(xiàn)http小爬蟲?

米琪卡哇伊 2018-08-02 16:05:23
在node中如何實現(xiàn)http小爬蟲
查看完整描述

2 回答

?
呼如林

TA貢獻1798條經驗 獲得超3個贊

//HTTP小爬蟲 2 //×××××類似 $.AJAX×××××× 3 4 5 var http = require('http'); //加載http模塊 6 7 var cheerio = require('cheerio');//加載第三方模塊 cheerio 類似JQuery 8 9 // 安裝方法 npm install cheerio10 11 12 function printCourseInfo(courseData) {//打印函數(shù) 傳入獲取數(shù)據13 courseData.forEach(function(item) {//循環(huán)打印14 var chapterTitle = item.chapterTitle;15 16 console.log(chapterTitle + '\n');17 18 item.videos.forEach(function(video) {19 console.log('[' + video.id + ']' + video.title + '\n');20 })21 })22 }23 24 25 function fliterChapters(html) {//數(shù)據篩選函數(shù)26 27 var $ = cheerio.load(html);28 29 var chapters = $('.chapter')//獲取元素30 31 32 //目標數(shù)據結構33 /* [{34 capterTitle:'',35 videos:'',36 id:''37 }]*/38 39 var courseData = [];//存放數(shù)組40 41 42 chapters.each(function(item) {43 var chapters = $(this);44 45 var chapterTitle = chapters.find('strong').text();46 47 48 var videos = chapters.find('.video').children('li');49 50 var chapterData = {51 chapterTitle: chapterTitle,52 videos: []53 }54 55 videos.each(function(item) {56 var video = $(this).find('.J-media-item');57 var videoTitle = video.text();58 var id = video.attr('href').split('video/')[1]59 60 61 chapterData.videos.push({62 title: videoTitle,63 id: id64 })65 })66 67 68 courseData.push(chapterData);69 })70 71 return courseData//數(shù)據拼接完成并返回72 73 }74 75 //目標url76 var url = 'http://idcbgp.cn/learn/348';//慕課網77 78 79 80 //使用get方法81 http.get(url, function(res) {//get方法爬取代碼82 var html = '';83 84 res.on('data', function(data) {//獲取數(shù)據事件85 html += data;86 })87 88 res.on('end', function() {//獲取結束事件89 var courseData = fliterChapters(html);90 91 printCourseInfo(courseData);92 })93 94 }).on('error', function() {95 console.log('獲取錯誤!');//報錯96 })

查看完整回答
反對 回復 2018-08-20
?
慕少森

TA貢獻2019條經驗 獲得超9個贊

你這個問題很大,簡單說下思路吧:在node里面發(fā)起一個http請求你訪問你需要爬的網站,得到返回的html文本之后,再做文本解析,得到你想要的內容就好了。

查看完整回答
反對 回復 2018-08-20
  • 2 回答
  • 0 關注
  • 854 瀏覽

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號