關(guān)于大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)輿情引導(dǎo)與分析方法如下:
一、通過相關(guān)樣本庫,把需要監(jiān)測的網(wǎng)頁進(jìn)行模板匹配,并設(shè)定為監(jiān)測數(shù)據(jù)源;
二、應(yīng)用 爬蟲程序抓取數(shù)據(jù),存儲到本地,再進(jìn)行數(shù)據(jù)的凈化和簡略的分析;
三、利用簡單的圖表模板和文字描述,呈現(xiàn)監(jiān)測和分析的結(jié)果。早期的網(wǎng)絡(luò)輿情引導(dǎo)監(jiān)測方式有一些原生的問題,譬如:一、由于處理能力有限,只能抽取部分樣本進(jìn)行監(jiān)測,無法避免偶然誤差;二、文本分析算法的準(zhǔn)確度、 監(jiān)測對象和系統(tǒng)模板匹配的程度、對數(shù)據(jù)的凈化,以及分析的算法等因素對于最后監(jiān)測結(jié)果的準(zhǔn)確度都有決定性的影響,無法避免系統(tǒng)誤差;
四、輿情引導(dǎo)與分析主體應(yīng)學(xué)會充分利用大數(shù)據(jù)挖掘系統(tǒng),蟻坊軟件方面的大數(shù)據(jù)輿情監(jiān)測管理系統(tǒng),實(shí)現(xiàn)了從網(wǎng)絡(luò)輿情信息的采集與提取,到話題的發(fā)現(xiàn)與追蹤、態(tài)度傾向性分析,再到多文檔自動摘要的生成,為網(wǎng)絡(luò)輿情的安全評估提供了有效的輿情信息獲取和分析方法。不過,由于“輿情”本身具有“社會”特性,數(shù)字和代碼等信息背后的實(shí)體是生存在現(xiàn)實(shí)社會中的蕓蕓眾生。除了純技術(shù)角度對輿情進(jìn)行量化考察,傳統(tǒng)的社會民意調(diào)查方式對實(shí)現(xiàn)全面、立體、動態(tài)透析社會綜合輿情亦有一定幫助。
數(shù)據(jù)分析—數(shù)據(jù)的核心是發(fā)現(xiàn)價(jià)值,而駕馭數(shù)據(jù)的核心是分析,分析是大數(shù)據(jù)實(shí)踐研究的最關(guān)鍵環(huán)節(jié),尤其對于傳統(tǒng)難以應(yīng)對的非結(jié)構(gòu)化數(shù)據(jù)。運(yùn)營商利用自身在運(yùn)營網(wǎng)絡(luò)平臺的優(yōu)勢,發(fā)展大數(shù)據(jù)在網(wǎng)絡(luò)優(yōu)化中的應(yīng)用,可提高運(yùn)營商在企業(yè)和個人用戶中的影響力。