第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定

require(Rwordseg)分析案例展示(未去冠詞以及無(wú)意義的詞)

標(biāo)簽:
大數(shù)據(jù)

  看网络上很多朋友都在用“Rwordseg”程序包进行分词练习。我也忍不住进行了一次实验。
首先,肯定是装程序包了,个人感觉是废话,纯凑字数。
     如下是我进行的联系,在网上找了一篇关于范爷的专访,看看能看出来什么吧。
===========================================================================
#第一步,文本分词
require(Rwordseg)
test<- readLines("E:\\FBB1.txt",encoding='UTF-8')     #读取数据
res = test[test != " "]      #读取test,且剔除test=“ ”
words = unlist(lapply(X = res,FUN = segmentCN))   #分词,并调整表结构,将有相同词频的词归类
word = lapply(X = words,FUN = strsplit," ")       #给每个词根据顺序赋个顺序指
v = table(unlist(word))               #重建表
v = sort(v,deceasing=T)           #降序排列
v[1:100]
head(v)                                           #给每列字段赋标题
d = data.frame(word = names(v),freq = v)         #更改标题
write.csv(d,"E:\\学习.csv",header = T)          #导出数据,为下一步做准备
#第二部,做文本云图
require(wordcloud)
dd = tail(d,150)       #取数据框的最后150行数据
op = par(bg = "lightyellow")      #背景为亮黄色
#rainbowLevels = rainbow((dd$freq)/(max(dd$freq) - 10))      #不知道什么意义,删除后图形无太大变化
wordcloud(dd$word, dd$freq, col = rainbow(length(d$freq)))
par(op)
=====================================================================================
成图

 

===========================================================================
因为没有提出冠词等无意义的词语,所以可能也看不出来什么有意义的地方。大家权当一看。日后会有更深入的分析的。
分享: 


點(diǎn)擊查看更多內(nèi)容
TA 點(diǎn)贊

若覺(jué)得本文不錯(cuò),就分享一下吧!

評(píng)論

作者其他優(yōu)質(zhì)文章

正在加載中
  • 推薦
  • 評(píng)論
  • 收藏
  • 共同學(xué)習(xí),寫(xiě)下你的評(píng)論
感謝您的支持,我會(huì)繼續(xù)努力的~
掃碼打賞,你說(shuō)多少就多少
贊賞金額會(huì)直接到老師賬戶(hù)
支付方式
打開(kāi)微信掃一掃,即可進(jìn)行掃碼打賞哦
今天注冊(cè)有機(jī)會(huì)得

100積分直接送

付費(fèi)專(zhuān)欄免費(fèi)學(xué)

大額優(yōu)惠券免費(fèi)領(lǐng)

立即參與 放棄機(jī)會(huì)
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

舉報(bào)

0/150
提交
取消