第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

GraphX構(gòu)建圖的時候,頂點數(shù)增多了是為什么,求教!

GraphX構(gòu)建圖的時候,頂點數(shù)增多了是為什么,求教!

炎炎設(shè)計 2018-08-22 10:09:49
剛開始接觸GraphX,拿到了一份類似用戶關(guān)注的測試數(shù)據(jù)。用戶ID10000條,對應(yīng)10000個節(jié)點。用戶關(guān)系的數(shù)量不明。數(shù)據(jù)格式如下:建圖代碼如下:import org.apache.spark.graphx.Edgeimport org.apache.spark.graphx.Graphval vertexRdd = sc.textFile("hdfs://ubt1:9820/WBNW/Vertex")val edgeRdd = sc.textFile("hdfs://ubt1:9820/WBNW/Edge")val users = vertexRdd.map(line => line.split(",")).map(parts => (parts(0).toLong, parts(1)))val follow_relation = edgeRdd.map(line => line.split(",")).map(parts => new Edge(parts(0).toLong,parts(1).toLong,parts(2).toLong))val graph = Graph(users, follow_relation)val v_count = vertexRdd.countval e_count = edgeRdd.countval gv_count = graph.vertices.countval ge_count = graph.edges.count輸出結(jié)果如下:發(fā)現(xiàn)邊的數(shù)量在Rdd與Graph中相同,點卻明顯不一致。請問是什么原因,謝謝各位。
查看完整描述

1 回答

?
牧羊人nacy

TA貢獻1862條經(jīng)驗 獲得超7個贊

是edgeRdd中有很多點是vertex中沒有的,通過設(shè)置VD的defaultvaule再做filter得到?jīng)]有屬性的vertex數(shù)量正好為548529

查看完整回答
反對 回復(fù) 2018-09-11
  • 1 回答
  • 0 關(guān)注
  • 787 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號