最贊回答 / 無概念
它們都支持流式計算,F(xiàn)ink是一行一行處理,是基于操作符的連續(xù)流模型,而Spark是基于數(shù)據(jù)片集合(RDD)進(jìn)行小批量處理,所以Spark在流式處理方面會增加一些延遲。Flink可以支持毫秒級計算,而Spark則只能支持秒級計算。如果是要求對實時性要求非常高的場景(如高頻實時交易),Spark是難以滿足的,可以考慮Flink或Storm。
2020-10-28
最贊回答 / 莊學(xué)爸
好吧,自問自答,懂了。視頻上說sliding size為5s,其實就是每隔5s計算一次最近30s出現(xiàn)的數(shù)據(jù),那么肯定數(shù)據(jù)是會重疊的,因為滑動窗口之間的時間線會有重疊。?
2020-06-27
講師回答 / 大數(shù)據(jù)技術(shù)與架構(gòu)
你好,我才看到你的留言。這個問題比較可能是因為:你這個類中import的是不是StreamExecutionEnvironment,或者看看Tuple2是不是引用對了。
2019-02-13