只有注冊用戶登錄后才能閱讀該文。 閱讀全文
posted @ 2018-04-01 18:49
Huidoo_Yang
閱讀(29)
評論(0)
推薦(0)
摘要:
一、RDD概念與特性 1. RDD的概念 RDD(Resilient Distributed Dataset),是指彈性分布式數據集。數據集:Spark中的編程是基于RDD的,將原始數據加載到內存變成RDD,RDD再經過若干次轉化,仍為RDD。分布式:讀數據一般都是從分布式系統(tǒng)中去讀,如hdfs、k 閱讀全文
posted @ 2018-04-01 15:16
Huidoo_Yang
閱讀(1357)
評論(0)
推薦(2)

浙公網安備 33010602011771號