6. RDD綜合練習(xí):更豐富的操作
一、集合運(yùn)算練習(xí)
union(), intersection(),subtract(), cartesian()

二、內(nèi)連接與外連接
join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin()
數(shù)據(jù):


多個(gè)考勤文件,簽到日期匯總,出勤次數(shù)統(tǒng)計(jì)
三、綜合練習(xí):學(xué)生課程分?jǐn)?shù)
網(wǎng)盤下載sc.txt文件,通過RDD操作實(shí)現(xiàn)以下數(shù)據(jù)分析:
- 持久化 scm.cache()

- 總共有多少學(xué)生?map(), distinct(), count()

- 開設(shè)了多少門課程?

- 生成(姓名,課程分?jǐn)?shù))鍵值對RDD,觀察keys(),values()

- 每個(gè)學(xué)生選修了多少門課?map(), countByKey()

- 每門課程有多少個(gè)學(xué)生選?map(), countByValue()
![]()
- 有多少個(gè)100分?

- Tom選修了幾門課?每門課多少分?filter(), map() RDD

- Tom選修了幾門課?每門課多少分?map(),lookup() lis

- Tom的成績按分?jǐn)?shù)大小排序。filter(), map(), sortBy()

- Tom的平均分。map(),lookup(),mean()

posted on 2022-04-19 22:00 熱心網(wǎng)友小鵬 閱讀(37) 評論(0) 收藏 舉報(bào)
浙公網(wǎng)安備 33010602011771號