99在线精品国自产拍中文字幕,亚洲情A成黄在线观看动漫尤物,亚洲一区中文字幕人妻

<output id="qn6qe"></output>

<output id="qn6qe"><tt id="qn6qe"></tt></output>

<strike id="qn6qe"></strike>

亚洲日本欧洲欧美视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

<kbd id="g2aju"><rp id="g2aju"></rp></kbd>

<meter id="g2aju"><p id="g2aju"></p></meter>

<sup id="g2aju"></sup>

<cite id="g2aju"><rp id="g2aju"><form id="g2aju"></form></rp></cite>

<cite id="g2aju"><track id="g2aju"></track></cite>

<cite id="g2aju"><track id="g2aju"></track></cite>

spark sql - data skew tuning

原始sql的寫法如下，可以跑成功但是跑了40分鐘。

select

user_id, site_id, cc_id

from tbl_1

left join tbl_2

on tbl_1.id = tbl_2.id;

查看job details, 發現其中一個stage跑了40分鐘，但是這個stage的其它task用了30就跑完了，只有一個task跑了40分鐘。

按照Shuffle Read Size從大到小的順序查看Executor列表，第一個Executor產出的記錄數是307million, 其它的Executor就少很多。

之后，sql改成如下, 運行時間縮短至10分鐘。

select

user_id, site_id, cc_id

from tbl_1

left join tbl_2

on tbl_1.id = tbl_2.id

where tbl_1.id = 'AA'

union all

select

user_id, site_id, cc_id

from tbl_1

left join tbl_2

on tbl_1.id = tbl_2.id

where tbl_1.id = 'BB'

union all

select

user_id, site_id, cc_id

from tbl_1

left join tbl_2

on tbl_1.id = tbl_2.id

where tbl_1.id is null or (tbl_1.id <> 'AA' and tbl_1.id <> 'BB')

;

總結：是什么提升了性能？

主鍵id有大量null值，導致相同的記錄數（相同的hash value）分配給同一個Executor，方案是把null值的記錄數單獨處理，并且保證沒有重復數據。

posted on 2025-07-07 17:01 dw2nn 閱讀(4) 評論(0) 收藏舉報

刷新頁面返回頂部

主站蜘蛛池模板：国产精品天干天干综合网| 国产亚洲精品VA片在线播放| 在线成人| 国产乱码精品一区二区三上| 国内不卡的一区二区三区| 国产成人一区二区不卡| 亚洲色婷婷一区二区| 福利成人午夜国产一区| 国产精品国产高清国产av| 亚洲鸥美日韩精品久久| 亚洲精品男男一区二区| 国产欧美日韩va另类在线播放| 最近2019中文字幕大全第二页| 国产人妻精品午夜福利免费| 又湿又紧又大又爽A视频男| 国产日韩综合av在线| 欧美综合自拍亚洲综合图| 九九热在线精品视频观看| 久久久久香蕉国产线看观看伊| 精品无码一区二区三区水蜜桃 | 美女又黄又免费的视频| 无码激情亚洲一区| 四虎永久地址www成人| 亚洲性日韩一区二区三区| 国产精品久久久久久久专区| 欧美精品一区二区三区在线观看| 天堂网在线观看| 亚洲精品日韩久久精品| 亚洲综合网国产精品一区| 在国产线视频A在线视频| 精品国产一区二区三区av性色| 亚洲欧美人成电影在线观看| 精品亚洲精品日韩精品| 亚洲日本欧美日韩中文字幕| 亚洲成av人在线播放无码| 99久久激情国产精品| 真人作爱90分钟免费看视频| 又污又黄又无遮挡的网站| 九九热在线免费精品视频| 天天爽夜夜爱| 色爱综合另类图片av|

<legend id="3udy5"><track id="3udy5"></track></legend>

<sub id="3udy5"></sub>