摘要:
Apache Spark 2.2最近引入了高級的基于成本的優化器框架用于收集并均衡不同的列數據的統計工作 (例如., 基(cardinality)、唯一值的數量、空值、最大最小值、平均/最大長度,等等)來改進查詢類作業的執行計劃。均衡這些作業幫助Spark在選取最優查詢計劃時做出更好決定。這些優化的 閱讀全文
posted @ 2018-02-19 11:20
shishanyuan
閱讀(2985)
評論(0)
推薦(0)

浙公網安備 33010602011771號