摘要:
通常講的數據倉庫ETL, 可以分為ETL和ELT兩種實現方式. ELT是在加載到倉庫后, 再做數據轉換. ETL 是在加載之前完成轉換, 落地的數據就是轉換后的樣子了.ELT多使用在MPP架構的數據倉庫平臺上, 比如Teradata, greenplum, 主要考慮點是, MPP數據倉庫數據處理能力強, 在加載后再做轉換, 可以充分利用這一優勢. 另外, Extract和Load過程很簡單, 且數據倉庫廠商提供unloading/loading的命令行工具一般具有并行處理能力, 所以直接用這些命令行工具滿足. 至于轉換部分過程, 多為通過sql查詢出stage區新加的記錄, 然后做一些運算, 閱讀全文
posted @ 2012-04-05 23:11
harrychinese
閱讀(12453)
評論(0)
推薦(0)
摘要:
python module of the week 系列(每篇都很棒, 我僅僅看完了abc和sqlite兩個章節, 講的非常透徹)http://www.doughellmann.com/PyMOTW/contents.htmlpythonlibary.org上的tourial講的很簡潔易懂http://www.blog.pythonlibrary.org/tag/python還有effbot.org的tips和faq, 到底是大師http://effbot.org/pyfaq/programming-index.htm這個網站內容組織得也不錯, http://docs.python-guide 閱讀全文
posted @ 2012-04-05 22:21
harrychinese
閱讀(604)
評論(0)
推薦(0)

浙公網安備 33010602011771號