<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12
      Fork me on GitHub

      一次XGBoost性能優(yōu)化-超線程影響運算速度

      一、問題背景

      1. 一個朋友在使用 XGBoost 框架進(jìn)行機(jī)器學(xué)習(xí)編碼,他們的一個demo, 在筆記本的虛擬機(jī)(4核)運行的時候,只要8s, 但是在一個64核128G 的物理機(jī)上面的虛擬機(jī)去跑的時候,發(fā)現(xiàn)時間需要更長。

        image-20220517103920522

        筆記本執(zhí)行:

        image-20220517104217425

      二、問題定位和解決

      首先看到負(fù)載是比較高的,內(nèi)存占用比較少。因為是計算型的,所以這種狀態(tài)是正常的。

      一開始我覺得是GIL 鎖,后面詢問是使用了 XGBoost 框架,想去官網(wǎng)看看能不能找到相關(guān)內(nèi)容

      XGBoost 多線程支持 文檔的一段話提醒了我:

      我們可以在具有更多核心的機(jī)器上運行相同的代碼。例如大型的 Amazon Web Services EC2 具有 32 個核心。我們可以調(diào)整上面的代碼來計算具有 1 到 32 個核心的模型所需的訓(xùn)練時間。結(jié)果如下圖。

      img

      XGBoost 在 1 到 32 個核心上訓(xùn)練模型所需的時間

      值得注意的是,在多于 16 個線程(大約 7 秒)的情況下,我們沒有看到太多進(jìn)步。我想其原因是 Amazon 僅在硬件中提供 16 個內(nèi)核,而另外的 16 個核心是通過超線程提供額外。結(jié)果表明,如果您的計算機(jī)具有超線程能力,則可能需要將 num_threads 設(shè)置為等于計算機(jī)中物理 CPU 核心的數(shù)量。

      示例: https://github.com/dmlc/xgboost/blob/master/demo/guide-python/sklearn_parallel.py

      我們通過示例將 n_job 的值調(diào)整為 cpu 核心的一半,

      n_jobs=multiprocessing.cpu_count()//2
      

      發(fā)現(xiàn)解決了問題

      image-20220517104911783

      posted @ 2022-05-29 15:54  自由早晚亂余生  閱讀(1259)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 国产精品第二页在线播放| 日韩高清亚洲日韩精品一区二区| 色道久久综合亚洲精品蜜桃| 少妇xxxxx性开放| 久久精品国产亚洲av忘忧草18| 无码人妻精品一区二区三区下载| 视频一区二区三区刚刚碰| 久久香蕉国产线看观看怡红院妓院 | 精品九九人人做人人爱| 亚洲中文字幕无码一久久区| 偷炮少妇宾馆半推半就激情| 怀远县| 伊人久久大香线蕉av色婷婷色| 翘臀少妇被扒开屁股日出水爆乳| 两个人日本www免费版| 国产精品久久久久7777| 国产精品中文字幕自拍| 久久午夜无码鲁丝片午夜精品| 在线看国产精品自拍内射| 国产精品一线天粉嫩av| 欧美乱妇狂野欧美在线视频| 亚洲成色精品一二三区| 久久亚洲av综合悠悠色| 国产免费久久精品99reswag| 秋霞电影网| 九九热视频在线精品18| 国产av一区二区三区| 精品福利一区二区三区免费视频 | 免费无码一区二区三区蜜桃大| 东方av四虎在线观看| 在线观看免费人成视频色| 中国帅小伙gaysextubevideo| 99久久精品费精品国产一区二 | 正在播放酒店约少妇高潮| 临沂市| 国产AV大陆精品一区二区三区 | 无码人妻精品一区二区三区夜夜嗨| 国产成人无码区免费内射一片色欲 | 99热这里只有精品免费播放| 国产极品精品自在线不卡| 野外做受三级视频|