<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      【推理引擎:核心原理】系列來啦!從入門到昇騰!

      哎,當年作為核心SE在MindSpore團隊從0到1構建了MindSpore Lite推理引擎,到去年知道的信息是現在在華為和榮耀手機上的AI能力都是基于Lite推理引擎,調用次數10億/天。
       
      所以就基于之前的工作,總結了《AI推理引擎:核心原理》這個系列的內容:從推理系統整體架構開始,然后到模型小型化、模型壓縮,在真正推理之前需要進行模型轉換和圖優化,最后到kernel和runtime優化。還是很有意思的,也花了很多時間,希望能夠幫助到大家啦!!!

      在講推理引擎/推理系統,又或者是推理部署之前呢,我們回顧下訓練和推理的區別 ^_^
       
      訓練過程通過設定數據處理方式,并設計合適的網絡模型結構以及損失函數和優化算法,在此基礎上將數據集以小批量(mini-batch)反復進行前向計算并計算損失,然后反向計算梯度利用特定的優化函數來更新模型,來使得損失函數達到最優的結果。訓練過程最重要的就是梯度的計算和反向傳播。
       
      而推理就是在訓練好的模型結構和參數基礎上,做一次前向傳播得到模型輸出的過程。相對于訓練而言,推理不涉及梯度和損失優化。推理的最終目標是將訓練好的模型部署生產環境中。真正讓 AI 能夠運用起來。推理引擎可以將深度學習模型部署到云(Cloud)端或者邊緣(Edge)端,并服務用戶的請求。模型訓練過程好比是傳統軟件工程中的代碼開發的過程,而開發完的代碼勢必要打包,部署給用戶使用,那么推理系統就負責應對模型部署的生命周期中遇到的挑戰和問題。
       
      當推理系統將完成訓練的模型進行部署,并在服務時還需要考慮設計和提供負載均衡,請求調度,加速優化,多副本和生命周期管理等支持。相比深度學習框架等為訓練而設計的系統,推理系統不僅關注低延遲,高吞吐,可靠性等設計目標,同時受到資源,服務等級協議(Service-Level Agreement),功耗等約束。本章將圍繞深度學習推理系統的設計,實現與優化內容展開,同時還會在最后介紹部署和 MLOps 等內容。
       
      移動端的推理引擎應該挺多的了,google在2017年推出了TF-Lite,騰訊在2017年推出了ncnn,Apple在2017也推出了CoreML,阿里在2018年推出了MNN,華為2019年推出了MindSpsore-Lite。距今已經過去了快5年的時間,技術上也接近收斂。下面讓我們一起打開推理引擎的技術吧!
      系列內容
      • 《推理系統》推理系統是本分享的重點概述,推理就是在訓練好的模型結構和參數基礎上,執行前向傳播得到模型輸出的過程。相對于訓練而言,推理不涉及梯度和損失優化。推理的最終目標是將訓練好的模型部署生產環境中,真正讓 AI 能夠運用起來。推理引擎可以將深度學習模型部署到云(Cloud)端或者邊緣(Edge)端,并服務用戶的請求。模型訓練過程好比是傳統軟件工程中的代碼開發的過程,而開發完的代碼勢必要打包,部署給用戶使用,那么推理系統就負責應對模型部署的生命周期中遇到的挑戰和問題。
      • 《輕量網絡》在端側推理引擎中,主要是執行輕量的模型結構。主要思想是針對神經網絡模型設計更高效的網絡計算方式,從而使神經網絡模型的參數量減少的同時,不損失網絡精度,并進一步提高模型的執行效率。本節主要集中介紹模型小型化中需要注意的參數和指標,接著深入了解CNN經典的輕量化模型和Transformer結構的輕量化模型。
      • 《模型壓縮》模型壓縮跟輕量化網絡模型不同,壓縮主要是對輕量化或者非輕量化模型執行剪枝、蒸餾、量化等壓縮算法和手段,使得模型更加小、更加輕便、更加利于執行。
      • 《模型轉換&優化》在這一節當中分為模型轉換和模型優化,在整體架構圖中屬于離線模型轉換模塊。一方面,推理引擎需要把不同 AI 框架訓練得到的模型進行轉換;另外一方面需要對轉換后的模型進行圖優化等技術。
      • 《Kernel優化》在上層應用或者 AI 網絡模型中,看到的是算子;但是在推理引擎實際執行的是具體的 Kernel,而推理引擎中 CNN 占據了主要是得執行時間,因此其 Kernel 優化尤為重要。
      希望這個系列能夠給大家、朋友們帶來一些些幫助,也希望自己能夠繼續堅持完成所有內容哈!
       
      然這里不是打廣告,而是希望跟所有關注開源項目的好朋友一起探討研究,共同促進學習討論,也歡迎各位專家和朋友多拍拍磚,多提點意見。相關的材料都開源在這里:
       
       
      ?
      具體大綱
       
      通過《推理引擎:核心原理》系列,我們會給大家介紹下面一些內容:
       
      名稱
      具體內容
      推理系統
      推理系統整體介紹,推理引擎架構梳理
      輕量網絡
      輕量化主干網絡,MobileNet等SOTA模型介紹
      模型壓縮
      模型壓縮4件套,量化、蒸餾、剪枝和二值化
      模型轉換&優化
      AI框架訓練后模型進行轉換,并對計算圖優化
      Kernel優化
      Kernel層、算子層優化,對算子、內存、調度優化
      1. 推理系統
      1. 推理內容介紹(video
      2. 什么是推理系統(video
      3. 推理流程全景(video
      4. 推理系統架構(video
      5. (上) 推理引擎架構(video
      6. (下) 推理引擎架構(video
      2. 模型小型化
      1. 推理參數了解(video
      2. (上) CNN模型小型化(video
      3. (下) CNN模型小型化(video
      4. Transformer小型化(video
      3. 模型壓縮
      1. 壓縮四件套介紹(video
      2. 低比特量化原理(video
      3. 感知量化訓練 QAT(video
      4. 訓練后量化PTQ與部署(video
      5. 模型剪枝(video
      6. (上) 知識蒸餾原理(video
      7. (下) 知識蒸餾算法(video
      4. 模型轉換
      1. 基本介紹(video
      2. 架構與文件格式(video
      3. 自定義計算圖IR(video
      4. 流程細節(video
      5. 圖優化模塊
      1. 計算圖優化策略(video
      2. 常量折疊&冗余節點消除(video
      3. 算子融合/替換/前移(video
      4. 數據布局轉換&內存優化(video
      6. Kernel優化
      1. Kernel優化架構(video
      2. 卷積操作基礎原理(video
      3. Im2Col算法(video
      4. Winograd算法(video
      5. QNNPack算法(video
      6. 推理內存布局(video
      完結,撒花!
      posted @ 2023-03-03 13:29  ZOMI醬醬  閱讀(1212)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 99中文字幕国产精品| 淮安市| 亚洲无av在线中文字幕| 中文字幕久久六月色综合| 久久青青草原亚洲AV无码麻豆| 亚洲色一区二区三区四区| 日本不卡码一区二区三区| 福利一区二区不卡国产| 国産精品久久久久久久| 撕开奶罩揉吮奶头视频| 久久亚洲精品人成综合网| 亚洲成人av综合一区| 久久99国产精品尤物| 欧美日韩国产图片区一区| 亚洲午夜成人精品电影在线观看| 汶川县| 久久这里只精品热免费99| 日韩成人福利视频在线观看| 亚欧洲乱码视频一二三区| 国产午夜福利短视频| 无遮挡午夜男女xx00动态| 中文字幕理伦午夜福利片| 亚洲人成电影网站色mp4| 天天爽夜夜爱| 蜜桃av多人一区二区三区| 狠狠亚洲色一日本高清色| 一区二区在线观看 激情| 國產尤物AV尤物在線觀看| 精品乱码一区二区三四五区| 亚洲真人无码永久在线| 在线观看无码av五月花| 无遮无挡爽爽免费视频| 国产片AV国语在线观看手机版| 国产一精品一av一免费| 久久碰国产一区二区三区| 久久青草国产精品一区| 国产美女被遭强高潮免费一视频| 丰满多毛的大隂户视频| 成年女人片免费视频播放A| 国产精品一区二区三区自拍| 国产偷自视频区视频|