男人的天堂av社区在线,日韩中文字幕av有码,国产精品午夜福利合集

[置頂] 博客分類匯總

摘要：匯總一下，自己寫的博客分類，方便自己日常的學習與積累。更多AI內容，請關注本人公眾號 AI LLM 聊聊心理醫療領域大模型的落地思考聊聊大模型微調訓練全流程的思考聊聊ChatGLM-6B醫療數據微調聊聊大模型的微調實現及其應用 GLM及其相關系列聊聊ChatGLM-6B源碼分析(二) 聊聊閱讀全文

posted @ 2023-12-10 12:53 又見阿郎閱讀(176) 評論(0) 推薦(1)

[置頂] 聊聊基于AI模型MGeo實現行政區識別

摘要：從現今與今后的發展來看，單一的業務不再僅僅依靠于傳統的技術開發，而是應該結合AI模型來應用、實踐。只有這樣，才能更數智化，更高效化，更貼合時代的發展。魔塔社區就類似國外的Hugging Face，是一個模型即服務的運行平臺。在這個平臺上運行著很多的大模型示例，網站直接提供了試運行的環境，也可以下閱讀全文

posted @ 2023-11-11 22:58 又見阿郎閱讀(756) 評論(0) 推薦(2)

[置頂] 聊聊日志聚類算法及其在工作中的應用場景

摘要：隨著AI模型的普及應用與高速發展，主要的云廠商與AI大廠提供了對應的服務支持，使得業務的應用可以輕松對接AI算法，使其在實際項目中落地。我個人也是極度推崇在項目中應用AI算法更輕松更數智化的兌現功能。雖然AI門檻很高，但隨著時間的推移與AI模型的發展，我相信對于普通的程序猿來說，還是可以入手且實閱讀全文

posted @ 2023-07-22 19:14 又見阿郎閱讀(856) 評論(0) 推薦(0)

2025年2月7日

聊聊GRPO算法——從Open R1來看如何訓練DeepSeek R1模型

摘要：概述首發自個人公眾號：阿郎小哥的隨筆驛站 DeepSeek R1系列建議閱讀之前的系列文章：聊聊DeepSeek R1的一些總結聊聊DeepSeek R1的開源復現庫——Open R1之合成數據聊聊DeepSeek R1的知識蒸餾與應用思考簡介 GRPO 是一種在線學習算法，這意味著它通過閱讀全文

posted @ 2025-02-07 13:58 又見阿郎閱讀(8715) 評論(0) 推薦(1)

2024年6月12日

聊聊GLM-4-9B開源模型的微調loss計算

摘要：概述 Github官方地址：GLM-4 網上已經有很多關于微調的文章，介紹各種方式下的使用，這里不會贅述。我個人比較關心的是微調時的loss計算邏輯，這點在很多的文章都不會有相關的描述，因為大多數人都是關心如何使用之類的應用層，而不是其具體的底層邏輯，當然咱也說不清太底層的計算。可了解其它loss 閱讀全文

posted @ 2024-06-12 10:21 又見阿郎閱讀(783) 評論(0) 推薦(1)

2024年4月22日

聊聊從大模型來看NLP解決方案之UIE

摘要：轉載請備注出處：http://www.rzrgm.cn/zhiyong-ITNote 概述自然語言處理NLP任務的實現，相比較以前基于傳統機器學習算法實現方法，現在越來越集中使用大模型來實現。通過——數據標注-模型訓練-模型調優/微調-模型壓縮-預測部署的大模型流程，覆蓋NLP多場景滿足閱讀全文

posted @ 2024-04-22 08:42 又見阿郎閱讀(1157) 評論(0) 推薦(0)

2024年4月16日

聊聊大模型的屏蔽詞工程

摘要：轉載請備注出處：http://www.rzrgm.cn/zhiyong-ITNote 概述在做微調訓練時，鑒于業務場景的需要，可能會存在微調數據集中含有敏感詞匯，譬如：自殺、跳樓等。而開源模型可能沒有做敏感詞匯的屏蔽工程。因此可能就會出現不可預控的現象，而我遇到的是，當我輸入敏感詞匯時，模閱讀全文

posted @ 2024-04-16 10:03 又見阿郎閱讀(1886) 評論(0) 推薦(0)

2024年4月9日

聊聊ChatGLM3多用戶并發API調用的問題

摘要：轉載請備注出處：http://www.rzrgm.cn/zhiyong-ITNote 背景目前在公司內部4張A10的GPU服務器上部署了ChatGLM3開源模型；然后部署了官方默認的web_demo、api_demo兩種模式；重新設計了前端，支持H5和安卓兩個客戶端調用。但卻發現了不能并發閱讀全文

posted @ 2024-04-09 10:29 又見阿郎閱讀(885) 評論(1) 推薦(1)

2024年3月27日

聊聊大模型"打字機"效果的背后技術——SSE

摘要：轉載請注明出處：http://www.rzrgm.cn/zhiyong-ITNote SSE：Server Sent Event；服務器發送事件。 Server-Sent Events（SSE）是一種由服務器向客戶端推送實時數據的技術。它是構建基于事件的、服務器到客戶端的通信的一種方法，特別閱讀全文

posted @ 2024-03-27 19:46 又見阿郎閱讀(903) 評論(1) 推薦(0)

2024年3月26日

聊聊多模態大模型處理的思考

摘要：轉載請注明出處：http://www.rzrgm.cn/zhiyong-ITNote 多模態：文本、音頻、視頻、圖像等多形態的展現形式。目前部門內業務要求領域大模型需要是多模態——支持音頻/文本。從個人思考的角度來審視下，審視下多模態大模型的實現方式。首先就要區分輸入與輸出，即輸入的模態閱讀全文

posted @ 2024-03-26 17:08 又見阿郎閱讀(636) 評論(0) 推薦(0)

2024年3月25日

聊聊ShareGPT格式的微調數據集

摘要：轉載請注明住處：http://www.rzrgm.cn/zhiyong-ITNote 概述 ShareGPT格式的數據集中，一般是如下格式： [ { "conversations": [ { "from": "human", "value": "I saw a dress that I li 閱讀全文

posted @ 2024-03-25 09:59 又見阿郎閱讀(4593) 評論(0) 推薦(1)

2024年3月20日

聊聊心理醫療領域大模型的落地思考

摘要：轉載請注明出處：http://www.rzrgm.cn/zhiyong-ITNote 近來，工作偏向于心理醫療領域方面的大模型，僅從領域大模型的落地，聊聊個人的一些思考。硬件準備好花錢買GPU。領域大模型業務場景的思考首先需要審視斟酌業務領域的特殊性與可行性，我們要做的是心理領域，閱讀全文

posted @ 2024-03-20 21:36 又見阿郎閱讀(513) 評論(0) 推薦(1)

2024年3月18日

聊聊大模型微調訓練全流程的思考

摘要：轉載請注明出處：http://www.rzrgm.cn/zhiyong-ITNote 參考現有的中文醫療模型：MedicalGPT、CareGPT等領域模型的訓練流程，結合ChatGPT的訓練流程，總結如下：在預訓練階段，模型會從大量無標注文本數據集中學習領域/通用知識；其次使用{有監督微閱讀全文

posted @ 2024-03-18 16:16 又見阿郎閱讀(2766) 評論(2) 推薦(1)

又見阿郎

公告