亚洲AV国产福利精品在现观看,人妻av无码系列一区二区三区,久久亚洲精品11p

摘要：

dataset庫也是Hugging Face 提供的一個強大工具庫，用于加載、處理和操作大規模數據集。它支持多種格式（如 CSV、JSON、Parquet 等）以及在線數據集（如 Hugging Face Hub 上的數據集）。 Transformers庫通常與datasets庫一起使用來處理和準備閱讀全文

posted @ 2025-06-14 16:10 BricheersZ 閱讀(126) 評論(0) 推薦(0)

[置頂] 你應該懂的AI大模型（一）之淺知大模型

摘要：

1、AI 大模型的訓練過程 AI 大模型的訓練就如同讓一名孩童從不會說話一步步培養成高級知識分子或者專家的過程。第一步：收集數據，將海量的知識與文章收集起來作為學習資料教給這個孩子；第二步：預處理：去掉數據中的低質量的內容，整理成教材并形成一個“圖書館”；第三步：訓練模型：將“孩子”（模型）放閱讀全文

posted @ 2025-06-14 16:07 BricheersZ 閱讀(156) 評論(0) 推薦(0)

[置頂] 你應該懂的AI大模型（二）之大模型技術架構

摘要：

? 一、行業變化 Software is eating the world，but AI is going to eat software！ “軟件正在吞噬世界” 這一觀點由網景公司創始人馬克?安德森在 2011 年提出，意味著軟件在當今社會的各個領域發揮著至關重要的作用，極大地改變了人們的生活和工閱讀全文

posted @ 2025-06-14 16:07 BricheersZ 閱讀(103) 評論(0) 推薦(0)

[置頂] 你應該懂的AI大模型（三）之 RAG

摘要：

從本篇開始筆者會盡量多使用一些英文縮寫和單詞，不是筆者為了裝X，是為了大家在后面遇到的時候不至于被別人裝到。一、什么是RAG 1.1 大模型的局限性大模型的知識不是實時的，比如現在《藏海傳》已經完結了，但是我問deepseek給我的回答卻是：除了知識不是實時的之外，大模型可能也不知道你當前所在閱讀全文

posted @ 2025-06-14 16:06 BricheersZ 閱讀(170) 評論(0) 推薦(1)

[置頂] 你應該懂的AI大模型（四）之 LangChain

摘要：

這篇文章里面會有一些 python 代碼，能看懂就行，可能會有語法錯誤大家當偽代碼看吧， AI 應用開發也不會去敲這些代碼（甚至整個過程都不太需要敲代碼），文章中的這些代碼只是為了更好的理解這些組件，實際應用開發中大概率是見不到文中用來示例的這種代碼的。一、LangChain是什么 LangCha 閱讀全文

posted @ 2025-06-14 16:06 BricheersZ 閱讀(210) 評論(0) 推薦(0)

[置頂] 你應該懂的AI 大模型（五）之 LangChain 之 LCEL

摘要：

本文對《LangChain》一文中的 Chain 與 LCEL 部分的示例進行詳細的展示。先回顧下在LangChain框架中，Chain（鏈）和 LCEL（LangChain Expression Language）是兩個密切相關但本質不同的概念。 Chain（鏈）: 是LangChain 閱讀全文

posted @ 2025-06-14 16:05 BricheersZ 閱讀(298) 評論(0) 推薦(0)

[置頂] 你應該懂的AI大模型（六）之 transformers

摘要：

一、Transformer與transformers 結論：Transformer是模型架構，transfortmers是庫。問：為什么我們要知道Transformer與transformers呢？答：千問大模型和DeepSeek都是Transformer架構的，transformers庫就是為閱讀全文

posted @ 2025-06-14 16:04 BricheersZ 閱讀(312) 評論(0) 推薦(0)

2025年8月6日

你應該懂的AI大模型（十三）之推理框架

摘要：

? 在大語言模型（LLM）技術爆發的今天，從 ChatGPT 到開源的 LLaMA、Qwen 系列，模型能力不斷突破，但將這些 “智能大腦” 落地到實際業務中，卻面臨著效率、成本和部署復雜度的三重挑戰。此時，大模型推理框架成為了連接理論與實踐的關鍵橋梁。一、什么是大模型推理框架大模型推理框架是專閱讀全文

posted @ 2025-08-06 22:31 BricheersZ 閱讀(617) 評論(2) 推薦(0)

2025年7月3日

你應該懂的AI大模型（十二）之 QLoRA

摘要：

一、顯存和算力 1. 基本概念顯存 (Memory) 定義：GPU 用于臨時存儲數據的高速內存，類似于計算機的 RAM。作用：存儲模型權重、中間激活值、梯度和優化器狀態。數據在顯存與 GPU 核心之間快速傳輸以支持計算。衡量單位：GB (如 8GB、24GB)。算力 (Computati 閱讀全文

posted @ 2025-07-03 23:05 BricheersZ 閱讀(455) 評論(0) 推薦(0)

2025年7月2日

你應該懂的AI大模型（十一）之 LoRA

摘要：

LoRA 是什么? 傳統的大模型微調往往需要更新全部模型參數，這不僅消耗海量計算資源，還容易陷入過擬合陷阱。LoRA 另辟蹊徑，采用 “低秩分解” 策略，在不改動原始模型權重的前提下，通過添加兩個低秩矩陣（A 和 B）構建參數更新層。在訓練過程中，僅對這兩個低秩矩陣進行優化，使得可訓練參數數量相比全閱讀全文

posted @ 2025-07-02 23:55 BricheersZ 閱讀(373) 評論(0) 推薦(0)

你應該懂的AI大模型（十）之 LLamaFactory 之 LoRA微調Llama3

摘要：

本文標題中說的微調 Llama3指的是局部微調，使用 LLamaFactory 局部微調 LIama3。一、什么是LLamaFactory LLaMA-Factory 是一個開源的大型語言模型微調框架，全稱 Large Language Model Factory1。它致力于簡化大模型應用開發流程閱讀全文

posted @ 2025-07-02 23:49 BricheersZ 閱讀(632) 評論(0) 推薦(0)

2025年6月25日

你應該懂的AI大模型（九）之 Ollama

摘要：一、Ollama：讓大模型部署觸手可及 Ollama 是一款專注于簡化大語言模型部署流程的開源工具。它打破了大模型部署的技術壁壘，即使是沒有深厚 AI 背景的用戶，也能輕松在本地或遠程服務器上運行 Llama 2、Mistral、Llama3 等主流大語言模型。通過 Ollama，用戶無需手動搭建復閱讀全文

posted @ 2025-06-25 22:53 BricheersZ 閱讀(202) 評論(0) 推薦(0)

你應該懂的AI大模型（八）之微調之增量微調

摘要：一、什么是微調 1.1、什么是微調？為什么要做微調？模型微調（Fine-tuning）指的是將一個預訓練好的模型（通常在大規模通用數據集上訓練）針對特定任務或領域進行優化的過程。那么什么是預訓練好的模型呢？預訓練好的模型（Pre-trained Model）是指在大規模通用數據集上經過預先訓練閱讀全文

posted @ 2025-06-25 22:32 BricheersZ 閱讀(833) 評論(0) 推薦(0)

2025年6月14日

你應該懂的SpringCloud 之版本與組件

摘要：這邊文章筆者寫于一年前，之前發布在xxxx，哎，天下苦 xxxx久矣。一、SpringCloud 是什么？ 1、從架構演變開始講起單體架構作為一個整體，相較于SOA架構、微服務架構這種拆分的架構，還有兩個明顯的缺點：單體架構存在著因為一個bug而拖死整個系統的風險；單體架構無法針對某一類高峰業務閱讀全文

posted @ 2025-06-14 16:19 BricheersZ 閱讀(72) 評論(0) 推薦(0)

BricheersZ

公告