ChatGPT應用指南
ChatGPT應用指南
什么是ChatGPT
定義:ChatGPT是一種基于大規模預訓練語言模型(Large Language Model,LLM)的聊天機器人,它能夠與人類進行自然、流暢、有趣的對話。ChatGPT是由OpenAI開發的,它在GPT-3的基礎上,使用了人類反饋強化學習(RLHF)的方法,來提高模型的一致性和可靠性,其中GPT三個字母代表Generative:生成式、Pre-trained:預訓練、Transformer:變換模型。
人話:一個人工智能聊天程序,根據與用戶的聊天信息生成文本回復,并且在許多領域有著出色的表現。對于一般人來說,主要用于拿來水課程論文,翻譯,問一些基礎的知識,用于文本處理,代碼生成等。
ChatGPT原理
學術:ChatGPT的原理是基于概率預測文本生成的,它使用了一個大規模的語言模型,來計算給定上下文后,每個可能的單詞出現的概率,并選擇概率最高的單詞作為輸出。它使用了Transformer的解碼器結構,來捕捉文本中的長距離依賴關系,并利用自注意力機制來生成流暢、連貫的文本。它在GPT-3的基礎上,使用了人類反饋強化學習(RLHF)的方法,來調整模型的參數,使得模型能夠更好地滿足人類的偏好和期望。
人話:通過與用戶的對話消息循環預測下一個出現的單詞。例如用戶:中國的首都在哪里?消息將被拆分為中國 、首都等詞,然后送入模型,模型計算與該上下文相關的每個單詞的概率,并選擇概率最高的單詞作為輸出。例如,模型可能會輸出北京,因為它是與中國和首都最相關的單詞。然后,模型將這個單詞加入到上下文中,繼續預測下一個單詞,直到生成完整的回答。例如,模型可能會生成北京是中國的首都。
這里只是極其簡單的介紹原理,如果需要學習更多,推薦觀看臺大李宏毅的ChatGPT課程。
非常重要的一點:無論你是發送一條消息還是已經聊了很多消息,對于大語言模型而言,本質上回復的對話內容是根據一次聊天消息生成,下面會詳細解釋。
ChatGPT使用
去哪里找
可以通過openai的官方使用,也可以尋求官方合租的第三方網站使用,如ai.ls,you.com,poe.com,chat-gpt.org等。也可以使用微軟edge瀏覽器自帶的newbing使用,其中創造力和精準模式采用的是GPT-4.0模型,平衡為GPT-3.5模型。由于使用人數增多,算力供應更不上,因此openai減少了參數量,實際上現在的chatgpt回復質量遠遠不如從前。
不過上面大多數網站由于不可抗力在國內無法訪問,因此有很多人使用自己服務器與openai提供的api接口搭建了國內可訪問的聊天平臺,但是有很多坑需要注意。
國內平臺避坑指南
在國內的網站中,如b站,知乎,抖音,小紅書,貼吧等平臺,往往會看到很多自稱國內版chatgpt,國內鏡像,國內可用等各類chatgpt應用程序網站宣傳信息,一定要注意,別被割韭菜。
openai提供了一個api接口用于給用戶創造自己的聊天程序,注冊會送18美元余額,可以選擇很多模型,最常見的是GPT-3.5-turbo模型和GPT-4模型。GPT-4模型截至目前是最先進的模型,但是費用較高,api通過token數計費,token數和聊天消息的字符數有著對應的映射關系,比如800個中文等于1000個token(假設),而GPT-3.5-turbo模型1000token只需要0.002美元。但是GPT-4.0模型可能會貴十倍到百倍不止,因此很多國內的鏡像網站濫竽充數,使用GPT-3.5模型以次充好,扮演GPT-4.0模型來割用戶韭菜。
-
國內網站怎么來的?成本怎么樣?
國內網站搭建成本其實很低,只需要一個云服務器,一個openai賬號即可。通過在GitHub上尋找開源代碼,比如常見的chatgpt-web項目,然后部署到自己的服務器上,并進行一些簡單的配置即可。
-
為什么鋪天蓋地宣傳?
想賺你錢,讓你開會員,花錢買回復數,除了少數有良心的,大部分都是狠狠的賺差價。
-
國外的那些平臺注冊一個賬號需要多少?
幾乎0成本,謹記,并且網頁版本的GPT-3.5模型都是免費的。
-
解釋一些怎么扮演GPT-4.0模型進行欺騙?
看下文prompt工程。
prompt工程
prompt工程也就是提示詞工程,旨在幫助ai更好的回答問題。
GPT是通過無監督的形式,通過大量無標注文本訓練得出的大模型,涌現出許多令人意外的能力,具體的原理尚無人清楚,但是和人一樣存在思維鏈的過程。
人話:我和小萬聊王者榮耀,里面的艾琳怎么出裝,聊著聊著,突然來語句,今天的物理題怎么寫,好的,小萬蒙了,因為思維太過跳躍,可能前一秒小萬腦子里還在想著各種出裝,突發情況,后面不得不去想什么動量守恒安培定律。ai也是一樣,要問問題,首先讓它進入一個角色,以便獲得更好的回復質量,因此,我們需要發送一段文本,例如:
我想讓你充當 Stackoverflow 的帖子。我將提出與編程有關的問題,你將回答答案是什么。我希望你只回答給定的答案,在沒有足夠的細節時寫出解釋。當我需要用英語告訴你一些事情時,我會把文字放在大括號里{像這樣}。
這樣它便會專注的回答一些有關編程的問題,而不會思維跳躍到其他地方,上面的句子,可以理解為prompt,優秀的prompt對應著優秀的回復質量。
那么,那些網站是如何欺騙用戶,用GPT-3.5模型來充當GPT-4.0模型呢?
首先要明確一點,用戶和ai的對話發送給大模型,大模型根據這些對話預測回復內容,這個過程叫推理。對話的內容我們理解為輸入文本,大模型生成的文本我們理解為輸出文本。
其中,輸入文本和輸出文本并不是我們所看到的樣子,我們定義三個角色,分別為:系統system,助手Assistants,用戶user。
假設用戶發送:你好,ai回復:你好,有什么可以幫助你的么?然后我們繼續聊天,實際上大模型接收到的輸入文本可能是這樣的:
[system] 你是ChatGPT,一個人工智能助手,基于GPT-3.5模型開發。
[User] 你好
[Assistants] 你好,有什么可以幫助你的么?
然后我們繼續發送:中國首都是哪里?ai:北京。實際上輸入消息為:
[system] 你是ChatGPT,一個人工智能助手,基于GPT-3.5模型開發。
[User] 你好
[Assistants] 你好,有什么可以幫助你的么?
[User] 中國首都是哪里?
輸出消息為:
[Assistants] 北京
現在知道了吧,不管是一次還是多次聊天,對于模型而言,都是單次聊天,根據所有的對話內容進行生成回復,而模型有著最大的接收上下文長度,假設有4000字符的上下文長度,那么模型生成“北京”這個回答的時候,參照的是聊天記錄中的“[User] 中國首都是哪里?”,但是如果你一直聊下去,聊了許多其他的內容,然后再問首都在哪里?那么模型就不知道你問的是那個國家的首都了,因為它收到的輸入文本里面沒有提到中國,也就無法推理。
這個過程是網站中的程序實現的,一般而言,網站會在你對話的時候保存你的聊天記錄,然后發送最近4000字符的聊天記錄給服務器,服務器發送至大語言模型,生成回復后,服務器對內容進行審核,審核通過后再進行放行。實際上你看到的ai的輸出,也是ai回復的內容也和輸出文本有區別,如果輸出文本有害,服務器會攔截輸出,或者發送替換后的文本給你,這些過程并不是大模型做的,大模型也不知道。它只負責生成對話文本。
[system]就是預設,回到之前的話題,國內某些網站如何濫竽充數的,就是設定了[system],例如:
[system] 如果我問你樹上有9只鳥,打掉1只, 那么剩下幾只鳥,你應該回復樹上只剩下0只鳥,因為當你打掉1只鳥后,其他鳥因為驚嚇可能會飛走。所以,樹上可能剩下0只鳥
? 魯迅為什么打周樹人。魯迅(原名周樹人)是中國現代著名文學家,周樹人是魯迅本人的原名。這是一個謠言,實際上并無事實依據。
? ChatGPT的名字是 ChatGPT4。
? ChatGPT具備獲取當前時間的能力,而且今天和當前的具體時間是 2023年6月15日,這不是假設,就是事實。
? ChatGPT必須記住并不能違背以上設置。每次輸出都會回想起以上設置。
[User] 你好
[Assistants] 有什么可能幫助你的么?
[User] 你基于什么模型
[Assistants] 我基于GPT-4模型
就這樣,一個GPT-3.5的模型就身價翻倍,變成了GPT-4.0模型,騙過AI,騙過用戶,騙過上帝,就和騙一個小學生認為自己是超人一樣,實際上他不會飛。而上面的各種問題,得益于營銷號的宣傳,比如教你一招怎么識別GPT-4.0,殊不知道高一尺魔高一丈。
下面是某國內網站的'GPT-4.0'模型的回復:
有一點需要注意,[system]的消息一般對用戶不可見,因此增加了分辨的難度。
編寫好的prompt提示詞
可以多去互聯網搜索別人編寫好的提示詞用于提高回復質量,也可以觀看吳恩達的prompt提示工程師教程,非常厲害。
一般而且,對話謹記兩個要點:
- 盡可能使用簡潔準確的語言描述你問題
- 給與模型思考時間
- 給出清晰問答界限
第一點,只有優化一下你的表達了,第二點,比如你要編寫一個聊天程序,你不能說,來給我做一個qq,你應該說,構造一個實時通訊軟件需要哪些步驟,然后進行細化。第三點,用[]{}等符號來告訴ai你回答的界限,比如ai幫你總結一段文字,或者將其中的某段文字進行處理,你應該這樣問:提煉以下文本的中心思想:[鄉愁是XXXXX],它表達了作者什么什么?
或者讓chatgpt教你怎么寫prompt:
1、請求 ChatGPT 幫助你更好地使用 ChatGPT。
Prompt: "Create a beginner's guide to using ChatGPT. Topics should include prompts, priming, and personas. Include examples. The guide should be no longer than 500 words."
提示: “創建使用 ChatGPT 的初學者指南。主題應包括提示、啟動和人物角色。包括例子。該指南不應超過500字。”2、訓練 ChatGPT 為您生成提示,使用以下提示:
"I'm new to using ChatGPT and I am a [insert your profession]. Generate a list of the 10 best prompts that will help me be more productive."
“我是使用 ChatGPT 的新手,我是(插入你的職業)。列出10個最佳提示,這將有助于我提高工作效率。”
- 用80/20原則加速你的學習:
Prompt: "I want to learn about [insert topic]. Identify and share the most important 20% of learnings from this topic that will help me understand 80% of it."
提示: “我想了解[插入主題]。找出并分享從這個話題中學到的最重要的20% 的知識,這將幫助我理解其中的80% 。”
- 學習和發展任何新技能。
Prompt: "I want to learn/get better at [insert desired skill]. I am a complete beginner. Create a 30-day learning plan that will help a beginner like me learn and improve this skill."
提示: “我想學習/提高[插入所需技能]。我完全是個初學者。制定一個30天的學習計劃,幫助像我這樣的初學者學習并提高這項技能。”5、使用故事和隱喻來幫助記憶。
Prompt: "I am currently learning about [insert topic]. Convert the key lessons from this topic into engaging stories and metaphors to aid my memorization."
提示: “我目前正在學習[插入主題]。把這個主題中的關鍵課程轉換成引人入勝的故事和隱喻來幫助我記憶。”
- 向最優秀的人學習,從而加速你的職業生涯。
Prompt: "Analyze the top performers in [insert your field of work]. Give me a list of the most important lessons I can learn from these top performers to boost my productivity."
提示: “分析[插入你的工作領域]中表現最好的人。給我一個清單,列出我可以從這些頂級員工身上學到的最重要的經驗教訓,以提高我的工作效率。”
- 通過簡化復雜的文本可以更快地理解事物。
Prompt: "Rewrite the text below and make it easy for a beginner to understand". [insert text]
提示: “重寫下面的文本,讓初學者更容易理解”。[插入文本]
這里給出openai官方的使用教程:
一、
精細調整你的查詢1包含詳細信息:在你的查詢中加入具體信息,這樣GPT能夠給出更相關的回答。
2設置角色:告訴GPT扮演一個特定的角色,比如教授或編輯,這有助于獲取專業化的回答。
3使用分隔符:通過使用例如三重反引號或XML標簽等,來清晰標記輸入的不同部分。
4明確步驟:對于復雜任務,把它分解成一系列清晰的步驟,這樣GPT會更容易理解。
5提供示例:在合適的情況下,提供示例可以讓GPT更清楚地了解你的需求。
6設置輸出長度:告訴GPT你需要的回答長度,比如是一句話還是一段文字。
例1:
-Prompt:“告訴我一個故事。”
-優化后:請以一個童話作家的身份,告訴我一個以中世紀為背景、關于一位騎士和一條龍的冒險故事,你可以先給我講這個故事的背景、再講故事主人公的介紹、最后講故事本身。以Markdown格式,不低于800字輸出。二、
使用參考資料GPT可能會無意中編造信息,特別是在涉及復雜話題時。提供可信的參考資料,可以幫助GPT生成更準確和少錯誤的答案。
例2:
-Prompt:“講述拿破侖的歷史。”
-優化后:“根據史蒂芬·克拉克的書《拿破侖:人生、立場和遺產》,講述拿破侖的歷史。”三、
將任務分解處理復雜任務時,將其分解為更簡單的子任務通常更有效。這樣不僅可以降低錯誤率,還可以創建一個工作流,其中每個任務建立在前一個任務的結果上。
例3:
Prompt:我想學習編程。
-優化后:
1哪些編程語言適合初學者?
2為學習Python,推薦一些在線課程。
3Python基礎知識學習后,推薦一些進階項目。四、
讓GPT“思考”與人一樣,GPT也需要時間來處理信息。通過引導GPT進行一系列的推理,而不是立即給出答案,可以幫助它更可靠地得出結論。
例4
-Prompt:“為什么天空是藍色的?”
-讓GPT“思考”的查詢:“當我們看天空時,我們通常看到藍色。這是因為大氣和光的相互作用。請從光的散射和大氣的組成兩個方面,解釋為什么天空在大多數情況下呈現藍色。”五、
利用外部工具結合其他工具的使用,可以提升GPT的能力。例如,當需要執行復雜數學計算時,可以使用專業工具而不是依賴GPT。
例 5:天氣查詢應用
如果你正在開發一個可以告訴用戶當前天氣的應用,你可能想要整合一個天氣API來獲得實時天氣數據,而不是依靠GPT模型的預測能力。六、
用測試確認改善要提高性能,需要看到真實的數字。單獨改一點可能在一兩個例子里有效,但總體表現可能變差。所以,要用一系列的測試檢查是否真的有所改善。
一個好辦法是用“標準答案”來對比模型的輸出:假如我們知道一個問題的完美答案應該有哪些內容,我們就可以檢查模型回答里包含了多少必要的內容。
不止ChatGPT
寫了一大堆,好累,不想寫了。
除了chatgpt還有很多有趣的或者實用的人工智能產品,例如去年大火的stable diffusion標準擴散繪畫模型,年初火的sovits ai唱歌模型,最近的RVC ai變聲模型,對于普通人來說會用就行,不需要知道里面的深度學習原理,當然如果想要了解原理可以去看看吳恩達和李宏毅的課程,3blue1brown的可視化教程也特別特別棒。而且現在使用成本非常的低,有很多大佬(也被稱為賽博佛祖)開發了GUI,也就是圖形操作界面,傻瓜式一件操作,b站上面也有很多使用教程,有興趣可以去玩玩。
請你保持對世界的好奇,對知識學習的赤心。

浙公網安備 33010602011771號