GPT5寫5000行代碼,行不行?
GPT5干活扭捏,甚至還想催我搬磚。
一、簡(jiǎn)介
這幾天,試過用國(guó)內(nèi)幾款大模型寫代碼:DeepSeek、Kimi、千問、智譜清言。
測(cè)試中最復(fù)雜的問題是這樣:
使用前端編程語(yǔ)言,開發(fā)一款復(fù)雜的Web網(wǎng)站,涉及大模型信息采集和展示;進(jìn)行數(shù)據(jù)分析,給用戶提供有價(jià)值的參考;做一個(gè)社區(qū)板塊,可以交流各種模型的使用案例;總共分為3個(gè)模塊,每個(gè)模塊都要填充一定的模擬數(shù)據(jù),并且支持全站檢索功能;視覺追求創(chuàng)意和科技感;考慮問題的復(fù)雜性,需要先設(shè)計(jì)工程架構(gòu)再編寫代碼。代碼輸出5000行左右,完整的放在一個(gè)html文件中,可以直接預(yù)覽。
最終,幾款大模型都沒有達(dá)到5000行的要求,但是會(huì)輸出它們各自能達(dá)到的最大行數(shù),并且呈現(xiàn)的頁(yè)面效果也算ok。
上周,GPT5發(fā)布了,于是帶著這個(gè)老問題,讓GPT5也試試5000行的代碼。
先說結(jié)論:GPT5雖能以頂尖代碼能力輸出完整成果,但需動(dòng)態(tài)調(diào)整資源以維持長(zhǎng)序列生成的穩(wěn)定性。
二、編碼測(cè)試過程
測(cè)試在Augment插件中,使用的GPT-5模型

以下是Prompt提示詞;
用html5和css3,在當(dāng)前項(xiàng)目中,寫一個(gè)創(chuàng)意科技風(fēng)的網(wǎng)站,內(nèi)容是AI相關(guān)信息,輸出大概5000行代碼
它并不會(huì)像之前的AI模型一樣,直接輸出,而是會(huì)給出一個(gè)提綱,讓開發(fā)者來確認(rèn)是否可行。
我只想讓它測(cè)一個(gè)demo,看看它輸出的能力邊界。對(duì)于內(nèi)容沒有任何思路,想全靠它自由發(fā)揮,我覺得這種提綱和確認(rèn)是有點(diǎn)“多余”的。以下是它給出的提綱摘要:
...
請(qǐng)確認(rèn)以下選項(xiàng):
- 站點(diǎn)語(yǔ)言:中文為主可以嗎?
- 主題風(fēng)格:霓虹/賽博朋克 + 玻璃擬態(tài)(半透明+毛玻璃)+ 漸變背景,可以?
- 站點(diǎn)結(jié)構(gòu)(多頁(yè)):主頁(yè)、關(guān)于 AI、應(yīng)用場(chǎng)景、研究與論文、新聞/趨勢(shì)、倫理與安全、術(shù)語(yǔ)表、資源與工具、畫廊(CSS 動(dòng)效展示)、聯(lián)系我們。OK?
- 是否需要包含任何交互?你要求僅 HTML+CSS,我會(huì)用純 CSS 的動(dòng)畫與“checkbox hack”實(shí)現(xiàn)導(dǎo)航展開、FAQ 折疊等,不用 JS,可以嗎?
- 顏色偏好:藍(lán)紫青高對(duì)比(科技感)可以嗎?或告訴我你的主色值(如 #7C3AED 紫、#06B6D4 青等)
確認(rèn)后我將:
- ...
- ...
- ....
- ....
請(qǐng)回復(fù)你的偏好(尤其是顏色與是否中文),我就開始落地實(shí)現(xiàn)并生成文件。
其中這種完全可以在執(zhí)行過程中輸出,告知開發(fā)者它選擇的風(fēng)格和色調(diào)等關(guān)鍵信息。這種情況在Claude Sonnet 4模型中就不會(huì)出現(xiàn)。
待我確認(rèn)好信息后,它開始干活。首先它會(huì)告訴我:
我將分多步創(chuàng)建多頁(yè)靜態(tài)站點(diǎn)與樣式文件,確保每個(gè)文件在300行以內(nèi)但總體約5000行。先搭好樣式與共享結(jié)構(gòu),再逐頁(yè)填充內(nèi)容。開始創(chuàng)建樣式文件。
開始就會(huì)給此次任務(wù)定了整體的基調(diào):分批執(zhí)行。
會(huì)話執(zhí)行完畢后,會(huì)在最后總結(jié),1、已完成內(nèi)容。2、下一步執(zhí)行計(jì)劃。3、需要開發(fā)者確認(rèn)的信息(針對(duì)下一步的輸出)。不過,第三步有時(shí)候也不會(huì)輸出,可能它自己替我做了決定吧。
于是,從上午9點(diǎn)左右,到下午1點(diǎn)多,經(jīng)過了15輪拉扯,它終于完整輸出了這個(gè)demo。效果尚可,點(diǎn)擊順暢,除了一些樣式細(xì)節(jié)需要優(yōu)化,沒有明顯的bug。
下面是最終輸出的部分效果圖;



總體來說:GPT-5智能提升多少很難說,相信后面更深度的體驗(yàn)才能感受到它的優(yōu)缺點(diǎn)。從目前的感受而已,很有主動(dòng)性,積極建議下一步動(dòng)作,感覺多了一個(gè)催我干活的隊(duì)友。
三、寫在最后
對(duì)比國(guó)內(nèi)的大模型而言,GPT-5它會(huì)抓住核心的需求:5000行,并且貫徹地執(zhí)行下去,最終給出的結(jié)果也是過關(guān)的。而不是選擇降級(jí),弱化需求輸出結(jié)果。
如果是真正的需求,相信它也會(huì)實(shí)打?qū)嵔o出自己的思路,行就是行,不行也得解釋原因。(后面會(huì)深度體驗(yàn)一把用GPT-5做真實(shí)的項(xiàng)目開發(fā))。
模型測(cè)評(píng)Git倉(cāng)庫(kù)
https://gitee.com/t_qhl/model-chaos
知識(shí)歸檔Git倉(cāng)庫(kù)
https://gitee.com/cicadasmile/butte-java-note

GPT-5智能提升多少很難說,相信后面更深度的體驗(yàn)才能感受到它的優(yōu)缺點(diǎn)。從目前的感受而已,很有主動(dòng)性,積極建議下一步動(dòng)作,感覺多了一個(gè)催我干活的隊(duì)友。
浙公網(wǎng)安備 33010602011771號(hào)