【面試】迄今為止把同步/異步/阻塞/非阻塞/BIO/NIO/AIO講的這么清楚的好文章(快快珍藏)
常規(guī)的誤區(qū)
假設(shè)有一個(gè)展示用戶詳情的需求,分兩步,先調(diào)用一個(gè)HTTP接口拿到詳情數(shù)據(jù),然后使用適合的視圖展示詳情數(shù)據(jù)。
如果網(wǎng)速很慢,代碼發(fā)起一個(gè)HTTP請求后,就卡住不動(dòng)了,直到十幾秒后才拿到HTTP響應(yīng),然后繼續(xù)往下執(zhí)行。
這個(gè)時(shí)候你問別人,剛剛代碼發(fā)起的這個(gè)請求是不是一個(gè)同步請求,對方一定回答是。這是對的,它確實(shí)是。
但你要問它為什么是呢?對方一定是這樣回答的,“因?yàn)榘l(fā)起請求后,代碼就卡住不動(dòng)了,直到拿到響應(yīng)后才可以繼續(xù)往下執(zhí)行”。
我相信很多人也都是這樣認(rèn)為的,其實(shí)這是不對的,是把因果關(guān)系搞反了:
不是因?yàn)榇a卡住不動(dòng)了才叫同步請求,而是因?yàn)樗峭秸埱笏源a才卡住不動(dòng)了。
至于為什么能卡住不動(dòng),這是由操作系統(tǒng)和CPU決定的:
因?yàn)閮?nèi)核空間里的對應(yīng)函數(shù)會(huì)卡住不動(dòng),造成用戶空間發(fā)起的系統(tǒng)調(diào)用卡住不動(dòng),繼而使程序里的用戶代碼卡住不動(dòng)了。
因此卡住不動(dòng)了只是同步請求的一個(gè)副作用,并不能用它來定義同步請求,那該如何定義呢?
同步和異步
所謂同步,指的是協(xié)同步調(diào)。既然叫協(xié)同,所以至少要有2個(gè)以上的事物存在。協(xié)同的結(jié)果就是:
多個(gè)事物不能同時(shí)進(jìn)行,必須一個(gè)一個(gè)的來,上一個(gè)事物結(jié)束后,下一個(gè)事物才開始。
那當(dāng)一個(gè)事物正在進(jìn)行時(shí),其它事物都在干嘛呢?
嚴(yán)格來講這個(gè)并沒有要求,但一般都是處于一種“等待”的狀態(tài),因?yàn)橥ǔ:竺媸挛锏恼_M(jìn)行都需要依賴前面事物的結(jié)果或前面事物正在使用的資源。
因此,可以認(rèn)為,同步更希望關(guān)注的是從宏觀整體來看,多個(gè)事物是一種逐個(gè)逐個(gè)的串行化關(guān)系,絕對不會(huì)出現(xiàn)交叉的情況。
所以,自然也不太會(huì)去關(guān)注某個(gè)瞬間某個(gè)具體事物是處于一個(gè)什么狀態(tài)。
把這個(gè)理論應(yīng)用的出神入化的非“排隊(duì)”莫屬。凡是在資源少需求多的場景下都會(huì)用到排隊(duì)。
比如排隊(duì)買火車票這件事:
其實(shí)售票大廳更在意的是旅客一個(gè)一個(gè)的到窗口去買票,因?yàn)橐淮沃荒苜u一張票。
即使大家一窩蜂的都圍上去,還是一次只能賣一張票,何必呢?擠在一起又不安全。
只是有些人素質(zhì)太差,非要往上擠,售票大廳迫不得已,采用排隊(duì)這種形式來達(dá)到自己的目的,即一個(gè)一個(gè)的買票。
至于每個(gè)旅客排隊(duì)時(shí)的狀態(tài),是看手機(jī)呀還是說話呀,根本不用去在意。
除了這種由于資源導(dǎo)致的同步外,還存在一種由于邏輯上的先后順序?qū)е碌耐健?/span>
比如,先更新代碼,然后再編譯,接著再打包。這些操作由于后一步要使用上一步的結(jié)果,所以只能按照這種順序一個(gè)一個(gè)的執(zhí)行。
關(guān)于同步還需知道兩個(gè)小的點(diǎn):
一是范圍,并不需要在全局范圍內(nèi)都去同步,只需要在某些關(guān)鍵的點(diǎn)執(zhí)行同步即可。
比如食堂只有一個(gè)賣飯窗口,肯定是同步的,一個(gè)人買完,下一個(gè)人再買。但吃飯的時(shí)候也是一個(gè)人吃完,下一個(gè)人才開始吃嗎?當(dāng)然不是啦。
二是粒度,并不是只有大粒度的事物才有同步,小粒度的事物也有同步。
只不過小粒度的事物同步通常是天然支持的,而大粒度的事物同步往往需要手工處理。
比如兩個(gè)線程的同步就需要手工處理,但一個(gè)線程里的兩個(gè)語句天然就是同步的。
所謂異步,就是步調(diào)各異。既然是各異,那就是都不相同。所以結(jié)果就是:
多個(gè)事物可以你進(jìn)行你的、我進(jìn)行我的,誰都不用管誰,所有的事物都在同時(shí)進(jìn)行中。
一言以蔽之,同步就是多個(gè)事物不能同時(shí)開工,異步就是多個(gè)事物可以同時(shí)開工。
注:一定要去體會(huì)“多個(gè)事物”,多個(gè)線程是多個(gè)事物,多個(gè)方法是多個(gè)事物,多個(gè)語句是多個(gè)事物,多個(gè)CPU指令是多個(gè)事物。等等等等。
阻塞和非阻塞
所謂阻塞,指的是阻礙堵塞。它的本意可以理解為由于遇到了障礙而造成的動(dòng)彈不得。
所謂非阻塞,自然是和阻塞相對,可以理解為由于沒有遇到障礙而繼續(xù)暢通無阻。
對這兩個(gè)詞最好的詮釋就是,當(dāng)今中國一大交通難題,堵車:
汽車可以正常通行時(shí),就是非阻塞。一旦堵上了,全部趴窩,一動(dòng)不動(dòng),就是阻塞。
因此阻塞關(guān)注的是不能動(dòng),非阻塞關(guān)注的是可以動(dòng)。
不能動(dòng)的結(jié)果就是只能等待,可以動(dòng)的結(jié)果就是繼續(xù)前行。
因此和阻塞搭配的詞一定是等待,和非阻塞搭配的詞一定是進(jìn)行。
回到程序里,阻塞同樣意味著停下來等待,非阻塞表明可以繼續(xù)向下執(zhí)行。
阻塞和等待
等待只是阻塞的一個(gè)副作用而已,表明隨著時(shí)間的流逝,沒有任何有意義的事物發(fā)生或進(jìn)行。
阻塞的真正含義是你關(guān)心的事物由于某些原因無法繼續(xù)進(jìn)行,因此讓你等待。但沒必要干等,你可以做一些其它無關(guān)的事物,因?yàn)檫@并不影響你對相關(guān)事物的等待。
在堵車時(shí),你可以干等。也可以玩手機(jī)、和別人聊天,或者打牌、甚至先去吃飯都行。因?yàn)檫@些事物并不影響你對堵車的等待。不過你的車必須呆在原地。
在計(jì)算機(jī)里,是沒有人這么靈活的,一般在阻塞時(shí),選在干等,因?yàn)檫@最容易實(shí)現(xiàn),只需要掛起線程,讓出CPU即可。在條件滿足時(shí),會(huì)重新調(diào)度該線程。
兩兩組合
所謂同步/異步,關(guān)注的是能不能同時(shí)開工。
所謂阻塞/非阻塞,關(guān)注的是能不能動(dòng)。
通過推理進(jìn)行組合:
同步阻塞,不能同時(shí)開工,也不能動(dòng)。只有一條小道,一次只能過一輛車,可悲的是還TMD的堵上了。
同步非阻塞,不能同時(shí)開工,但可以動(dòng)。只有一條小道,一次只能過一輛車,幸運(yùn)的是可以正常通行。
異步阻塞,可以同時(shí)開工,但不可以動(dòng)。有多條路,每條路都可以跑車,可氣的是全都TMD的堵上了。
異步非阻塞,可以工時(shí)開工,也可以動(dòng)。有多條路,每條路都可以跑車,很爽的是全都可以正常通行。
是不是很容易理解啊。其實(shí)它們的關(guān)注點(diǎn)是不同的,只要搞明白了這點(diǎn),組合起來也不是事兒。
回到程序里,把它們和線程關(guān)聯(lián)起來:
同步阻塞,相當(dāng)于一個(gè)線程在等待。
同步非阻塞,相當(dāng)于一個(gè)線程在正常運(yùn)行。
異步阻塞,相當(dāng)于多個(gè)線程都在等待。
異步非阻塞,相當(dāng)于多個(gè)線程都在正常運(yùn)行。
I/O
IO指的就是讀入/寫出數(shù)據(jù)的過程,和等待讀入/寫出數(shù)據(jù)的過程。一旦拿到數(shù)據(jù)后就變成了數(shù)據(jù)操作了,就不是IO了。
拿網(wǎng)絡(luò)IO來說,等待的過程就是數(shù)據(jù)從網(wǎng)絡(luò)到網(wǎng)卡再到內(nèi)核空間。讀寫的過程就是內(nèi)核空間和用戶空間的相互拷貝。
所以IO就包括兩個(gè)過程,一個(gè)是等待數(shù)據(jù)的過程,一個(gè)是讀寫(拷貝)數(shù)據(jù)的過程。而且還要明白,一定不能包括操作數(shù)據(jù)的過程。
阻塞IO和非阻塞IO
應(yīng)用程序都是運(yùn)行在用戶空間的,所以它們能操作的數(shù)據(jù)也都在用戶空間。按照這樣子來理解,只要數(shù)據(jù)沒有到達(dá)用戶空間,用戶線程就操作不了。
如果此時(shí)用戶線程已經(jīng)參與,那它一定會(huì)被阻塞在IO上。這就是常說的阻塞IO。用戶線程被阻塞在等待數(shù)據(jù)上或拷貝數(shù)據(jù)上。
非阻塞IO就是用戶線程不參與以上兩個(gè)過程,即數(shù)據(jù)已經(jīng)拷貝到用戶空間后,才去通知用戶線程,一上來就可以直接操作數(shù)據(jù)了。
用戶線程沒有因?yàn)镮O的事情出現(xiàn)阻塞,這就是常說的非阻塞IO。
同步IO和同步阻塞IO
按照上文中對同步的理解,同步IO是指發(fā)起IO請求后,必須拿到IO的數(shù)據(jù)才可以繼續(xù)執(zhí)行。
按照程序的表現(xiàn)形式又分為兩種:
在等待數(shù)據(jù)的過程中,和拷貝數(shù)據(jù)的過程中,線程都在阻塞,這就是同步阻塞IO。
在等待數(shù)據(jù)的過程中,線程采用死循環(huán)式輪詢,在拷貝數(shù)據(jù)的過程中,線程在阻塞,這其實(shí)還是同步阻塞IO。
網(wǎng)上很多文章把第二種歸為同步非阻塞IO,這肯定是錯(cuò)誤的,它一定是阻塞IO,因?yàn)榭截悢?shù)據(jù)的過程,線程是阻塞的。
嚴(yán)格來講,在IO的概念上,同步和非阻塞是不可能搭配的,因?yàn)樗鼈兪且粚?/span>相悖的概念。
同步IO意味著必須拿到IO的數(shù)據(jù),才可以繼續(xù)執(zhí)行。因?yàn)楹罄m(xù)操作依賴IO數(shù)據(jù),所以它必須是阻塞的。
非阻塞IO意味著發(fā)起IO請求后,可以繼續(xù)往下執(zhí)行。說明后續(xù)執(zhí)行不依賴于IO數(shù)據(jù),所以它肯定不是同步的。
因此,在IO上,同步和非阻塞是互斥的,所以不存在同步非阻塞IO。但同步非阻塞是存在的,那不叫IO,叫操作數(shù)據(jù)了。
所以,同步IO一定是阻塞IO,同步IO也就是同步阻塞IO。
異步IO和異步阻塞/非阻塞IO
按照上文中對異步的理解,異步IO是指發(fā)起IO請求后,不用拿到IO的數(shù)據(jù)就可以繼續(xù)執(zhí)行。
用戶線程的繼續(xù)執(zhí)行,和操作系統(tǒng)準(zhǔn)備IO數(shù)據(jù)的過程是同時(shí)進(jìn)行的,因此才叫做異步IO。
按照IO數(shù)據(jù)的兩個(gè)過程,又可以分為兩種:
在等待數(shù)據(jù)的過程中,用戶線程繼續(xù)執(zhí)行,在拷貝數(shù)據(jù)的過程中,線程在阻塞,這就是異步阻塞IO。
在等待數(shù)據(jù)的過程中,和拷貝數(shù)據(jù)的過程中,用戶線程都在繼續(xù)執(zhí)行,這就是異步非阻塞IO。
第一種情況是,用戶線程沒有參與數(shù)據(jù)等待的過程,所以它是異步的。但用戶線程參與了數(shù)據(jù)拷貝的過程,所以它又是阻塞的。合起來就是異步阻塞IO。
第二種情況是,用戶線程既沒有參與等待過程也沒有參與拷貝過程,所以它是異步的。當(dāng)它接到通知時(shí),數(shù)據(jù)已經(jīng)準(zhǔn)備好了,它沒有因?yàn)镮O數(shù)據(jù)而阻塞過,所以它又是非阻塞的。合起來就是異步非阻塞IO。
PS:聰明的你或許發(fā)現(xiàn)了我沒有提多路復(fù)用IO,因?yàn)樗档脤iT撰文一篇。
(END)
作者是工作超過10年的碼農(nóng),現(xiàn)在任架構(gòu)師。喜歡研究技術(shù),崇尚簡單快樂。追求以通俗易懂的語言解說技術(shù),希望所有的讀者都能看懂并記住。下面是公眾號(hào)和知識(shí)星球的二維碼,歡迎關(guān)注!

浙公網(wǎng)安備 33010602011771號(hào)