摘要:
utf-8 編碼的文件可以分為no bom 和 bom兩種格式。 何謂bom? "ef bb bf" 這三個(gè)字節(jié)就叫bom,bom的全稱叫做"byte order mard".在utf-8文件中常用bom來表明這個(gè)文件是utf-8文件,而bom的本意實(shí)在utf16中用來表示高低字節(jié)序列的。在字節(jié)流之前有 bom表示采用低字節(jié)序列(低字節(jié)在前面),而utf8不用考慮字節(jié)序列,所以其實(shí)有無bom都可以。utf-8以字節(jié)為編碼單元,沒有字節(jié)序的問題。 utf-16以兩個(gè)字節(jié)為編碼單元,在解釋一個(gè)utf-16文本前,首先要弄清楚每個(gè)編碼單元的字節(jié)序。例如收到一個(gè) 閱讀全文
posted @ 2011-03-16 11:28
Mamboer
閱讀(2146)
評論(0)
推薦(1)
浙公網(wǎng)安備 33010602011771號