亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

一個關于Unicode字符編碼的奇怪問題

系統 2419 0

有一個學員問了一個關于 Unicode 字符編碼的奇怪問題。

問題如下:

String strChina = " 中國 ";

1 )直接把每個字符中的內容對應著的整數打印出來,顯示的結果就是這個字符的 Unicode 碼,則下面的代碼:

for(int i=0; i<strChina.length(); i++)

{

System.out.println(Integer.toHexString((int)strChina.charAt(i)));

}

打印出的結果是:

4e2d

56fd

2 )下面的代碼:

byte [] buf = strChina.getBytes("Unicode");

for(int i=0; i<buf.length; i++)

{

System.out.println(Integer.toHexString(buf[i]));

}

打印出的結果是:

ffffffff

fffffffe

2d

4e

fffffffd

56

打印出的“ ffffffff ”和“ fffffffe ”表示什么?“ 2d ”和“ 4e ”為什么和直接打印的結果是相反的?

回答如下:

在不同體系結構的計算機系統中, UTF-16 編碼的 Unicode 字符在內存中的字節存儲順序是不同的。使用 Intel CPU 的計算機中,一個多字節數據在內存中的存儲形式通常是:低字節在前,高字節在后,這種方式稱為 Little-Endian (最不重要的字節在先)。但是,在使用其他 CPU 的一些計算機中,又是以高字節在前,低字節在后的方式存儲多字節數據的,這種方式稱為 Big-Endian (最重要的字節在先)。對于 0x1234 這樣一個雙字節數據,使用 Little-Endian Big-Endian 兩種方式在內存中存儲的格式如圖 7.4 所示。

一個關于Unicode字符編碼的奇怪問題

<shapetype id="_x0000_t75" coordsize="21600,21600" o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe" filled="f" stroked="f"><stroke joinstyle="miter"></stroke><formulas><f eqn="if lineDrawn pixelLineWidth 0"></f><f eqn="sum @0 1 0"></f><f eqn="sum 0 0 @1"></f><f eqn="prod @2 1 2"></f><f eqn="prod @3 21600 pixelWidth"></f><f eqn="prod @3 21600 pixelHeight"></f><f eqn="sum @0 0 1"></f><f eqn="prod @6 1 2"></f><f eqn="prod @7 21600 pixelWidth"></f><f eqn="sum @8 21600 0"></f><f eqn="prod @7 21600 pixelHeight"></f><f eqn="sum @10 21600 0"></f></formulas><path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"></path><lock v:ext="edit" aspectratio="t"></lock></shapetype><shape id="_x0000_i1025" style="WIDTH: 285.75pt; HEIGHT: 164.25pt" type="#_x0000_t75"><imagedata src="file:///C:%5CDOCUME~1%5Cflx%5CLOCALS~1%5CTemp%5Cmsohtml1%5C01%5Cclip_image001.png" o:title=""></imagedata></shape>

對于采用 UTF-16 編碼的文件,通常都要用字節順序標記( Byte Order Mark ,簡稱 BOM )來說明文件中的字符所使用的字節存儲順序。如果文件以 0xFE 0xFF 這兩個字節開頭,則表明文本的其余部分是 Big-Endian UTF-16 編碼;如果文件以 0xFF 0xFE 這兩個字節開頭,則表明文本的其余部分是 Little-Endian UTF-16 編碼;如果文件開頭沒有使用任何字節順序標記,則暗指全部文本都是 Big-Endian UTF-16 編碼。

ffffffff ”和“ fffffffe ”實際上是 0xff 0xfe 的兩個字節,把他們當作整數打印時,就成了 4 個字節, 由于 0xfe 最高 bi t 位是 1 ,當它轉成 4 字節的整數時,前面 3 個字節的所有 bit 位都補 1, 結果就成了 0xfffffffe 。前面打印出:

ffffffff

fffffffe

2d

4e

fffffffd

56

實際上是:

ff

fe

2d

4e

fd

56

前兩個字節是在說字節存儲順序!

一個關于Unicode字符編碼的奇怪問題


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 日韩毛片欧美一级a网站 | 成人老司机深夜福利久久 | 国产欧美另类久久精品91 | 欧美日韩成人 | 亚洲欧美日韩国产综合高清 | 成年人黄色在线观看 | 狠狠色丁香婷婷久久综合2021 | 色婷婷色99国产综合精品 | 久久免费99精品久久久久久 | 久久精品亚洲综合 | 亚洲国产字幕 | 欧美综合中文字幕久久 | 久久久国产精品免费看 | 九色网址 | 亚洲狠狠狠一区二区三区 | 精品久久久久久久久久 | 中文字幕在线观看国产 | 四虎影视永久在线观看 | 日本亚洲欧美美色 | ww亚洲ww亚在线观看 | 国产精品免费大片一区二区 | 久久这里精品青草免费 | 国内精品久久久久久不卡影院 | 91热视频在线 | 精品无码久久久久久国产 | 天天久久综合 | 日韩在线视频中文字幕 | 正在播放亚洲 | 亚洲国产综合精品中文第一区 | 在线国产一区二区三区 | 欧美日韩国产在线成人网 | 97在线视频免费播放 | 国产午夜亚洲精品不卡福利 | 久久精品看片 | 精品国产免费一区二区 | 九九视频在线播放 | 亚洲精品色播一区二区 | 夜夜夜夜猛噜噜噜噜噜 | 免费网站看v片在线成人国产系列 | 天天操操| 国产欧美亚洲精品第3页在线 |