請教關於漢字機內碼儲存的問題,請教一個關於漢字機內碼儲存的問題

2022-08-26 08:30:27 字數 4447 閱讀 9762

1樓:匿名使用者

gb 2312-80 收錄簡化漢字及一般符號、序號、數字、拉丁字母、日文假名、希臘字母、俄文字母、漢語拼音符號、漢語注音字母,共 7445 個圖形字元。其中漢字以外的圖形字元682 個,漢字 6763 個。

gb 2312-80 規定,「對任意一個圖形字元都採用兩個位元組(byte)表示。每個位元組均採用 gb 1988-80 及 gb 2311-80 中的七位編碼表示。兩個位元組中前面的位元組為第一位元組,後面的位元組為第二位元組。

」習慣上稱第一位元組為「高位元組」,第二位元組為「低位元組」。

gb 2312-80 將**表分為 94 個區(section),對應第一位元組;每個區 94 個位(position),對應第二位元組。兩個位元組的值,分別為區號值和位號值各加 32(20h)。

gb 2312-80 規定,01~09 區(原規定為 1~9 區,為表示區位碼方便起見,今改稱01~09 區)為符號、數字區,16~87 區為漢字區。而 10~15 區、88~94 區是有待於「進一步標準化」的「空白位置」區域。但第 10 區推薦與第 3 區的 94 個圖形字元(即 gb 1988-80 中的 94 個圖形字元)相同,字形寬度為其寬度的一半

2樓:匿名使用者

金卡家肯德基啊設計單位

3樓:匿名使用者

gb 2312-80又稱為國標碼,機內碼稱為區位碼,它是由94個區x94位(編號由01到94)組成漢字字符集。區位碼與國標碼的其轉換方法為:先將十進位制區碼和位碼轉換為十六進位制的區碼和位碼,再將這個**的第一個位元組和第二個位元組分別加上20h,就得到國標碼。

之所以這樣主要是為了避開每個位元組的低7為不出現控制字元(0-20h)。它們都是2位元組。

至於unicode也稱為全球文字編碼,它由4位元組組成。東亞字元(包括中文繁簡體、日文及朝鮮文)共計20000餘個。其他如希臘文、印度文及其他文字等。

希望對你有用。

一個漢字的機內碼需用幾個位元組儲存?

4樓:匿名使用者

我國國家標準局於2023年5月頒佈了《資訊交換用漢字編碼字符集——基本集》,代號為gb2312-80,共對6763個漢字和682個圖形字元進行了編碼,其編碼原則為:漢字用兩個位元組表示。

原則上,兩個位元組可以表示 256×256=65536 種不同的符號,作為漢字編碼表示的基礎是可行的。但考慮到漢字編碼與其它國際通用編碼,如ascii 西文字元編碼的關係,我國國家標準局採用了加以修正的兩位元組漢字編碼方案,只用了兩個位元組的低7位。

這個方案可以容納 128×128=16384 種不同的漢字,但為了與標準ascii碼相容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。所以每個位元組只能有94個編碼。這樣,雙七位實際能夠表示的字數是:

94×94=8836個。

5樓:匿名使用者

不同的編碼方法,對於漢字機內碼的儲存空間要求是不同的:

gb碼gb碼中只有漢字(和一些特殊符號等),它完全佔用整個編碼空間,使用兩個位元組作為一個字元的編碼。

國家標準局頒佈的《資訊交換用漢字編碼字符集"基本集》(代號為gb2312 80)規定的漢字交換碼作為國家標準漢字編碼。這個方案可以容納 128×128=16384 種不同的漢字,但為了與標準ascii碼相容,每個位元組中都不能再用32個控制功能碼和碼值為32的空格以及127的操作碼。

unicode編碼

unicode有兩種標識,unicode-2使用2個位元組表示一個字元。unicode-4使用4個位元組表示一個字元。

unicode目前普遍採用的是ucs-2,它用兩個位元組來編碼一個字元, 比如漢字"經"的編碼是0x7ecf,注意字元碼一般用十六進位制來 表示,為了與十進位制區分,十六進位制以0x開頭,0x7ecf轉換成十進位制 就是32463,ucs-2用兩個位元組來編碼字元,兩個位元組就是16位二進位制, 2的16次方等於65536,所以ucs-2最多能編碼65536個字元。 編碼從0到127的字元與ascii編碼的字元一樣,比如字母"a"的unicode 編碼是0x0061,十進位制是97,而"a"的ascii編碼是0x61,十進位制也是97, 對於漢字的編碼,事實上unicode對漢字支援不怎麼好,這也是沒辦法的, 簡體和繁體總共有六七萬個漢字,而ucs-2最多能表示65536個,才六萬 多個,所以unicode只能排除一些幾乎不用的漢字,好在常用的簡體漢字 也不過七千多個,為了能表示所有漢字,unicode也有ucs-4規範,就是用 4個位元組來編碼字元。

6樓:聽不清啊

中文字元如國標字符集中,gb2312、gb12345、gb13000皆用雙位元組內碼,gb18030(27,533漢字)雙位元組內碼漢字為20,902個,其餘6,631個漢字用四位元組內碼。

漢字內碼:ansi碼是單一位元組(8位二進位制數)的編碼集,最多隻能表示256個字元,不能表示眾多的漢字字元,各個國家和地區在ansi碼的基礎上又設計了各種不同的漢字編碼集,以能夠處理大數量的漢字字元。這些編碼使用單位元組來表示ansi的英文字元(即相容ansi碼),使用雙位元組來表示漢字字元。

由於一個系統中只能有一種漢字內碼,不能識別其它漢字內碼的字元,造成了交流的不便。

gb碼:gb碼是2023年國家公佈的簡體漢字編碼方案,在大陸、新加坡得到廣泛的使用,也稱國標碼。國標碼對6763個漢字集進行了編碼,涵蓋了大多數正在使用的漢字。

gbk碼:gbk碼是gb碼的擴充套件字元編碼,對多達2萬多的簡繁漢字進行了編碼,簡體版的win95和win98都是使用gbk作系統內碼。

big5碼:big5碼是針對繁體漢字的漢字編碼,在臺灣、香港的電腦系統中得到普遍應用。

hz碼:hz碼是在internet上廣泛使用的一種漢字編碼。

iso-2022cjk碼:iso-2022是國際標準組織(iso)為各種語言字元制定的編碼標準。採用二個位元組編碼,其中漢語編碼稱iso-2022 cn,日語、韓語的編碼分別稱jp、kr。

一般將三者合稱cjk碼。cjk碼主要在internet網路中使用。

unicode碼:unicode碼也是一種國際標準編碼,採用二個位元組編碼,與ansi碼不相容。在網路、windows系統和很多大型軟體中得到應用。

7樓:心隨心潮

為了避免ascii碼和國標碼同時使用時產生二義性問題

大部分漢字系統都採用將國標碼每個位元組高位置1作為漢字機內碼。

這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具有極簡單的對應關係。

2kb的記憶體能儲存( )個漢字的機內碼

8樓:匿名使用者

一個漢字是2位元組,2kb是2048位元組,所以可能儲存1024個。

9樓:匿名使用者

1b儲存一個英文,1個漢字佔用2b。。1024b=1kb,2kb=2048b,1024個漢字吧

一個漢字的機內碼佔幾個位元組?

10樓:幻翼高達

在國內流行的漢字系統中,一個漢字的機內碼佔2個位元組。

因為漢字處理系統要保證中西文的相容,當系統中同時存在ascii碼和漢字國標碼時,將會產生二義性。例如:有兩個位元組的內容為30h和21h,它既可表示漢字「啊」的國標碼,又可表示西文文「0」和「!

」的ascii碼。為此,漢字機內碼應對國標碼加以適當處理和變換。

國標碼的機內碼為二位元組長的**,它是在相應國標碼的每個位元組最高位上加「1」,即漢字機內碼=漢字國標碼+8080h。例如,上述「啊」字的國標碼是3021h,其漢字機內碼則是b0a1h。

漢字機內碼的基礎是漢字國標碼。為了避免ascii碼和國標碼同時使用時產生二義性問題,大部分漢字系統都採用將國標碼每個位元組高位置1作為漢字機內碼。這樣既解決了漢字機內碼與西文機內碼之間的二義性,又使漢字機內碼與國標碼具有極簡單的對應關係。

擴充套件資料:

漢字編碼的分類:

1、外碼(輸入碼)

外碼也叫輸入碼,是用來將漢字輸入到計算機中的一組鍵碟符號。常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認知碼、區位碼和電報碼等,一種好的編碼應有編碼規則簡單、易學好記、操作方便、重位元速率低、輸入速度快等優點,每個人可根據自己的需要進行選擇。

2、交換碼(國標碼)

計算機內部處理的資訊,都是用二進位制**表示的,漢字也不例外。而二進位制**使用起來是不方便的,於是需要採用資訊交換碼。中國標準總局2023年制定了中華人民共和國國家標準gb2312--80《資訊交換用漢字編碼字符集--基本集》,即國標碼。

3、機內碼

根據國標碼的規定,每一個漢字都有了確定的二進位制**,在微機內部漢字**都用機內碼,在磁碟上記錄漢字**也使用機內碼。

4、漢字的字形碼

字形碼是漢字的輸出碼,輸出漢字時都採用圖形方式,無論漢字的筆畫多少,每個漢字都可以寫在同樣大小的方塊中。通常用16×16點陣來顯示漢字。

5、漢字地址碼

漢字地址碼是指漢字型檔中儲存漢字字形資訊的邏輯地址碼。它與漢字內碼有著簡單的對應關係,以簡化內碼到地址碼的轉換。

11樓:喬文龍

一個漢字佔用兩個位元組

一個字母或者數以佔用一位元組。

請教關於佛的問題,請教一個關於佛的問題

你自身有這個福報 求神佛幫助很容易獲得的 沒有福報 就算求百年也無用的,磕破了頭也不行的 福分是自己付出的回報 是善心善行的回報 凡事守戒 安心為主!不然一切不順 我說 不如多多放生功德迴向 多多佈施 多做慈善 則一切吉祥如意的!長壽從放生中來。富貴從佈施中來,智慧從法佈施中來,健康從無畏佈施中來 ...

請教關於電腦的問題,請教一個關於電腦的問題

您的手機有儲存卡嗎?如果有把儲存卡放進讀卡器裡,就可以啦!如果還不能識別,您把您的手機在別的電腦連線下,如果能用,就是您電腦的事了。重新裝一下主機板驅動。希望能幫到您!你在用每個硬體的時候都要有相對應的驅動.你的電腦無法識別你的手機就是沒有找到相對應的驅動.要看你的手機是什麼牌子的,去下裝相對應的驅...

高分請教關於Excel的問題,高分請教一個關於Excel的問題

沒有什麼特殊命令。就依你說的,只需開啟兩個檔案,在第二個檔案的c列鍵入 然後用滑鼠選第一個檔案m列你想要顯示的部分就可以了。其它依此類推。當相關聯的第一個檔案的m列的內容改變時,第二個檔案的相應內容也做改變。不是很明白是什麼意思,你嘗試下新增超連線怎麼樣?滑鼠拉要複製的內容複製在指定的位置點下在貼上...