五筆字型中,片語的編碼規則是,在五筆字型中,詞語計算機的編碼應該是什麼

2021-03-03 20:27:40 字數 6153 閱讀 3446

1樓:匿名使用者

五筆字型單字編碼規則

一、五筆字型編碼歌訣

掌握漢字的編碼規則,熟悉每個漢字的編碼,是五筆字型輸入的基礎,下面提供的單個字的五筆字型編碼規則歌忘記訣:

五筆字型均直觀,依照筆順把碼編;鍵名漢字打四下,基本字根請照搬;

一二三末取四碼,順序拆分大優先;不足四碼要注意,交叉識別補後邊。

從這歌訣就可以看出五筆字型編碼規則的大致面貌,同時口訣也概括了五筆字型拆字取碼的五項原則:

1、從形取其順序按書寫規則,即從左到右、從上到下、從外到內;

2、以130多個字根為基本單位;

3、對於字根數超過四個的漢字,按一二三末字根的順序,最多隻取四碼;

4、單體結構拆分取大優先;

5、末筆與字型交叉識別。

下圖是五筆字型編碼流程圖,以方便讀者瞭解整個編碼方案的概貌:

二、鍵名漢字的編碼規則

五筆字型中規定的鍵名漢字共有25個,"王土大木工目日口田山禾白月人金言立水火之已子女又糹"

25個鍵名漢字與25個字母鍵相應,這些字的編碼相當簡單,它們的編碼就是4個所在字母鍵字母,如:"言"字的編碼為"yyyy","糹"字的編碼為"***x",等等。輸入鍵名漢字時,只要連續擊四次該字所在的字母鍵即可。

三、成字字根的編碼規則

在五筆字型字根鍵盤的每個字母鍵上,除了一個鍵名字根外,還有一些其它型別的字根。有些字根其本身就是一個漢字,這樣的字根稱為成字字根。成字字根的編碼是按下面公式進行的:

鍵名碼+首筆碼+次筆碼+末筆碼

當成字字根僅為兩筆時,編碼只有三碼,公式為:

鍵名碼+首筆碼+末筆碼

例如:"石",字根所在的鍵為d,第一筆劃為 "橫"的編碼是g,第二筆為 "撇"的編碼是t鍵,末筆"橫"的編碼也是g鍵,所以這個字的五筆編碼就是dgtg。再比如"蟲"字,這個字根是在j鍵,第一筆是豎h,第二筆是折n,最末一筆是捺(在五筆裡"點"做為"捺")y,所以"蟲"的五筆編碼就是jhny。

四、鍵外字的編碼規則

國標gb2312-80中,上述的鍵名和成字字根這樣的鍵面字總共才有一百多個,絕大部分漢字都不是成字字根,這些才是我們在使用當中用得最多的。

五筆字型漢字編碼主要是鍵外字的編碼,編碼可以分為兩類,純字根碼和識別碼。如果一個漢字的字根是四個或超過四個,就用前三後一總共四個字根碼組成編碼。

不足四個字根的漢字需補一個字型結構識別碼,以增加區分漢字的資訊量。

1、字根碼

每個字根都分派在一個字母鍵上,其所在鍵上的英文就是該字根的"字根碼"。 凡含四個或超過四個字根的漢字,取其第

一、二、

三、末四個字根碼組成鍵外字的輸入編碼。第一字根編碼+第二字根編碼+第三字根編碼+最末一個字根編碼這裡

一、二、

三、末應按正常書寫順序,先左後右,先上後下,先外後內。

2、交叉識別碼

一個字的字根不足四個時,依次擊入字根碼後,最後需要補一個識別碼。為什麼需要這個識別碼呢,這裡可以舉例說明:如"沐"和"汀"字,這兩個字都是由兩個字根組成的,且這兩個字的字根碼都是is。

雖然也可以讓輸入者選擇的方式來確定到底需要輸入哪一個字,但這對漢字輸入速度極為不利,重位元速率要越低越好,所以五筆編碼中才引入了識別碼這個概念來對這類漢字進行區分。

識別碼是用該漢字最後一個筆畫和字型結構資訊來確定的,具體規則如下表:

左右結構(第1位) 上下結構(第2位) 雜合結構(第3位)

末筆是"橫",在一區 g f d

末筆是"豎",在二區 h j k

末筆是"撇",在三區 t r e

末筆是"捺",在四區 y u i

末筆是"折",在五區 n b v

從上表可以看出,識別碼的確定分兩個步驟,第一步根據最後一筆確定是在哪個區,第二步再以該漢字的字型結構來確定在哪一位,然後就能得到具體識碼了。  例:"旮"字,這個字同旭一樣字根只有兩個,字根碼為vj,但字型不同,可以通過識別碼來區分,"旮"最末筆是橫,在一區,是上下結構,所以是在第二位,即f,所以"旮"的五筆編碼就是vjf。

再如"汀"字,最末一筆是左豎鉤,在五筆裡為豎,在第二區,這個字是左右型結構,所以在第一位,即h,所以"汀"的五筆編碼就是ish。

加識別碼後仍不足四碼時,擊空格鍵結束。單筆與字根相連的字型為雜合型,見前面所述。

關於末筆畫還有如下規定,這些規定使取碼更為簡單,明確。

(1)、末字根為"力"、"刀"、"九"、"七"等時,一律認為末筆畫為折。

(2)、"進"、"逞"、"選"等字,不以"走之"的末筆為末筆(書寫時確實是末筆,但這樣末筆都一樣,減少了識別資訊量,約定以去掉"走之"部分後的末筆整個字的末筆來構造識別碼。進、逞、遠的識別碼應分別為:23,k;13,d;53,v。

當以"走之"末筆為末筆時,則識別碼都相同,為43,i。沒有得到識別資訊。

(3)、"我"、"戔",成等字的末筆取"丿"。

五、簡碼

為了提高輸入速度,五筆字型方案還設計了簡碼輸入,它將常用漢字只取其前邊的一個、兩個或三個字根構成,因為"識別碼"總是在全碼的最後位置,所以簡碼的設計不但減少了擊鍵次數,而且省去了部分漢字的"識別碼"的判別和編碼,給擊鍵帶來了很大方便。

簡碼漢字共分**:

1、一級簡碼

五筆字型中,根據每個字母鍵上的字根形態特徵,每鍵安排一個最為常用的高頻漢字,這類字共25個,它們的編碼只有一位,輸入時只要擊鍵一次再加一次空格鍵即可。這些高頻字及其編碼如下:

一 g 地 f 在 d 要 s 工 a

上 h 是 j 中 k 國 l 同 m

和 t 的 r 有 e 人 w 我 q

主 y 產 u 不 i 為 o 這 p

民 n 了 b 發 v 以 c 經 x

這些高頻字實際情況的鍵位記憶可以與鍵名聯想起來進行,大家詳細看看,可以發現有兩個字,其一級簡碼字與鍵名字是相同的。下面是高頻字與鍵名字對照表:

第一區: 一 ->王 地 ->土在 ->大 要 ->木 工 ->工

第二區: 上 ->目 是 ->日中 ->口 國 ->田 同 ->山

第三區: 和 ->禾 的 ->白有 ->月 人 ->人 我 ->金

第四區: 主 ->言 產 ->立不 ->水 為 ->火 這 ->之

第五區: 民 ->已 了 ->子發 ->女 以 ->又 經 ->糹

2、二級簡碼

二級簡碼是指編碼時取單字全碼的前兩個字根**。二十五個鍵位**,其兩碼組合共計有25*25=625個編碼。也就是說,用兩位碼可以給與625個漢字編碼。

五筆字型就選取使用頻率較高的600多個漢字與這些對應,這些編碼就成為這些漢字的簡碼。

3、**簡碼

**簡碼由一個漢字的前三個字根組成,只要一個漢字的前三個字根碼在整個編碼體系中是唯一的,一般都作為**簡碼,三個字母可以組成的編碼數是:25*25*25=15625個。實際上,在國際基本集的5763個漢字中,有**簡碼的漢字有4400多個。

要輸入這些漢字,只要依次鍵入這三個字根**,再加上空格鍵即可。這樣看上去似乎擊鍵次數仍為四鍵,並沒有減少,但是由於省略了前三個字根之後的字根判定或者交叉識別**的判定,則可達到提高編碼速度,進而達到提高輸入速度的目的。

在五筆字型編碼方案中,具有簡碼的漢字總數達5000多個,它們已佔國際基本集的5763個的絕大多數。因此,簡碼不但使用得編碼輸入變得非常簡明直觀,而且可以大地提高輸入效率。

當然,由於簡碼都是四碼簡略而得,所以有的字就會同時有幾種簡碼。例如"經"字,即有一級簡碼、二級簡碼,又有**簡碼,還可以用四位輸入。所以,最好能夠將簡碼漢字背熟,對於一個有幾種簡碼的漢字,儘量採用擊鍵次數少為好,這樣可以提高你的輸入速度。

六、重碼和容錯碼

如果一個編碼對應著幾個漢字,這幾個字稱為重碼字;幾個編碼對應一個漢字,這幾個編碼稱為漢字的容錯碼。

在五筆字型中,當輸入重碼時,重碼字顯示在提示行中,較常用的字排在第一個位置上,並用數字指出重碼字的序號,如果你要的就是第一個字,可繼續輸入下一個字,該字自動跳到當前游標位置。如果是其它的重碼字則需要用數字鍵加以選擇。

例如:"嘉"字和"喜"字,都分解(fkuk),因"喜"字較常用,它排在第一位,"嘉"字排在第二位。若你需要"嘉"字則要用數字鍵2來選擇。

在漢字中有些字的書寫順序往往因人而異,為了能適應這種情況,允許一個字有多種輸入碼,這些字就稱為容錯字。在五筆字型編碼輸入方案中,容錯字有500多個。

在五筆字型中,詞語「計算機」的編碼應該是什麼

2樓:匿名使用者

三字詞,五筆字型中取前兩個字的第一碼和第三個字的前兩個碼,計算機 yt**

怎麼用五筆打片語

3樓:暮夏淺眠

1、雙字詞

取第一字的前兩位編碼和第二字的前兩位編碼,如「北」(uxn)+「京」(yiu)=「北京」(uxyi)

2、三字詞

取第一字的第一位編碼,第二位的第一位編碼,第三字的前兩位編碼,如「毛」(tfnv)+「澤」(icfh)+「東」(aii)=「***」(tiai)

3、四字詞

取每一個字的第一位編碼,如「六」(uygy)+「十」(fgh)+「四」(lhng)+「卦」(ffhy)=「六十四卦」(uflf)

4、多字詞取一、

二、三、末字的第一位編碼,如「中」(khk)+「國」(lgyi)+「共」(awu)+「產」(ute)+「黨」(ipkq)=「中國共產黨」(klai)

4樓:

五筆字型的片語編碼規則分四種情況,現分述如下。

1、雙字詞

雙字詞的編碼規則:

第一字的前兩碼+第二字的前兩碼。

雙字詞在漢語詞彙中佔的比重最大,在實際操作中也是使用頻率最高的。

表4-11給出了幾個雙字詞的編碼示例。

表4-11 雙字詞的編碼示例

例詞 第一字前兩碼 第二字前兩碼 片語編碼

智慧 td ce tdce

專利 fn tj fntj

學習 ip nu ipnu

編碼 xy dc xydc

微機 tm ** tm**

工程 aa tk aatk

會計 wf yf wfyf

幹部 fg uk fguk

2、三字詞

三字詞的編碼規則:

第一字的第一碼+第二字的第一碼+第三字的前兩碼。

表4-12給出了幾個三字詞的編碼示例。

表4-12 三字詞的編碼示例

例 詞 第一字第一碼 第二字第一碼 第三字前兩碼 片語編碼

計算機 y t ** yt**

進一步 f g hi fghi

財政部 m g uk mguk

專利權 f t sc ftsc

利潤率 t i yx tiyx

印表機 r q ** rq**

委員會 t k wf tkwf

副主任 g y wt gywt

3、四字詞

四字詞的編碼規則:

取每一漢字的第一碼。

表4-13給出了幾個四字詞的編碼示例。

表4-13 四字詞的編碼示例

例 詞 第一字第一碼 第二字第一碼 第三字第一碼 第四字第一碼 片語編碼

社會主義 y w y y ywyy

科學技術 t i r s tirs

中共** k a k m kakm

中華民族 k w n y kwny

基本建設 a s v y asvy

國際合作 l b w w lbww

人民** w n j r wnjr

五筆字型 g t p g gtpg

五筆字型是什麼?比如哦的五筆是KTRT什麼意思

之所以叫作五筆,是將漢字筆劃分為橫 豎 撇 捺 折五種。把字根或碼元按一定規律分佈在25個字母鍵上 即標準的qwer鍵盤,不包括z 五筆字型中,字根多數是傳統的漢字偏旁部首,同時還把一些還有少量的筆畫結構作為字根,也有硬造出的一些 字根 五筆基本字根有130種,加上一些基本字根的變型,共有200個左...

五筆字型漢字輸入法的編碼屬於什麼碼

在原理上劃分,漢字鍵盤輸入技術主要分為拼音碼,形碼,形音碼。形音碼即結合音碼,形碼編碼原理形成的一種輸入方法,其代表是形音碼輸入法。它應該是相容了五筆字輸入法和拼音輸入法,並且對2種輸入法進行適當調整的一種編碼。五筆是目前中國以及一些東南亞國家如新加坡 馬來西亞等國的最常用的漢字輸入法之一。五筆相對...

五筆片語的規律,五筆二字片語的規律

是有規律的,一個字先拆為幾個字根,每個字根都有對應的按鍵.五筆字根表 五筆拆字法 橫g 1 一 提 如 刁 均 從左至右 豎h 2 丨左豎鉤 如 小 行 從上至下 撇t 3 丿 如 禾 月 從右上至左下 捺y 4 丶 如 文 言 木 從左上至右下 折n 5 乙 帶轉折 右豎鉤 如 飯 專 書 世 韋...