三、概論(二):拆碼規則

文章列表

  1. 簡介:什麼是嘸蝦米?
  2. 概論(一):字根
  3. 概論(二):拆碼規則(本篇)
  4. 字根學習(一):以字形取碼
  5. 字根學習(二):以字音取碼
  6. 字根學習(三):以字義取碼 – 數字
  7. 字根學習(四):以字義取碼 – 英文
  8. 字根學習(五):搖頭擺尾
  9. 字根學習(六):難歸類字根
  10. 拆碼方法(一):眼順與筆順
  11. 拆碼方法(二):截長補短
  12. 拆碼方法(三):分節取碼
  13. 拆碼方法(四):重複字處理
  14. 難字解說
  15. 日文輸入
  16. 符號輸入
  17. 簡速字根
  18. 一碼字與兩碼字
  19. 簡體字根
  20. 附錄:字根總表
  21. 附錄:易混淆字根表

前言

如同上一篇的前言中所提到的,字形輸入法的規則中有字根與拆碼原則。當我們學習並熟悉中文字裡的文字組件對應到哪個字根之後,就需要搭配拆碼的原則將每個字拆成嘸蝦米碼,然後再使用嘸蝦米輸入法將字碼輸入之後,即可成功上字到電腦之中。

音碼輸入法注音來舉例,國家的「國」會拆碼成為「ㄍㄨㄛˊ」三個注音符號加聲調共四碼;如果再使用上下左右方向鍵選字的話,輸入一個字所需要的按鍵數可能會高達五碼以上(不計入為了上字而必須輸入的空白鍵或數字鍵)。即使字碼數僅有二到四碼,但因為中文同音字、破音字非常多,因此重碼率很高。另外,除了注音符號本身以外,沒有其他的一碼字(僅需使用一個字碼就可以輸入的字);兩碼字的部份也僅限於單音字才能使用,例如:支(ㄓ<一聲空白鍵>)、日(ㄖˋ)、無(ㄨˊ)等等,並不是任意的字根都可以組合兩碼字。

為了減少高重碼率帶來的選字延遲,提高打字速度,各家音碼輸入法使用了不同的方式去簡化輸入流程。例如使用智慧型排序、聯想詞輸入、模擬音輸入、整句輸入、雙拼、簡拼等等,以改善注音編碼的缺點。

  • 智慧型排序:將同音字詞依照常用、罕用的使用頻率進行排序,使得較常用的字會出現在列表前方。有些輸入法甚至會自動學習並記憶各領域使用者的輸入內容後,優化列表排序的內容,讓使用者能更快速地選取較常輸入的字詞。
  • 聯想詞:輸入法中內建常用聯想字詞的詞庫清單,每當使用者上字之後,會自動顯示該字之後的可能詞組供使用者選取上字。在智慧手機中由於手指與打字區域較小的限制,這個功能的發展非常成熟。
  • 模擬音輸入:由於中文字眾多,並且不是所有人都完整熟悉每個字的發音,因此不少音碼輸入法都提供模糊音的功能,像是捲舌與不捲舌的字音。另外,有些字的標準音的通行程度不如大眾約定俗成的訛音來得高,所以有些輸入法會同時支援標準音與訛音的輸入。

字形輸入法倉頡使用 26 個字碼(主要 24 個),最長碼為五碼,文字以字形組件分割成字首與字身(有時可再分成次字首與次字身)後再各部分取碼。它擁有所有中文輸入法中最低的重碼率,因此可以實現「盲打」,意即使用者只需看著文件就能打字,不需要來來回回盯著鍵盤輸入和螢幕選字。缺點是編碼規則相對繁雜,也沒有容錯碼簡快碼(以標準倉頡而言。其他快倉、大新、或倉頡衍伸版本有實現這些功能)。

其他的大易(四十個字碼、最多取四碼)、行列(有四十和三十不同的字碼版本、最多取四碼)、五筆(二十五個字碼、最多取四碼)等等都有各自的取碼規則。它們通常按照筆順取碼,或是依照組件拆分的原則取碼。與音碼輸入法相比,形碼輸入法的重碼率非常低。

嘸蝦米取碼的規則很簡單,分別是筆順、截長補短、以及分節等三個原則。只要我們學習並融會貫通之後,搭配以形、音、義聯想法所對應的字根,就可以將大部分的常用字都順利拆碼成功。下面簡短介紹基本原理。

拆碼概論

筆順

取碼順序原則上是按照書寫的順序取碼,也就是由上到下、由左至右、由外而內地方式來取碼。

  • 頁=丁(T)、目(M)、八(B)=TMB(由上到下)
  • 郃=亼(A)、口(O)、阝(B)=AOB(由上到下、由左至右)
  • 想=木(T)、目(M)、心(H)=TMH(由左至右、由上到下)
  • 柯=木(T)、丁(T)、口(O)=TTO(由左至右、由外而內)
  • 圓=囗(O)、口(O)、目(M)、八(B)=OFMB(由外而內、由上到下)

截長補短

截長

有些字依照字根和拆碼原則拆解之後,會有較長的碼數。如果一個字取到四碼以上就太長了,因此需要截長。首先按順序取前三個碼,再跳取最後一碼,不然有些字的取碼會超乎想像。

  • 籲=竹(Z)、亼(A)、口(O)、八(B)=ZAOB(完整取碼為ZAOOOMTM
  • 籤=竹(Z)、人(B)、人(B)、一(E)=ZBBE(完整取碼為ZBBAQRSS
  • 鬱=木(T)、午(W)、凵(U)、彡(M)=TWUM(完整取碼為TWUTNXFUF

補短

如果一個字拆解之後,只取到一碼或兩碼的話,都算是短字根。這時我們就要加上一枚「輔根」,此謂之「補短」(數目字除外)。輔根就是這個字的最後一筆與此字其他筆劃所構成的形狀。舉例來說:

  • 「丁」的最後一筆畫是「亅」,因此丁=TI(和其他筆劃沒有交集,而形成獨立一豎,像英文字母的 I)
  • 「目」的最後一筆形成了「口」形,因此目=MO(和其他筆劃形成一個完整的封閉形狀,像英文字母的 O)
  • 「爾」的最後一筆形成了「乂」形,因此爾=RX(和其他筆劃斜線交叉)

在嘸蝦米輸入法中,一個字至少是兩個碼。之後會另外介紹一碼字的數目輸入和快速字根。

分節

有些字根是在方框內,或是被包圍起來,這時我們就需要分節來找出每個字根。

  • 申=〡(I)、田(Q)、〡(I)=IQI
  • 兩=一(E)、巾(N)、入(B)、入(B)=ENBB
  • 圓=口(O)、口(O)、目(M)、八(B)=OOMB

先把聯貫性形、音、義的字根定義記熟以後,再依照上面的取碼規則,多練習一段時間,打字的速度就會愈來愈快了。

Leave a Comment

Your email address will not be published. Required fields are marked *

5 × 3 =

Scroll to Top