文章列表
- 簡介:什麼是嘸蝦米?
- 概論(一):字根
- 概論(二):拆碼原則(本篇)
- 字根學習(一):以字形取碼
- 字根學習(二):以字音取碼
- 字根學習(三):以字義取碼 - 數字
- 字根學習(四):以字義取碼 - 英文
- 字根學習(五):搖頭擺尾
- 字根學習(六):簡體字根
- 字根學習(七):難歸類字根
- 拆碼方法(一):眼順與筆順
- 拆碼方法(二):截長補短
- 拆碼方法(三):分節
- 拆碼方法(四):難字解說
- 拆碼方法(五):重複字處理
- 特殊符號(一):常用符號輸入
- 特殊符號(二):注音符號輸入
- 特殊符號(三):日文輸入
- 字根進階(一):簡速字根
- 字根進階(二):一碼字
- 字根進階(三):兩碼字
- 附錄A:字根總表
- 附錄B:易混淆字根解說
目錄
前言
如同上一篇的前言中所提到的,字形輸入法的規則中有字根與拆碼原則。當我們學習並熟悉中文字裡的文字組件對應到哪個字根之後,就需要搭配拆碼的原則將每個字拆成嘸蝦米碼,然後再使用嘸蝦米輸入法將字碼輸入之後,即可成功上字到電腦之中。
以音碼輸入法的注音來舉例,國家的「國」會拆碼成為「ㄍㄨㄛˊ」三個注音符號加聲調共四碼;如果再使用上下左右方向鍵選字的話,輸入一個字所需要的按鍵數可能會高達五碼以上(不計入為了上字而必須輸入的空白鍵或數字鍵)。即使字碼數僅有二到四碼,但因為中文同音字、破音字非常多,因此重碼率很高。另外,除了注音符號本身以外,沒有其他的一碼字(僅需使用一個字碼就可以輸入的字);兩碼字的部份也僅限於單音字才能使用,例如:支(ㄓ<一聲空白鍵>)、日(ㄖˋ)、無(ㄨˊ)等等,並不是任意的字根都可以組合兩碼字。
為了減少高重碼率帶來的選字延遲,提高打字速度,各家音碼輸入法使用了不同的方式去簡化輸入流程。例如使用智慧型排序、聯想詞輸入、模擬音輸入、整句輸入、雙拼、簡拼等等,以改善注音編碼的缺點。
- 智慧型排序:將同音字詞依照常用、罕用的使用頻率進行排序,使得較常用的字會出現在列表前方。有些輸入法甚至會自動學習並記憶各領域使用者的輸入內容後,優化列表排序的內容,讓使用者能更快速地選取較常輸入的字詞。
- 聯想詞:輸入法中內建常用聯想字詞的詞庫清單,每當使用者上字之後,會自動顯示該字之後的可能詞組供使用者選取上字。在智慧手機中由於手指與打字區域較小的限制,這個功能的發展非常成熟。
- 模擬音輸入:由於中文字眾多,並且不是所有人都完整熟悉每個字的發音,因此不少音碼輸入法都提供模糊音的功能,像是捲舌與不捲舌的字音。另外,有些字的標準音的通行程度不如大眾約定俗成的訛音來得高,所以有些輸入法會同時支援標準音與訛音的輸入。
字形輸入法中倉頡使用 26 個字碼(主要 24 個),最長碼為五碼,文字以字形組件分割成字首與字身(有時可再分成次字首與次字身)後再各部分取碼。它擁有所有中文輸入法中最低的重碼率,因此可以實現「盲打」,意即使用者只需看著文件就能打字,不需要來來回回盯著鍵盤輸入和螢幕選字。缺點是編碼規則相對繁雜,也沒有容錯碼和簡快碼(以標準倉頡而言。其他快倉、大新、或倉頡衍伸版本有實現這些功能)。
其他的大易(四十個字碼、最多取四碼)、行列(有四十和三十不同的字碼版本、最多取四碼)、五筆(二十五個字碼、最多取四碼)等等都有各自的取碼規則。它們通常按照筆順取碼,或是依照組件拆分的原則取碼。與音碼輸入法相比,形碼輸入法的重碼率非常低。
嘸蝦米取碼的規則很簡單,分別是筆順、截長補短、以及分節等三個原則。只要我們學習並融會貫通之後,搭配以形、音、義聯想法所對應的字根,就可以將大部分的常用字都順利拆碼成功。下面簡短介紹基本原理。
拆碼概論
筆順
取碼順序原則上是按照書寫的順序取碼,也就是由上到下、由左至右、由外而內地方式來取碼。
- 頁=丁(T)、目(M)、八(B)=TMB(由上到下)
- 郃=亼(A)、口(O)、阝(B)=AOB(由上到下、由左至右)
- 想=木(T)、目(M)、心(H)=TMH(由左至右、由上到下)
- 柯=木(T)、丁(T)、口(O)=TTO(由左至右、由外而內)
- 圓=囗(O)、口(O)、目(M)、八(B)=OFMB(由外而內、由上到下)
截長補短
截長
有些字依照字根和拆碼原則拆解之後,會有較長的碼數。如果一個字取到四碼以上就太長了,因此需要截長。首先按順序取前三個碼,再跳取最後一碼,不然有些字的取碼會超乎想像。
- 籲=竹(Z)、亼(A)、口(O)、八(B)=ZAOB(完整取碼為ZAOOOMTMB)
- 籤=竹(Z)、人(B)、人(B)、一(E)=ZBBE(完整取碼為ZBBAQRSSE)
- 鬱=木(T)、午(W)、凵(U)、彡(M)=TWUM(完整取碼為TWUTNXFUFM)
補短
如果一個字拆解之後,只取到一碼或兩碼的話,都算是短字根。這時我們就要加上一枚「輔根」,此謂之「補短」(數目字除外)。輔根就是這個字的最後一筆與此字其他筆劃所構成的形狀。舉例來說:
- 「丁」的最後一筆畫是「亅」,因此丁=TI(和其他筆劃沒有交集,而形成獨立一豎,像英文字母的 I)
- 「目」的最後一筆形成了「口」形,因此目=MO(和其他筆劃形成一個完整的封閉形狀,像英文字母的 O)
- 「爾」的最後一筆形成了「乂」形,因此爾=RX(和其他筆劃斜線交叉)
在嘸蝦米輸入法中,一個字至少是兩個碼。之後會另外介紹一碼字的數目輸入和快速字根。
分節
有些字根是在方框內,或是被包圍起來,這時我們就需要分節來找出每個字根。
- 申=〡(I)、田(Q)、〡(I)=IQI
- 兩=一(E)、巾(N)、入(B)、入(B)=ENBB
- 圓=口(O)、口(O)、目(M)、八(B)=OOMB
先把聯貫性形、音、義的字根定義記熟以後,再依照上面的取碼規則,多練習一段時間,打字的速度就會愈來愈快了。