一個萬古常青的、小而美的輸入法
萬古常青
- apt install fcitx-sunpinyin 即可安裝。Ubuntu和Debian不倒,就一直有。
美
- 系統詞庫為libgooglepinyin和sunpinyin的合并去重版,詞比它們都多。
- 用sunpinyin訓練了字的三元語法模型:Total 3 level ngram: 5682 226342 360548,號稱592572詞。
- 訓練語料為1.6G的百科問答,既包羅萬象,又貼近口語。
小
- 5.8M lm_sc.t3g; 2.6M pydict_sc.bin,約為sunpinyin自帶數據的1/7。壓縮后4.2M〔下載〕
安裝
- 先裝sunpinyin,再覆蓋它的數據。
- 別忘了在fcitx配置里,把“Sunpinyin猜測的句子個數”設為1或更多。
用戶詞典
- 用戶詞典為~/.sunpinyin/userdict,是個sqlite數據庫,包里有程序可飛速加詞。用sqlite可導出編輯詞庫。
開發過程與細節
常青
- 我在寫這篇隨筆時,就像在和親愛的讀者您交談一樣:-),腦海浮現出的是讀音,不是一串漢字。字形輸入法屬于過去的專業打字員,面對稿件,見字輸字,不讀,不想。
- 在辦公室對著話筒說“親愛的讀者們?” 手寫輸入?我“提筆忘字”啊。有次填表,先在手機上拼音輸入,再逐筆畫抄。
- 腦電波?好吧,“常青到我死為止”。
Service Pack 1
沒必要了。
① 我倒是gcc -static了jiaci.cpp,2.4MB。雖說還是比某輸入法安裝包89M,安裝后200多M小得多,但是:
libsunpinyin3v5 /usr/lib/x86_64-linux-gnu/libsunpinyin.so.3.0
要編譯jiaci.cpp才需要apt install libsunpinyin-dev
② “指鹿為馬”沒有,本想把四字及更多字詞加入系統詞典,但是它里面也沒有。可下載別的詞典,把里面的(一些)詞加到用戶詞典中。
③ 到〔靈格斯網站〕就能下載地名、詩詞、歇后語,成語詞典。可用〔kdictionary-lingoes〕把.ld2/.ldx文件轉成文本文件。
④ 本輸入法有時輸入一串拼音,首選不對。請給它個機會,手工把第一個字選對,然后一般一串字全對。然后就進用戶詞典了(記憶強度可調)。

浙公網安備 33010602011771號