注意!
本版本的雲碼存在諸多不合理處,暑期會開啟雲碼2.0計劃,敬請期待。
方案名「kumo」取自「雲」字之日語讀音「くも」。
與眾多人一致,開始我衹會使用拼音,後接觸了小鶴雙拼方案,這也是早期我認爲完美的拼音方案。 後來得空,我學習了小鶴音形,四碼定長且打二字詞與雙拼無異,單字則以形定字,由此我無法再接受要翻頁選重的純拼音方案; 小鶴也非完美解荅,其不開源的特性使我最終放棄,轉而投向星空鍵道6,但之後一次遇「铓」字,該字竝不在鍵道碼表中,我意識到衹有純形碼纔能眞正全打; 也在此時,我瞭解了虎碼竝開始使用,但其繁簡重碼的特性竝不讓我滿足,後開始用號稱繁簡通打的宇浩輸入法,這是一款很優秀的輸入法,但貪心的我想在「Z」也放上根,想自己加根,「雲碼」也就此誕生。
該方案爲一雙編碼方案。 字根選取與拆分思路極大參攷了宇浩輸入法與虎碼,也加入了些自身的想法。
- 「口」「吅」「𠱠」「品」「㗊」 五類「口」是雲碼一大特點,爲避免過多的「口」使得重要部分失去編碼機會,也表徵了各種「口」之疊加形態。
- 重複碼,卽「疊」不再拆「田田田冖且」,而是「田⓷冖且」,設置了二、三、四重。
- 加入若干用於優化繁體表現的字根,如「早」用於拆「𠦝」,「來」用於拆「麥」。
- 加入少量日本新字體之字根。
方案生成上採用傳統的退火算法,字根大小碼全隨機分配,優化了繁簡重碼及手感,鍼對簡體的數據如下。 出一二簡後動重如下,如能接受三簡則選重率會更低。
「雲碼」本質爲作者自用碼,故存有大量私貨,如「竝」而非「並」,「敎」而非「教」,「卽」而非「即」,如無法接受,可自行修訂,亦可聯繫我單開一分支。
類佀宇浩碼,雲碼的編碼規則一般如下:
字根字 Aaa
字根屬字 Aaaa
雙根字 ABba
三根字 ABCc
四根字 ABCD
多根字 ABCZ
可見,雙根字有回頭碼。
特別地,雲碼有重複碼,重複碼在中段則與普通字根無異,若於末尾則有分別。下面以 Rr
表示重複碼,Yy
表示倒二字根:
二根字 ARar
三根字 ABRb
多根字 ABCY
如「靁」拆分爲「雨田⓷」,設「雨」爲「Pj」,「田」爲「Ja」,「⓷」爲「Ht」,則其編碼爲「PJHa」而非「PJHt」; 「靈」拆分爲「雨𠱠工人⓶」,設「𠱠」爲「He」,「工」爲「Hx」,「人」爲「Js」,「⓶」爲「Kz」,則其編碼爲「PHHJ」而非「PHHK」。
在三根字中,被重複部分被完全表達;多根字中,不以重複碼結尾而以被重複部分結尾。
編寫rime方案,順帶復覈涉及重複碼的拆分。 蒐集錯誤拆分中……
- 上傳rime方案文件
- 提供字根
- 提供拆分
- 打詞版
- 更新擴I區
- 提供臺字形兼容碼
2023.1.30
更新詞庫版本,改進生成總詞庫的文件結構。 添加數學詞庫,源自徐碼羣。 目前所用數學詞庫質量不高,有高質量詞庫可與我聯繫。
2023.12.21
更新繁體詞庫用字標準。 現在繁體簡詞全碼會到簡體詞之後。 爲與打單版一致,現在簡詞出在快符之後。
2023.12.9
更新繁體詞庫用字標準。
2023.12.6
完成詞庫,製作了帶有詞庫的碼表,單字碼表暫不提供簡詞;詞庫用了虎碼詞庫,未作精簡處理(之後可能會做);詞庫用字以吾個人用字爲標準。
2023.12.3
添加擴I區字。
2023.12.1
三碼避重範圍由「GB0」改爲「GBK」;修復了三碼避重算法漏洞。
2023.11.16
「斉」字拆分由「文月」改爲「齐二」,相干字「斎」由「文月小」改爲「齐二小」(出於重碼攷慮,不作「齐示」)。 修正部分含「齊」異體字拆分。
2023.11.15
「𠀜」字下部不再認定爲「业」屬字根,改拆爲「一{𰁜下}一」。
2023.11.11
「⿱丱一」不再認定爲「业」屬字根,拆作「丱一」。此改動涉及陸臺字形差異,卽「虚」亐臺字形中多作「虛」。