极爽词库4.3 for fcitx
此文原文标题为《极爽词库6.0官方标准版本for fcitx》,后发现,其实4.3版的词库才是经典。
因此现在我也改用4.3版的词库。
极点五笔输入法确实是非常优秀的输入法,目前最新版为7.3版,采用的是“极爽词库4.3版 for 极点五笔UniCode版本” 。不过不知道为什么它不用6.0版的极爽词库。
在WINDOWS 下面,下载 极爽词库6.0官方标准版for极点五笔,解压出来得 freeime.mb ,然后用它替换freeime/mb/default目录下面的相同文件。用极品五笔的词库导出功能将词库导出为一个txt文件。
用极品五笔的词库导出功能将词库导出为一个txt文件。
词库信息=极爽词库6.0官方标准版本 for 极点五笔UniCode版本
生成日期:2010-4-16 19:57
OK了,有了需要的东东。下面切换到LINUX下面。
由于导出的txt文件编码格式是utf-16le的,因此我们得对它进行转码,而且,文件的格式是DOS格式,得转换为UNIX格式的换行。
用神器VIM吧。
1 2 3 | :set ff=unix :set fileencoding=utf-8 :set nobomb |
然后删除 从 [Description] 到 [Text] 的内容,并保存。
接下来就用荒野自己写的极点词库转fcitx词库的PHP脚本来转换词库了:
linuxsir论坛的第六元素已经指出二者码表的主要不同之处:
其实fcitx码表源文件的结构和极点的码表结构差不多,除了一些附件信息外,唯一的差别就在于对重码字词的安排上,极点的是放在一个条目下的,而fcitx是分开放的。
所以转换的关键就在于把“zykg 斋 主客观 左右开弓 颤 ”之类变成
“zykg 斋
zykg 主客观
zykg 左右开弓
zykg 颤”
jd2fcitx.php.zip 下载 (679 字节, 35 次)
1 | php jd2fcitx.php freeime.txt my-jishuang4.3.txt |
不知道极爽词库最后以/开头且后面接着是 gs***** 的东东是干神马的,这里我还是留着,没有去掉。
其实也可以用fcitx 3.6.x版中附带的jd2fcitx 来转换,不过转换之前要注意把极爽的一些特殊标记去除(如~ ^ ! / 等 ),我写的jd2fcitx.php默认过滤掉了这些的。
1 2 | cp /usr/local/share/fcitx/table/wbx.mb . mb2txt wbx.mb > wbx.txt |
获得一个fcitx码表的模板,然后重命名之:
1 2 | mv wbx.txt ihacklog-jishuang-v4.3.txt vim ihacklog-jishuang-v4.3.txt |
把 [数据] 下面的东东全部删除,
然后
1 | :read my-jishuang4.3.txt |
保存之。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | [admin@huangye temp]$ txt2mb ihacklog-jishuang-v4.3.txt ihacklog-jishuang-v4.3.mb Delete: dirr $X[极点目录]%freeime%, Too long Delete: joke 嘦巭好,兲嫑跑*_*!, Too long Delete: minute $MI分, Too long Delete: minute $mi分, Too long Delete: month $M月, Too long Delete: month $m月, Too long Delete: mute $x[静音开关]mute, Too long Delete: now $y年$m月$d日$0h时$0mi分$0s秒, Too long Delete: opencd $x[弹出CD]opencd, Too long Delete: second $S秒, Too long Delete: second $s秒, Too long Delete: tray $x[最小化桌面窗口]tray, Too long Delete: zzxe ю Reading 87891 records. |
1 2 3 4 5 | cp -v ihacklog-jishuang-v4.3.mb ~/.config/fcitx/table/ cp /usr/local/share/fcitx/table/wbx.conf . mv wbx.conf ihacklog-jishuang43.conf vim ihacklog-jishuang43.conf cp -v ihacklog-jishuang43.conf ~/.config/fcitx/table/ |
ihacklog-jishuang43.conf 内容如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 | [CodeTable] Name=Jishuang4.3 IconName=wubi File=ihacklog-jishuang-v4.3.mb AdjustOrder=AdjustNo Priority=1 UsePY=True PYKey=z AutoSend=-1 NoneMatchAutoSend=0 UseMatchingKey=True MatchingKey=z AutoPhrase=True AutoPhraseLength=4 AutoPhrasePhrase=True SaveAutoPhrase=3 ExactMatch=False PromptTableCode=False Symbol=zzzz |
干掉fcitx ,然后重新启动fcitx : fcitx -d
可以看到已经成功加载我亲手制作的词库了
:
Info:table.c:182-Load Table Config File:wbpy.conf
Info:table.c:182-Load Table Config File:jishuang6.0.conf
Info:table.c:182-Load Table Config File:wbx.conf
Info:table.c:182-Load Table Config File:jidian_huangye.conf
Info:table.c:266-Load Table Dict from /home/admin/.config/fcitx/table/ihacklog-jishuang-v4.3.mb
下一步如果有时间的话就研究下怎么把拼音词库与五笔词库合并,生成新的五笔拼音码表。
最后感谢Yuking写了fcitx这么优秀的输入法软件,还要感谢谢 fcitx 4的开发者csslayer ,感谢窝子,做出极爽词库这么好用的词库。
窝子的老巢http://wozy.wordpress.com/jishuang/
窝子的新巢http://wozy.in/








非常感谢博主……现在 fcitx 用上了极爽词库~
不过极爽词库里依然没有“䓬”这个字……打 ahjj 打不出……
另外博主的教程里有一些小问题,即用 txt2mb 的时候,源文件里最后一段自定义的 zzbd 之类的, txt2mb 是读不出的,得删除掉……
当然还是再次、非常感谢博主提供了这么好的教程啊~
@wzyboy
要是能把搜狗的词库导出就好了~~
@荒野无灯
搜狗五笔的词库很好吗?不知道。
昨天晚些时候,我把 ahjj “䓬”自己加到词库里了,现在可以打了,呵呵。
另外,我发现这个极爽 6.0 反而不如极爽 4.3 啊。我特意在虚拟机里装了极点五笔十周年纪念版,看了一下,自带的词库是 2011 年生成的极爽 4.3,而你说的那个极爽 6.0 却是 2010 年生成的。
昨天和今天用了一段时间极爽 6.0,觉得很不爽!以 wjjg 为例,它把“倡”排在了第一个,而“但是”排在了第二个!类似这样把不常用的放在首位的还有不少。我看了一下极点五笔十周年纪念版自带的极爽 4.3,那里面 wjjg 是“但是”第一位,“倡”第二位的。所以我还是打算把十周年纪念版自带的那个词库弄到 fcitx 里用吧。
另外,极点官网有个“ 念青词库(98版)”,不知道怎么样?
原来已经出“十周年纪念版”了,我速度更新去~~,话说极点的官网有好长一段时间无法访问,现在终于又复活了。
ps:经你这么说,还是4.3版的词库经典~~我当时也没有仔细研究,只看了它的版本号。
@荒野无灯
经过一番折腾,我把极点五笔十周年版的自带词库弄到 fcitx 了,而且保留了 zzbd、zzpy 这样快速输入的功能。其实只要在 txt 文件最上面的使用的字母里添加一个 z,然后最后那些有 z 的编码就不会被 txt2mb 认为是 Invalid 而停止工作了。
自从学会上网的那一天开始,就没用过五笔…因为我太懒了,懒得去背…
其实,只要你花点时间去学的话,不出一周你就会能用五笔打字了
俺用fcitx的拼音.五笔不会啊…
呵呵,原来用过ibus五笔,貌似它的拼音还不错,没试用过。五笔还是fcitx的强项了