极爽词库4.3 for fcitx

此文原文标题为《极爽词库6.0官方标准版本for fcitx》,后发现,其实4.3版的词库才是经典。
因此现在我也改用4.3版的词库。


极点五笔输入法确实是非常优秀的输入法,目前最新版为7.3版,采用的是“极爽词库4.3版 for 极点五笔UniCode版本” 。不过不知道为什么它不用6.0版的极爽词库。
在WINDOWS 下面,下载 极爽词库6.0官方标准版for极点五笔,解压出来得 freeime.mb ,然后用它替换freeime/mb/default目录下面的相同文件。用极品五笔的词库导出功能将词库导出为一个txt文件。
用极品五笔的词库导出功能将词库导出为一个txt文件。
词库信息=极爽词库6.0官方标准版本 for 极点五笔UniCode版本
生成日期:2010-4-16 19:57

OK了,有了需要的东东。下面切换到LINUX下面。
由于导出的txt文件编码格式是utf-16le的,因此我们得对它进行转码,而且,文件的格式是DOS格式,得转换为UNIX格式的换行。
用神器VIM吧。

1
2
3
:set ff=unix
:set fileencoding=utf-8
:set nobomb

然后删除 从 [Description] 到 [Text] 的内容,并保存。
接下来就用荒野自己写的极点词库转fcitx词库的PHP脚本来转换词库了:

linuxsir论坛的第六元素已经指出二者码表的主要不同之处:
其实fcitx码表源文件的结构和极点的码表结构差不多,除了一些附件信息外,唯一的差别就在于对重码字词的安排上,极点的是放在一个条目下的,而fcitx是分开放的。
所以转换的关键就在于把“zykg 斋 主客观 左右开弓 颤 ”之类变成
“zykg 斋
zykg 主客观
zykg 左右开弓
zykg 颤”

jd2fcitx.php.zip (679 字节)

1
php jd2fcitx.php freeime.txt my-jishuang4.3.txt


不知道极爽词库最后以/开头且后面接着是 gs***** 的东东是干神马的,这里我还是留着,没有去掉。
其实也可以用fcitx 3.6.x版中附带的jd2fcitx 来转换,不过转换之前要注意把极爽的一些特殊标记去除(如~ ^ ! / 等 ),我写的jd2fcitx.php默认过滤掉了这些的。

1
2
cp /usr/local/share/fcitx/table/wbx.mb .
mb2txt wbx.mb > wbx.txt

获得一个fcitx码表的模板,然后重命名之:

1
2
mv wbx.txt ihacklog-jishuang-v4.3.txt
vim ihacklog-jishuang-v4.3.txt

[数据] 下面的东东全部删除,
然后

1
:read my-jishuang4.3.txt

保存之。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[admin@huangye temp]$ txt2mb ihacklog-jishuang-v4.3.txt ihacklog-jishuang-v4.3.mb
Delete:  dirr $X[极点目录]%freeime%, Too long
Delete:  joke 嘦巭好,兲嫑跑*_*!, Too long
Delete:  minute $MI分, Too long
Delete:  minute $mi分, Too long
Delete:  month $M月, Too long
Delete:  month $m月, Too long
Delete:  mute $x[静音开关]mute, Too long
Delete:  now $y$m$d$0h时$0mi分$0s秒, Too long
Delete:  opencd $x[弹出CD]opencd, Too long
Delete:  second $S秒, Too long
Delete:  second $s秒, Too long
Delete:  tray $x[最小化桌面窗口]tray, Too long
Delete:  zzxe ю

Reading 87891 records.
1
2
3
4
5
cp -v ihacklog-jishuang-v4.3.mb ~/.config/fcitx/table/
cp /usr/local/share/fcitx/table/wbx.conf .
mv wbx.conf ihacklog-jishuang43.conf
vim ihacklog-jishuang43.conf
cp -v ihacklog-jishuang43.conf ~/.config/fcitx/table/

ihacklog-jishuang43.conf 内容如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
[CodeTable]
Name=Jishuang4.3
IconName=wubi
File=ihacklog-jishuang-v4.3.mb
AdjustOrder=AdjustNo
Priority=1
UsePY=True
PYKey=z
AutoSend=-1
NoneMatchAutoSend=0
UseMatchingKey=True
MatchingKey=z
AutoPhrase=True
AutoPhraseLength=4
AutoPhrasePhrase=True
SaveAutoPhrase=3
ExactMatch=False
PromptTableCode=False
Symbol=zzzz

干掉fcitx ,然后重新启动fcitx : fcitx -d
可以看到已经成功加载我亲手制作的词库了 :mrgreen:

Info:table.c:182-Load Table Config File:wbpy.conf
Info:table.c:182-Load Table Config File:jishuang6.0.conf
Info:table.c:182-Load Table Config File:wbx.conf
Info:table.c:182-Load Table Config File:jidian_huangye.conf
Info:table.c:266-Load Table Dict from /home/admin/.config/fcitx/table/ihacklog-jishuang-v4.3.mb

下一步如果有时间的话就研究下怎么把拼音词库与五笔词库合并,生成新的五笔拼音码表。

最后感谢Yuking写了fcitx这么优秀的输入法软件,还要感谢谢 fcitx 4的开发者csslayer ,感谢窝子,做出极爽词库这么好用的词库。
窝子的老巢http://wozy.wordpress.com/jishuang/
窝子的新巢http://wozy.in/

更多
11 Responses Post a comment
  1. deadbeef 0.5.2-rc3 发布 | Hacklog

    [...] http://fcitx-im.org/wiki/Compile_from_source https://code.google.com/p/fcitx/ http://ihacklog.com/software/tips/jishuang-codetable-version-6-0-for-fcitx.html var cur_host=top.location.hostname; var huangye_host="ihacklog.com"; if ( huangye_host != [...]

  2. 荒野无灯

    另外,极点官网有个“ 念青词库(98版)”,不知道怎么样?

  3. 荒野无灯

    原来已经出“十周年纪念版”了,我速度更新去~~,话说极点的官网有好长一段时间无法访问,现在终于又复活了。
    ps:经你这么说,还是4.3版的词库经典~~我当时也没有仔细研究,只看了它的版本号。

  4. wzyboy

    @荒野无灯
    经过一番折腾,我把极点五笔十周年版的自带词库弄到 fcitx 了,而且保留了 zzbd、zzpy 这样快速输入的功能。其实只要在 txt 文件最上面的使用的字母里添加一个 z,然后最后那些有 z 的编码就不会被 txt2mb 认为是 Invalid 而停止工作了。

  5. wzyboy

    @荒野无灯
    搜狗五笔的词库很好吗?不知道。

    昨天晚些时候,我把 ahjj “䓬”自己加到词库里了,现在可以打了,呵呵。

    另外,我发现这个极爽 6.0 反而不如极爽 4.3 啊。我特意在虚拟机里装了极点五笔十周年纪念版,看了一下,自带的词库是 2011 年生成的极爽 4.3,而你说的那个极爽 6.0 却是 2010 年生成的。

    昨天和今天用了一段时间极爽 6.0,觉得很不爽!以 wjjg 为例,它把“倡”排在了第一个,而“但是”排在了第二个!类似这样把不常用的放在首位的还有不少。我看了一下极点五笔十周年纪念版自带的极爽 4.3,那里面 wjjg 是“但是”第一位,“倡”第二位的。所以我还是打算把十周年纪念版自带的那个词库弄到 fcitx 里用吧。

  6. wzyboy

    非常感谢博主……现在 fcitx 用上了极爽词库~

    不过极爽词库里依然没有“䓬”这个字……打 ahjj 打不出……

    另外博主的教程里有一些小问题,即用 txt2mb 的时候,源文件里最后一段自定义的 zzbd 之类的, txt2mb 是读不出的,得删除掉……

    当然还是再次、非常感谢博主提供了这么好的教程啊~

  7. 荒野无灯

    其实,只要你花点时间去学的话,不出一周你就会能用五笔打字了

  8. 一苇

    自从学会上网的那一天开始,就没用过五笔...因为我太懒了,懒得去背...

  9. 荒野无灯

    呵呵,原来用过ibus五笔,貌似它的拼音还不错,没试用过。五笔还是fcitx的强项了 :mrgreen:

Leave a Reply

Note: You may use basic HTML in your comments. Your email address will not be published.

Subscribe to this comment feed via RSS