当前位置:首页 > 帮助

五笔输入法  帮助中心

冰凌五笔输入法系统词库管理

一、词库管理操作

1.导入

将用户定义的TXT词库文件转换为IMC码表文件,并添加选定为当前系统码表文件。

2.导出

将当前系统IMC码表文件转换保存为TXT词库文件,供用户编辑和修改。

3.另存

将当前系统IMC码表文件另行保存为IMC结构文件备用。

4.添加

将用户的IMC码表文件添加并选定为当前系统码表文件。

5.移除

移除当前系统码表文件。

6.选库

通过“请选定当前系统词库”下面的系统词库列表,用户可改变当前系统词库。

7.帮助

打开官网上的系统词库管理帮助页面。

8.退出

退出系统词库管理操作。

二、词库文件格式

1.IMC码表文件

IMC码表文件为冰凌五笔输入法的系统码表文件,为二进制格式,用户不能直接编辑、修改。

2.TXT词库文件

TXT词库文件为冰凌五笔输入法的系统词库文件,为Unicode文本格式,用户可以编辑和修改。其由码表头和码表两部分组成,具体如下:

(1)码表头

码表头定义了词库及相应输入法的一些基本属性,其以[CODETABLEHEADER]为引导,以行为单位。每一行定义一个属性值,其中等号左边为属性名称,等号右边为属性值。具体结构如下例所示:

[CODETABLEHEADER]

Name=极爽词库

Version=6.0.0.190521

Author=窝子

CodeScheme=五笔字型86版

PhraseRule=1

ChineseSet=2

CodeCount=94169

CodeLength=4

WordLength=13

WordFreq=1

Wildcard=z

Elements=abcdefghijklmnopqrstuvwxy

其中:

Name为词库名称,由词库作者命名,不超过20个汉字或字符。

Version为词库版本号,由词库作者命名,不超过20个字符。

Author为词库作者名称,不超过20个汉字或字符。

CodeScheme为编码方案,由词库作者确定,不超过20个汉字(字符)。

PhraseRule为词组编码规则描述,其中0为不支持自动造词;1为按黙认的五笔词组编码规则自动造词;其他暂不支持。

ChineseSet为支持的最大汉字符集,其中GB2312-1980字符集为0,GBK-1995字符集为1,GB18030-2000字符集为2,其余暂不支持。

CodeCount为编码总数,即码表区的编码总项数。

CodeLength为最大编码长度,取值范围为3-12。

WordLength为最大编码词长,即所有编码项中字词的最大汉字数,取值范围为1-63。

WordFreq为编码项中是否包含词频,包含为1,不包含为0。

Wildcard为输入法的通配符,五笔字型为z,拼音为0,其他由编码方案确定。

Elements为输入法所使用的码元集,其中码元为a-z,按字母升序排列。

(2)码表

码表定义了词库的所有编码项,其以[CODETABLE]为引导,以行为单位。每一行定义一个编码项,左边为编码,中间为字词,右边为词频,三者以TAB分隔。具体结构如下例所示:

[CODETABLE]

a 工 12661

aa 式 12346

aaa 工 12661

aaaa 工 12661

aaaa 恭恭敬敬 693

aaaa 劳斯莱斯 166

aaaa 花花草草 64

aaaa 期期艾艾 45

aaad 工期 2248

…… …… ……

其中:

编码必须符合输入法编码规范,且每词(字)一码,每码一行。

词频不是必须的,如果不包含词频,应将码表头中的WordFreq属性设置为0。词频为本词库的相对词频,最大值不能超过65535。

码表部分的所有编码项必须以字母升序为主、词频降序为副进行排序。

三、特别提醒

1.每行前后不能有空格或TAB字符。

2.文件必须使用Windows记事本保存为Unicode类型的文本文件。

3.编码的字词用字必须符合ChineseSet要求,不能超集用字。更不能使用多字节汉字。