当前位置:首页 > 帮助

五笔输入法  帮助中心

冰凌五笔输入法系统词库管理

一、词库管理操作

1.导入

将TXT词库文件转换为IMC词库文件,并以此替换当前系统词库文件。

2.导出

将当前系统词库文件转换为TXT词库文件,供用户编辑和修改。

3.另存

将当前系统词库文件另行保存备用。

4.更换

用其他IMC词库文件替换当前系统词库文件。

二、词库文件格式

1.IMC词库文件

IMC词库文件为冰凌五笔输入法的系统词库文件,为二进制格式,用户不能直接编辑、修改。

2.TXT词库文件

TXT词库文件为冰凌五笔输入法的系统词库脚本文件,为Unicode文本格式,用户可以编辑和修改。其由码表头和码表两部分组成,具体如下:

(1)码表头

码表头定义了词库及输入法编码的一些基本属性,其以[CODETABLEHEADER]为引导,以行为单位。每一行定义一个属性值,其中等号左边为属性名称,等号右边为属性值。具体结构如下例所示:

[CODETABLEHEADER]

Name=冰凌词库

Version=3.1.2.025

CodeScheme=00

ChineseSet=1

CodeCount=123351

CodeLength=4

WordLength=13

WordFreq=1

Wildcard=z

Elements=abcdefghijklmnopqrstuvwxy

其中:

Name为词库名称,不超过20个汉字或字符。

Version为词库版本号,不超过20个字符。

CodeScheme为编码方案,其中五笔86版为00,五笔98版为01,五笔新世纪版为02,五笔其他版为03;全拼为10,双拼为11,其他拼音为12。

ChineseSet为汉字符集,其中GB2312-1980字符集为0,GBK-1995字符集为1,GB18030-2000字符集为2,GB18030-2005字符集为3,BIG5-1984为4,BIG5-2003为5,其他为6。

CodeCount为编码总数,即码表区的编码总项数。

CodeLength为最大编码长度,不超过12个字符。

WordLength为最大编码词长,即所有编码项中字词的最大汉字数,不超过63个汉字。

WordFreq为编码项中是否包含词频,包含为1,不包含为0。

Wildcard为输入法的通配符,五笔字型为z,拼音为0。

Elements为输入法所使用的码元集,其中码元为a-z,按字母升序排列。

(2)码表

码表定义了词库的所有编码项,其以[CODETABLE]为引导,以行为单位。每一行定义一个编码项,左边为编码,中间为字词,右边为词频,三者以TAB分隔。具体结构如下例所示:

[CODETABLE]

a 工 12661

aa 式 12346

aaa 工 12661

aaaa 工 12661

aaaa 恭恭敬敬 693

aaaa 劳斯莱斯 166

aaaa 花花草草 64

aaaa 期期艾艾 45

aaad 工期 2248

…… …… ……

其中:

编码必须符合五笔字型编码规范,且每词(字)一码,每码一行。

词频不是必须的,如果不包含词频,应将码表头中的WordFreq属性设置为0。词频为本词库的相对词频,最大值不能超过65535。

码表部分的所有编码项必须以字母升序为主、词频降序为副进行排序。

三、特别提醒

1.每行前后不能有空格或TAB字符。

2.文件必须使用Windows记事本保存为Unicode类型的文本文件。