名称:形音部首数码输入法
专利号:200310111828.6
专利权人:覃祚剑
技术领域
本发明涉及汉字编码领域,特别是一种将汉字按部首编码、声母 作识别码的形音部首数码输入法。
背景技术
在计算机汉字输入方面,目前广泛采用的汉字输入方法主要包括 音码、形码、音形码、形音码及综合码等几大类。其中形音码是指以 笔划、字根为字的部件,按照部件的形状和读音进行汉字编码,辅以 汉字的首音字母编码。这种汉字编码方法符合汉字构成的规律和人们 的识字习惯,设计思想新颖,部件划分有独到之处,具有很强的实用 性,因此广受人们的欢迎。但现有的这些形音汉字编码方法在一定程 度上存在着诸多缺点,例如字根类别多、重码字多、规则多、复杂难 记忆、难学懂等,也有一些汉字输入法需要使用特殊的键盘才能达到 汉字输入的目的。另外,目前常用的字典、词典、成语词典的查阅大 多是按读音归类排序,按部首检索。
发明内容
本发明的目的之一是克服现有技术的不足,提供一种字根类别 少、重码字少、易学易记、用途范围广泛且使用普通电脑键盘的形音 结合的数码汉字输入法。
为了实现上述目的,本发明的形音部首数码输入法是按照《新华 字典》中的部首检字法,把汉字分成部首与主体两部分,取该汉字中 笔画最多的一个部首(头或尾)作部首,取其首笔字型代码作部首代 码,然后顺取主体的第一、第二、第三个字型代码作主体代码,不足 三个的取二个,不足二个的取一个,再取该汉字的声母作识别码。
由于采用了上述编码方法,本发明具有如下优点:
(1)字根类别少,只有○~九共十类,识别码用声母,简 单易记忆,汉字输入速度快。
(2)本法主要按照《新华字典》中的部首查字法编码, 部首略有新增删,一般小学生也能快速自学使用。
(3)用途范围广,在纯数码的计算器、手机等方面也可 使用。把识别码的声母译成数码即可,即在需要时可进行纯数码输入。
(4)重码字少,在4000~5000个常用字中大约只有2% 的重码字。
(5)使用于字典、词典、成语词典等方面查阅速度快。
具体实施方式
下面结合具体实施方式对本发明作进一步详细说明。
一、字根编码: 0:O、氵、 ツ、灬、
广G、亡M、户H、永Y、甫F(成字字根) 1:一、 П、艹、
厂C、下X、大D、干G、士S、夫F其Q(成字字根) 2:二、 丨、丄、 冫、、
土T、工G、上S、卜B、女N、车C、也Y、竹Z(成字字根) 3:三、 纟、
夕X、丘Q、斤J、片P、手S、长C、幺Y 4:四、 メ、、 扌、 弋、戈
十S、丰F、戈G 5:五、亅、 冂、 ㄈ、 ㄩ、 亻、
已J、尸S、自Z、付F,艮G 6:六、 冖、
口K、门M、甲J、西X、刀D、且Q、革G、凹A、凸T 7:七、 厶、マ、 ㄅ、刂、 口、癶、 木M、火H、登D、乙Y 8:八、 辶、疒、 牜、 氺、
人R、个G、气Q、乍Z、隹Z、牛N、小X、水S、立L、音Y、目M 9:九、ㄋ、ㄅ、 宀、 忄、 丬、旲、
日R、曰Y、田T、儿E、几J、心X、必B、走Z、非F
二、一般编码方法:
本发明主要按照《新华字典》中的部首检字法,把汉字分成部首 与主体两部分。取该汉字中笔画最多的一个部首(头或尾)作部首, 取其首笔字型代码作部首代码,然后顺取主体的第一、第二、第三个 字型代码作主体代码(不足三个的取二个,不足二个的取一个),再 取该汉字的声母作识别码。一些特殊情况的编码方法如下:
1、若该汉字中有多于一个相同笔画的部首,则按书写顺序 (上到下、左到右、外到内)取部首。
2、若该汉字是成字字根,则只取其字根代码,再取其(声 母)识别码即可;数字○~九只取其所在字根代码,无需取识别码。 例:广:0G大:1D工:2G斤:3J十:4S
○:0一:1二:2三:3四:4
五:5六:6七:7八:8九:9
3、为提高输入速度,汉字“零~拾”也无需取识别码,其 编码为:
零:00壹:11贰:22叁:33肆:44伍:55陆:66
柒:77捌:88玖:99拾:10
4、若该汉字为多音字,则取其较常用的读音之声母作识别 码;若同为常用或不常用,则按字母A~Z的先后顺序取声母作识别 码。例:
校:X(不取J)省:取S(为取X)
三、增加部首(《新华字典》中没有的部首): 0: 亥、 1:正、其、甚(龙、平)3:(长)、 6:交、央7:夋、 旬8: 肖、俞9:(及)
例:恋09L孩:074H赢0525Y喻:86Y
注:括号部分为优先部首。
四、删除部首(《新华字典》中有的部首):
0:衣1:豕、业、豆3:幺、瓜、青、麦、血 5:用、比、羊、
例:裳8603C象663X显1509X豌9165W
五、特殊部首定码(只限作部首时):
(一)酉:61、穴:98,此两个部首的主体最多只能取两个字型, 即“酉”中的“一”及“穴”中的“八”已算作主体,例:
醒6193X配615P空982K窜9866C
(二)若取下列部首的汉字,先取主体代码,后取部首代码:
0:钅1:马14:亻22:木3:贝4:田5:禾
8:目、疒9:忄09:曰日99:口
例:铅960Q驶641S贡23G赎4703S
若是两位数代码的部首,主体只有1至2个字型的,就取全 其两位代码。若多于两个字型的,就只取部首代码的前一位数(十位 数)作部首代码。例:
仁214R杏622X呆622D树7442S叶499Y
中299Z晚6630W
(注:“口”为没字型在里面的“口”,和有字型与之交叉的“口”。)
六、优先部首
(一)全包围(囗)、半包围(除“门、尸”之外的半边、半 角)部首,如匚、凵、冂、 户、广、厂、疒、勹、宀、冖、辶、 廴、 等。
(二)0:灬1:艹、龙、平(增加)2:土、
3:长(增加)4:扌5:丷8:令、今、乍
9:及(增加部首)、忄(特殊)
汉字中有上列部首,则先取上列部首作部首,若同个汉字有不止 一个上列的优先部首,则按书写顺序取部首。例:
医:531Y(匚)军:617J(冖)矿:10K(不是半包围取“石”)
点:260D(丶灬同为优先取)庞:0137P坪:215P
七、特殊字、字型
(一)不拆字型、字:王、夫、囗、冂、 水、氺、夫(只 可合并),例:注003Z(非002),失31S(非13),球3180Q(非3470)。
(二)作主体时分的字型:车2(分→)17,讠9(分→)07, 纟3(分→)36,例:库017K(非02)、裤0017K(非002)、诈807Z (非89)。
(三)作纯主体时合的字型:少83(合→)8,例:沙08S (非083),渺0883M(非088,因是非纯主体)。
(四)作非纯主体时合的字型:天31(合→)3,例:娇2332J; 作纯主体时不合:沃031W。
(五)特殊字定码:匕05B。 八、单笔部首编码:一、丨、丿、丶、
(一)与其它笔画不构成字根时,就取之作部首。例:
师2315S重339Z丞781C承783C
(二)与其它笔画构成字根时:
1、有其它复笔部首,则取其它复笔部首。例: 束522S(木)事4599S(口)质343Z(贝)
2、没有其它复笔部首,则取全该字根(一般为首笔字 型)作部首。例:
才43C丐19G专290Z
九、难检字(部首不明确的字):
(一)分左(中)右、上(中)下结构的字:
1、其中半边(左或右、上或下)是字或字根,则取其 最多笔画的半边(必须是字或字根)作部首,同多 按笔画顺序。例:
艳:(色)袋:(衣)裂:(列)临:()
2、其中两半都不是字或字根时,取其中最多笔画的部 首作部首。例:
疑:(矢)器:(犬)嚣:(页)
(二)非上下、左右结构的字、连体字,取其中最多笔画的 部首作部首。例:
隶:(水)求:(水)事:(口)哥:(口)
十、词语、成语、固定用语定码方法
取全第一个字代码,以后只取每个汉字的声母,如果多于四个字, 则只取第二、第三、最尾一个字的声母。例:
庆祝:01QZ中国:299ZG万众一心:137WZYX
中华人民共和国:299ZHRG
中国人民解放军:299ZGRJ
十一、重码字、词语等编码方法
较常用的排在前面,取排在第一项的字或词语等时,不用选 号,放过该项的字或词语等自动跳出。
十二、帮助键“V”
当不知字型代码或某字的识别码时,可按“V”键查询。例:
4V:①G戈②F丰③S十
VY:①0永②2也③3幺④8音⑤9曰