第2章 五笔的拆字规律 | ||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| http://www.pcdog.com 2004-11-5 本书编委会 | ||||||||||||||||||||||||||||||
|
由于五笔字型是根据汉字的字形编码输入汉字的,因此要学习使用五笔字型汉字输入技术,首先要了解汉字结构的基础知识。 2.1.1 汉字的三个层次汉字起源于象形文字,随着社会的发展,楷化以后的汉字对图形线条和笔势进行了规范,形成笔画。由若干笔画复合交叉连接形成的相对不变的结构为字根(又称为偏旁部首)。字根按一定和位置关系拼合形成为数众多的汉字。因此,汉字可以划分为三个层次:笔画、字根和单字。 2.1.2 汉字五种基本笔画笔画的定义:书写汉字时,一次写成的一个连续不断的线段。 (1)两笔写成者不叫笔画如“十、口”等,只能叫笔画结构。 (2)一个连贯的笔画,不能断开成几段来处理。 如:不能把“申”分解为“丨、田、丨”等。 一般从书写形态上认为汉字的笔形有:点、横、竖、撇、捺、挑(提)、钩、(左右)折等八种。但如果只考虑笔画的运笔方向,不计其长短轻重,可将笔画划分为五种:横、竖、撇、捺、折。为了便于记忆和应用,根据这五种笔画使用频率的高低,依次用1、2、3、4、5作为它们的代码,如表2-1所示。 表2-1 汉字的五种笔画
在上表中可以看出,除基本笔画外,还对汉字进行了归类。这样归类的理由是:在汉字的具体形态结构中,其基本笔画“横、竖、撇、捺(点)、折”常因笔势和结构上的匀称关系而产生某些变形。例如,把“|”一带笔变成了“亅”(左竖钩),把“点”归结为“捺”类,是因为两者运笔方向基本一致;把挑(提)归结于“横”类;除竖能代替左竖钩以外,其他带转折的笔画都归结为“折”类。 这些基本笔画的变形可以用一句口诀来记忆:“提笔”视为横,“点点”视为捺,“左竖钩”为竖,“带折”均为“折”。 五种笔画构成字根时,笔画之间的位置关系有如下五种不同的情况。 (1)单:一个笔画本身就构成一个字根。例如,一,丨,丿等。 (2)散:构成一个字根的笔画之间有一定的距离。例如,构成字根川、八、氵等的笔画之间均有距离。 (3)连:构成一个字根的笔画之间是相连的。例如,构成字根工、人、厂等的笔画之间单笔相连,构成字根口、尸、已等的笔画之间笔笔相连。 (4)交:构成一个字根的笔画之间互相交叉。例如,在构成十、力、又等字根中,笔画之间都有交叉关系。 (5)混合:构成一个字根的各笔画之间既有连又有交或散的关系。例如,纟、禾、雨等。 掌握上面的笔画与笔画之间的五种关系,对于学习五笔字型汉字输入技术中的非基本字根的拆分方法以及“末笔字型交叉识别码”的取法是有用的。 2.1.3 汉字笔画的书写顺序在书写汉字时,应该按照如下规则: 先左后右,先上后下,先横后竖,先撇后捺,先内后外,先中间后两边,先进门后关门等。 2.1.4 汉字的部件结构在五笔字型编码输入方案中,选取了大约130个部件作为组字的基本单元,并把这些部件称为基本字根。众多的汉字全部由它们组合而成。如,明字由日月组成,吕字是由两个口组成;在这些基本字根中有些字根本身就是一个完整的汉字,例如:日月人火手等。 2.1.5 汉字的部位结构基本字根按一定的方式组成汉字,在组字时这些字根之间的位置关系就是汉字的部位结构。 (1)单体结构。由基本字根独立组成的汉字,例如:目、日、口、田、山等。 (2)左右结构。左右结构的字由左右两部分或左中右三部分构成,例如:朋、引、彻、喉等。 (3)上下结构。上下结构的字由上下两部分或自上往下几部分构成,例如:吕、旦、党、意等。 (4)内外结构。汉字由内外部分构成,例如:国、向、句、匠、达、库、厕、问等。 2.1.6 汉字的三种字型汉字的字型指的是字根构成汉字时,字根在汉字中所处的位置关系。成千上万的汉字可以划分为三种类型:左右型、上下型和杂合型。按照各种字型拥有汉字的多少,分别用1、2、3作为代码,如图2-1所示。
图2-1 汉字字型表 三种字型的划分是基于对汉字整体轮廓的认识,指的是在整个汉字中字根之间排列的相互位置关系。这样划分汉字的字型以后,汉字的字型特征可以用做识别汉字的一个重要依据。下面分别说明三种类型。 1型:汉字的各字根之间有明显的左右位置关系且其间有一定距离,划归为左右型。在左右型汉字中,或者字根从左到右依次排列,或者一个字根与另一个字根的组合呈左右排列。所有左右型的汉字,都可用“一刀”或“两刀”纵向切开分成左右两个或三个部分。例如:肚、拥、咽、浙、枫等。虽然“枫”的右边是两个基本字根按内外型组合成的,但整字仍属于左右型。 2型:汉字的各字根之间有明显的上下位置关系且其间有一定距离划归为上下型。在上下型汉字中,或者字根从上到下依次排列,或者一个字根与另一个字根的组合呈上下排列。所有上下型的汉字,都可用“一刀”或“两刀”横向切开分成上下两个或三个部分。例如:字、节、看、意、想、花等。 3型:称为杂合型。包括部位结构的单字和内外型的汉字,即:没有简单、明显的上下和左右结构的汉字,一律划归为杂合型。 在向计算机输入汉字时,只靠告诉计算机该字是由哪几个字根组成的,往往还不够,例如:“叭”和“只”字,都是由“口”和“八”两个字根组成的,为了区别究竟是哪一个字还必须把字型信息告诉计算机。 将来,在给汉字编码时,“字型”及其代号将是非常有用的编码信息。但是,仅仅对于那些由2个或3个字根组成的字,我们才关心它的“字型”。如果一个汉字由4个或4个以上的字根组成,仅仅字根的编码已经达到了最大长度4个码,编码时,我们就不再计较是什么“型”,即不再追加“识别码”了。 2.1.7 汉字的结构分析一切的汉字都可由字根拼合构成,许多作为汉字一部分的单体(既没有被选作为字根,又不是汉字),如“”、“夬”等,也都可由字根构成。字根在构成单字或单体结构时,字根与字根之间的关系可分为单、散、交四种类型。 (1)单:指基本字根本身单独成为一个汉字。字根只有一个。 例:口、木、山、田、马、雨、寸、尸等。 (2)散 :指基本字根不止一个且其间有一定的间距构成的汉字。 例:仇、字、如、汉、没、吕、足、想。 它们之中有左右、上下、杂合之分,从而形成了三种不同的字形,当对汉字提取左右、上下、杂合型的字型信息时,正是以字根之间这种,“散”的关系为前提的。由字根这种散离拼合形成的字,称为“散根结构”。 (3)连:指基本字根连一单笔画或带点结构(属于杂合型)。 例:自(丿目)、义(丶丶丿)、产(立丿)、才(十丿)、不(一小)、且(月一)、尺(尸丶)、千(丿十)、斥(斤丶)、叉(又丶)、夭(丿大)、乏(丿之)、户(丶尸)、术(木丶)、主(丶王)、下(一卜) 其中:单笔画可连上或连下,如“丿”下连“目”形成“自”,而“丿”下连“十”形成“千”,“月”下连“一”形成“且”,这种情况下的字根与单笔画之间不能当做散的关系。 连的另一种情况是“带点结构”,如:勺、术、户、斥、叉、主、玉等字中的“丶”,近也可,稍远也可,连也可,不连也可,为了使问题简化,王码规定,一个基本字根之前或之后的孤立点,一律视作与基本字根相连。 因此,一切基本字根连一单笔画或带点结构所形成的汉字,都是不能分为几个保持一定距离的部分的。所以,在判断这一类汉字的字型时,它们不可能是左右型或上下型,而只能是属于杂合型。 (4)交:指基本字根相交叉的汉字。 例:里(日土)、未(二小)、未(一木)、申(日丨)、东(七小)、必(心丿)、中(口丨)、本(木一)、夫(二人) 字根在构成汉字时,还有一种情况是混合型,即字根与字根之间既有交的关系,又有连的关系。例如“丙”是“一”下连一个“内”,而“内”是由“冂”和“人”相交而成。 汉字的这种单、散、连、交的构成形式与汉字字型之间有一定的联系。当汉字由一个字根构成时,不需划分字根;只有当构成汉字字型之间的关系是“散”时,汉字才可分为左右型或上下型;对字根与字根之间的关系属于“连”或“交”的汉字,一律划归为杂合型。 | ||||||||||||||||||||||||||||||
|
|
