世界各国文字有两大类型:意音文字和拼音文字。前者以汉字为代表,后者以英语为代表。词符是记录语言中词的符号。字符是文字体系所使用的符号。本文用基本字符指称拼音文字的字母和汉字的基本偏旁。拼音文字只有30个左右的基本字符就可以构成整个文字体系。与此相比,汉字的基本字符总量太多,必须要控制其总量。甲骨文基本字符的整理和研究是一项重要的研究课题。统计其数量应包括已释字和未释字、单用者和无单用者等。精简基本字符的方法有四:声化;类化;裂变;混同。汉字的繁难之处并非笔画多,而是要控制基本字符的总量。我们不能为了减少汉字的笔画,而去随意破坏字理,去增加汉字基本字符的总量,如“头”“乐”“专”“ ”等。
作者简介:
黄天树,首都师范大学甲骨文研究中心。
一 词符、字符
世界上的文字有两大类型①:一类是使用意符和音符的意音文字②,意音文字以汉字为代表。另一类是使用音符的拼音文字③,拼音文字以英文为代表。现在,世界上绝大多数的文字都是拼音文字。中国试行的汉语拼音文字也是拼音文字。为了便于理解,下面讲拼音文字时,以汉语拼音文字为例来代替英文等拼音文字。
谈汉字的基本字符问题,需要先明确“词符”和“字符”的概念。裘锡圭先生在研究汉字的性质时,提出了著名的“两个层次符号理论”④。他说:“我把文字符号分成两个层次,即语言的符号和构成文字的符号。后一种符号的名称——‘字符’,就是先生(引者按:指朱德熙先生)给取的。”⑤词符专指记录语言中词的符号。字符专指文字所使用的符号。作为记录语言中词的符号(词符),跟文字本身所使用的符号(字符)是性质完全不同的东西。语言中的词都是语音和语义的结合体,作为记录语言中的词的符号(词符)也必然既有音又有义。就这一点来说,英文和汉字之间并没有区别。有的学者说:
就甲骨文字的整个体系来说,就它的发展阶段来说,就它的根本功能和作用来说,它的每一个符号都有固定的读音,完全是属于表音文字的体系,已经发展到了表音文字的阶段。其根本功能不是通过这些符号形象本身来表达概念的,把它说成是表意文字是错误的。⑥
文字符号分成两个不同的平面。“一是汉字作为语言的符号,另外一个平面是汉字本身使用的符号。过去有些问题搞不清楚,恐怕是没有把这两个平面分清的缘故。”⑦有的学者认为甲骨文已经发展到了表音文字的阶段,就不是着眼于字符而是着眼于词符来说的。这是混淆了“字符”和“词符”的概念。
“字符”和“词符”之间并不存在绝对的界线,二者在一定条件下可以互相转化。例如,“江”是“江河”之“江”这个词的词符;“氵”和“工”是词符“江”所使用的字符。当“江河”之“江”进入词符“鸿”中作音符时则转化为字符,只承担表音功能。又如:字符“耳”在“耳目喉舌”中是词符。当“耳”进入不同的合体字中,或充当形声字“聆”的意符,只承担表意功能;或充当形声字“饵”的音符,只承担表音功能;或充当形声字“珥”的字符,既承担表意功能又承担表音功能。
世界上的文字体系林林总总,其所使用的字符可以归纳为三类:
意符、音符、记号⑧
汉语中花草的“花”,如果用汉字来记录,其词符写作“花”。构成词符“花”的字符有两个,“艸(艹)”是意符,“化”是音符。如果用汉语拼音文字来记录,其词符写作“hua”。构成词符“hua”的三个字符“h”“u”“a”都是音符。由此可见,汉字和英文的区别就在于记录语言时所使用的字符不同,即要划分英文(拼音文字)和汉字(意音文字)的区别,必须从文字所使用的符号(字符)着眼才能讲清楚。意符、音符、记号三类字符之间也可以在一定条件之下互相转化。例如:会意字“爲”(《说文·三下·爪部》:“王育曰:‘爪象形也。’”)简化为“为”,变为记号。可是当“为”作为合体字“伪”的字符时,它是以音符的身份参加的,又转化为声符了。
偏旁这个概念只适用于汉字而不适用于拼音文字。字母这个概念只适用于拼音文字而不适用于汉字。因此,我们在这里采用“字符”这一术语,它既指称拼音文字中的字母也指称汉字中的偏旁。据此,拼音文字只使用一类字符即音符(不另外加注词义类别的符号),汉字则使用意符、音符和记号三类字符。
汉字的字符有“基本字符”和“复合字符”之分。例如:《说文·新附·石部》“砌”字,如果从词符“雕栏玉砌”之“砌”的角度看,应分析为从“石”“切”声两个字符。“切”虽然是从“刀”“七”声的形声字,但在词符“砌”中是作为一个整体承担音符的职能的。“砌”字中的“石”“七”“刀”是不能再解剖的独体字符即基本字符,声符“切”是复合字符。
二 基本字符的数量
记录汉语,如果采用汉语拼音文字来记录汉语即为拼音文字。字符是26个拉丁字母,字符数量很少,当然没有必要控制其字符的数量。至于由字符组成的词符,数量很多,但那是语言学研究的对象,和文字学不相干了。记录汉语,如果采用方块汉字来记录汉语即为意音文字。方块汉字的基本字符至少是拼音文字的字符数量的10倍以上,需要有300个左右的字符才能承担记录汉语任务。殷墟甲骨文是目前所见最早的汉字体系,其不重复的单字的字头约有4500个左右,我们已认识的约占三分之一。殷墟甲骨文的基本字符的数量是多少呢?
李圃先生在《甲骨文文字学》一书中说:“甲骨文中具有独立造字功能的字素(引者按:相当于基本字符)共有324个。”⑨王宁先生在《汉字构形学讲座》一书中说:“1380个甲骨文可分析出基础构件412个……而《说文》9431个正篆只分析出基础构件367个。”⑩郑振峰先生在《甲骨文字构形系统研究》一书中得出“甲骨文共有基础构件(引者按:相当于基本字符)”为412个(11)。
陈婷珠先生在《殷商甲骨文字形系统再研究》一书中说:“在甲骨文构件拆分的过程中,我们共得到1685个独体构件。”(12)
李圃、王宁和郑振峰三位先生是根据已认识的1000多个甲骨文字来进行基本字符统计的。陈婷珠先生是根据全部不重复的单字(包括已释字和未释字)4500个左右甲骨文字来进行统计的。所以前者和后者所统计的基本字符的数量差别很大。我们认为,前者的统计数量可能偏少,后者的统计数量偏多。甲骨文基本字符的整理与研究是一项重要的研究课题,其数量究竟是多少至今仍不明确,有必要对此作进一步的整理与研究。我们将另文讨论,此不赘述。
统计甲骨文基本字符的数量有五个方面需要注意。第一,甲骨文基本字符是否包括指事字。第二,甲骨文基本字符是否包括复杂象物字。第三,甲骨文基本字符是否包括“准独体字”。第四,甲骨文基本字符是以已释字来进行统计,还是既包括已释字也包括未释字。第五,甲骨文基本字符有“单用者”和“仅见于偏旁者”之别,我们只统计“单用者”,还是“单用者”和“仅见于偏旁者”都进行统计。下面分别举例予以说明。
第一,《说文·叙》把汉字从结构上分为“文”(独体字)和“字”(合体字)两类。合体字是由独体字组成的。从构造上说,合体字比独体字高一层次。宋人郑樵《通志·六书略》说:“象形、指事,文也。”“独体为文,合体为字。”所以汉字的基本字符既包括象形字也包括指事字在内。
第三,甲骨文里有不少独体字,其上附着不能单独成字的符号,这类字可算作特殊的“独体字”,我们称之为“准独体字”。例如,“夫”“立”之类,以结构而言,“夫”“立”所从之“大”是能独立成字的,而所附着的“一”不能独立成字,这类字是否可以称为基本字符,学界有不同意见。本文将“准独体字”也列为基本字符。
第四,从学术研究的角度看,未识字更能吸引学者研究的兴趣。所以,甲骨文基本字符的整理与研究应既包括已释字,也包括未释字。
所以甲骨文基本字符应包括指事字、复杂象物字、准独体字、已释字和未释字、单用者和无单用者。
三 精简基本字符的方法
拼音文字的优点只用30个左右的字符就能把语言记录下来,效率极高,自然没有必要控制其字符的总量。而汉字的基本字符至少是拼音文字的10倍,因此必须要控制其基本字符的总量。
陈婷珠先生在《殷商甲骨文字形系统再研究》一书中说:“从历时比较可以看出,在越早期的文字中,独体字(引者按:相当于基本字符)的比重越高。”(15)她统计甲骨文独体字的数量过高还有待修正,而其结论无疑是正确的。
笔者对商代甲骨文的结构作过新的统计,得出形声字占已识字的47%(16)。这说明过去认为甲骨文形声字还明显少于表意字的观点,应该予以修正。商代的汉语是单音节语素占优势的语言,形声字是记录汉语最佳的一种文字结构。因此,在汉字发展的过程里,形声字在全部汉字里所占的比重不断上升,直至现代汉字占到90%左右。形声字所占的比重不断上升意义非常重大。表面上看,由于加注形旁、加注声旁使汉字繁化,使整个汉字体系单字的总量不断膨胀。但是,它为精简汉字基本字符的总量创造了条件(详见下文)。
众所周知,甲骨文基本字符比《说文》正篆的基本字符(367个)的数量要多。从商代到汉代1000多年里,基本字符有生有死、有分化有合并,有不少甲骨文有过的基本字符,到《说文》小篆时代就消失了。汉字基本字符精简的方法有四:(一)声化;(二)类化;(三)裂变;(四)混同。现分述于下。
(一)声化
1.象形字改为形声字
2.指事字改为形声字
综上所述,象形字、指事字比形声字的笔画少,例如“了”只有一笔,而“柯”多至九笔。但为了精减基本字符的总量,古人不惜以“声化”即“繁化”的手段来减少基本字符的总量。
(二)类化
(三)裂变
甲骨文去古未远,还保留早期汉字“画成其物,随体诘诎”的原生态风貌,有些字尚未脱离图画的写实原则,有些偏旁尚粘连在一起,未分离出来。跟图画有明确界限的独体字概念建立起来之后,有助于使那些本来粘连在一起的“块状”字形的边界逐渐清晰而裂变为若干可重复使用的基本字符。例如:
(四)混同
汉字最大的优点是能超越时间和空间的限制。因为汉字不是拼音文字,其意符不会随着语音的变化而变化,所以,今天的中国人可以读懂古书;不同方言区的中国人,虽言语异声,但都能看懂汉字。汉字最大的缺点是基本字符的总量太多。这跟拼音文字只用30个左右字符就足以构成整个文字体系相比,汉字的繁难并非指笔画多,而是我们对于汉字各个历史时期基本字符始终不曾有过明确的总量统计,而且数量还不断增加。例如为了减少汉字的笔画,而去破坏字理,去增加汉字体系基本字符的总量,使汉字在整体上变得更加繁难,这是很不应该的。裘锡圭先生在《从纯文字学角度看简化字》一文中说:
在古文字演变为隶书的过程里,为了书写方便,破坏或削弱了很多字形的表意表音作用。这是合理的,因为古文字实在太难写了。在楷书早已成熟的时代还这样做,是否很有必要,就需要认真考虑了。
由于简化,汉字体系里增加了一些基本结构单位(即有些学者所说部件),如“头”“乐”“专”“ ”(“尧”字上部)等。……为了减少一些字的笔画,而去增加原来已经十分庞大的汉字体系基本结构单位的数量,恐怕不能认为是一件合算的事情。(18)
2013年8月28日初稿,2013年11月18日改定
注 释:
①吕叔湘说:“现代世界各国文字有两大类型:意音文字和拼音文字。前者以汉字为代表,后者以英语为代表。”《吕叔湘全集》,第6卷,辽宁教育出版社2002年版,第57页。
②周有光最早使用“意音文字”这一术语,参看周有光:《文字演进的一般规律》,《中国语文》1957年第7期。周有光说:“综合运用表意兼表音两种表达方法的文字,可以称为‘意音文字’,汉字就是意音文字之一。”参看周有光:《字母的故事》,上海教育出版社1958年版,第4页。有的学者认为汉字是表意文字,主要着眼于汉字和表音文字的本质区别,并不否认形声字声旁等有表音作用。我们认为周说更为精确。
③汉字的音符跟拼音文字的音符有很大区别。裘锡圭《文字学概要》(第13页)说:“拼音文字的音符是专职的,汉字的音符则是借本来既有音又有义的现成文字充当的。有很多汉字在充当合体字的偏旁的时候,既可以用作音符,也可以用作意符,而且还能兼起音符和意符的作用。……一般拼音文字所使用的字母,数量都相当少。汉字音符的情形就不同了。从原则上说,汉字里每一个字都有可能借用为音符,实际上用作音符的字,数量也很大(古今用作声符的字超过一千)。同样的字音往往借用不同的字来表示。如果要强调汉字和拼音文字的音符的区别,可以把汉字的音符称为‘借音符’。不过为了行文的方便,我们在下文中仍然称它们为音符。”
⑤裘锡圭:《怀念我敬爱的朱德熙先生》,《裘锡圭学术文集》,第6卷,复旦大学出版社2012年版,第187—188页。
⑥姚孝遂:《古汉字的形体结构及其发展阶段》,《古文字研究》第4辑,中华书局1980年版,第12页。
⑦裘锡圭:《汉字的性质》,《中国语文》1985年第1期;后收入《裘锡圭学术文集》,第4卷,复旦大学出版社2012年版,第49—58页。裘锡圭:《文字学概要》,商务印书馆1988年版,第10—11页。朱德熙:《在“汉字问题学术讨论会”开幕式上的发言》,《汉字问题学术讨论会论文集》,语文出版社1988年版,第11—12页。
⑧裘锡圭先生说:“各种文字的字符,大体上可以归纳成三大类,即意符、音符和记号。跟文字所代表的词在意义上有联系的字符是意符,在语音上有联系的是音符,在语音和意义上都没有联系的是记号。”“意符内部还可以分类。有的意符是作为象形符号使用的,它们通过自己的形象来起表意作用……古汉字里的独体字,基本上都是用单个象形符号造成的表意字。有的意符不是依靠自己的形象来起作用的。这种意符通常都是由已有的字充当的表意偏旁,它们就依靠本身的字义来表意。……在有必要区分上述这两种意符的时候,可以把前一种称为形符,后一种称为义符。在汉字变得不象形之后,形符基本上就不使用了(引者按:通过字形起作用的形符和通过字义起作用的义符合称为意符)。”(《文字学概要》,商务印书馆1988年版,第11—12页)
⑨李圃:《甲骨文文字学》,学林出版社1995年版,第14页。
⑩王宁:《汉字构形学讲座》,上海教育出版社2002年版,第19页。
(11)郑振峰:《甲骨文字构形系统研究》,上海教育出版社2006年版,第59页。
(12)陈婷珠:《殷商甲骨文字形系统再研究》,上海人民出版社2010年版,第291页。
(13)参看裘锡圭《文字学概要》,商务印书馆1988年版,第118—120页。
(14)林法:《先秦古文字中待探索的偏旁》,《古文字研究》第21辑,中华书局2001年版,第361页。
(15)陈婷珠:《殷商甲骨文字形系统再研究》,上海人民出版社2010年版,第229—230页。
(16)黄天树:《殷墟甲骨文形声字所占比重的再统计——兼论甲骨文“无声符字”与“有声符字”的权重》,《第四届国际汉学会议论文集》,台北,中研院2013年版。
(17)参看裘锡圭:《说“ 凡有疾”》,《故宫博物院院刊》2000年第1期;徐宝贵:《石鼓文整理研究》,中华书局2008年版,第736页。
(18)裘锡圭:《从纯文字学角度看简化字》,《语文建设》1991年第2期;后收入《裘锡圭学术文集》,第4卷,复旦大学出版社2012年版,第190—193页。