读书静听笑语学无涯

《现代汉语》文字篇 标准第四

2019-02-04  本文已影响5人  234af9ace397

目录

汉字的标准化

一、汉字的标准化

二、常见的字序

三、汉字信息处理

四、汉字编码方案


汉字的标准化

一、汉字的标准化

汉字标准化,要求对汉字进行四定,即定量、定形、定音、定序。

(一)定量

定量是指规定现代汉语用字的数量,以便于汉字的学习和运用,便于现代化建设中电子计算机控制的电讯传递、情报检索、指挥调度、生产管理以及打字印刷等的汉字处理。

按照汉字定量的要求,姓名用字、地名用字、方言字、科技专业用字,都有必要制订字表,适当加以限制。

1988年《现代汉语常用字表》常用字3500个,覆盖率达99.48%。

2013年《通用规范汉字表》收字8105个,是最新的“现代汉语通用字表”,其中一级字表是最新的“现代汉语常用字表”。

(二)定形

定形是指规定现行汉字的标准字形。为了适应定形的要求,今后对简化汉字笔画的工作,要采取审慎的态度。为保持字形的稳定性,在一定时期内不应该对汉字进行笔画的简化。在将来需要简化时要注意采用恰当的方式。

新中国成立后,先后公布了《第一批异体字整理表》、《简化字总表》、《印刷通用汉字字形表》、《现代汉语通用字表》、《通用规范汉字表》等,为汉字的定形工作打下良好基础。

汉字定形的一个重要任务是进一步整理异体字。在《新华字典》所收字的范围存在一大批异体字未进行整理,异体字给汉字的运用、语文的教学和计算机的汉字处理增添了麻烦。

(三)定音

1985年,公布《普通话异读词审音表》审订839条异读字的读音。

2011年10月,国家语委启动第三次普通话审音工作。

2016年6月公布《〈普通话异读词审音表(修订稿)〉征求意见公告》,该文件正式公布后,将称谓汉字定音的一个新标准。

现行汉字的定音工作还要继续进行。人名、地名的异读,要进一步审订。轻声词、儿化词在书面上表示不出来,口语有一定的随意性,应该编写相应的调表。另外,一些多音多义字的读音也应该审订。

(四)定序

定序是规定先行汉字的排列顺序。排列汉字便于查件汉字,所以又称检字法。工具书的编写,档案、资料、资料索引的编排,印刷铅字的排列,计算机汉字字库的编制和汉字信息处理等,都要求汉字有定序。

汉字的排列方法有义序法、音序法和形序法三大类。

1、义序法是按照字义进行分类来排列顺序,过去的《尔雅》、《释名》等采用这种方法,难以明确一致标准,现在一般不采用。

2、音序法是按照字音排列汉字的顺序,古代的韵书采用这种方法,《汉语词典》、《同音字典》和《第一批异体字整理表》都是按注音字母顺序排列。音序法优点是简明,便于查检。缺点是无法查检不会念的字。该类字书,一般附有部首或笔画检字表,大型字书一般不采用该法。

3、形序法是按照字形排列字的顺序,主要分为笔画法、部首法和号码法三种。

二、常见的字序

由于汉字字形各异,全由笔画组成,我们可以利用笔画数、笔顺、笔形等给所有汉字定序。下面介绍几种常见的字序:

(一)笔画序

1、笔画法排序特点及问题

笔画序根据笔画数和笔形的顺序编排汉字。一般地说,采用这种笔画法,可以使汉字基本上达到定序的目标。但是,同笔数、同笔形顺序的字,在不同的字表中它们的顺序仍有分歧,例如:

勺丸凡夕么及久(《印刷通用汉字字形表》)

勺久凡及夕丸么(《现代汉语常用字表》)

么久勺丸夕凡及(《现代汉语通用字表》)

同是国家公布的按笔画数和笔形顺序排的字表,却有不同的顺序。

2、解决笔画法缺陷的措施

国家语言文字工作委员会1999年10月1日发布、2000年1月1日实施的《GB13000.1字符集汉字字序(笔画序)规范》规定了同笔画数、同笔形顺序字的定序规则:

① 主笔形先于附笔形,例如,子孑、干于、夕久;折点数少的先于折点数多得,例如,刀乃、几凡;折点数相同时,按折笔起笔的笔形顺序定序,例如,久么;折点数、起笔形都相同,依折笔后的笔形顺序定序,例如,丸及。

② 按笔画组合关系定序:相离先于相接,相接先于相交,例如,八人、凡丸;另外有先短后长等定序法,例如,未末、土士。

③ 按结构方式定序定序:左右结构先于上下结构,上下结构先于包围结构,字形比例小得先于字形比例大的,例如,旼旻、旮旭。上述规则,用前面的规则不能定序时才用后面的规则。

运用这种规则,《规范》种对通用字3画撇折点笔形的字作如下定序:夕久么勺凡丸及。这样终于解决笔画法定序的问题。

(二)部首·笔画序

部首·笔画序先根据部首把汉字分部排序,再在每一部中根据笔画序编排汉字。

教育部、国家语委2009年1月12日发布、2009年5月1日实施的《汉字部首表》,其中主部首201个,附属于主部首的附形部首100个。各主部首的序号为固定编号,附形部首的序号与主部首一致。使用本部首表时,应以主部首为主,遇以下特殊情况可变通:

1、某些辞书可根据传统和实际需要,用繁体部首或变形部首、从属部首作为主部首;

2、某些辞书可同时采用主部首和收字较多的附形部首;

3、用于旧印刷字形的检索时,可将本表的部首转换为旧印刷字形,部首序号不变。

(三)拼音·笔画序

拼音·笔画序时先根据汉语拼音把汉字分部排序,再在每一部中根据笔画序编排汉字。

(四)字角号码序

字角号码序按字角确定的号码编排汉字。最通行的号码是四角号码,按字的四角笔形确定数码,先取左上到右上,后取左下到右下。为了减少重码字,又规定增加附角好吗,即右下角上方最贴近的笔形。号码法还需要进一步改进。

三、汉字信息处理

广义的汉字信息处理就是利用计算机对汉语的音、形、义等信息进行的处理。狭义的汉字信息处理是指用计算机对汉字所表示的信息进行得操作和加工。汉字信息处理系统主要包括输入、存储、加工、输出等几个模块。

(一)汉字信息输入

汉字信息输入是汉字信息处理的关键一环,指利用汉字的形、音或相关信息等多重方式把汉字输送到计算机的过程。

汉字输入的方法有三种:汉字识别输入、语音识别输入、汉字键盘输入。

1、汉字识别输入

汉字识别输入可分为联机手写汉字识别、印刷体汉字识别和手写识别三种。手写输入优点是不用学编码,会写字就能输入;缺点是速度慢、用字量有限。

2、语音识别输入

语音识别输入是计算机对人类自然语音的声音信号进行自动识别,并转换成与之相应的文字符号,从而实现汉字输入。目前,该方法已经开始走向实用,但还未完全成熟。

3、汉字键盘输入

汉字键盘输入是通过击打键盘的方式把汉字输入计算机,这是目前汉字信息处理中最通行、最常用的汉字输入方法。

(二)汉字信息存储

汉字信息存储是把汉字属性和其他有关信息存储在计算机内。

汉字信息存储主要包含两个方面:汉字内部码、交换码等代码的存储;汉字字形的存储。

(三)汉字信息加工

信息的加工主要通过计算机的中央处理器进行,需要使用文字处理的应用软件。

(四)汉字信息输出

把经过计算机加工处理后的汉字信息输给人或其他设备,就是汉字信息输出。输出的方式主要包括显示输出和打印输出。

四、汉字编码方案

(一)汉字编码方案的标准

汉字编码方案优劣的标准是看这个方案是否易学、易记、易用,主要表现在:

① 基本符号少,容易实现盲打;

② 规则简单易记,操作方便易学;

③ 一字一码,重码尽可能少;

④ 输入处理效率高,设备经济实用。

(二)汉字编码方法

汉字编码的方法主要有:字形编码、拼音编码和形音结合编码。

1、字形编码

将汉字分解为部件或笔画,按照规定的顺序排列,用相应的字母数字等符号替代,按一定的规则取舍的符号组合,就是字形编码,主要分为笔画式编码和字根代码类两种。

① 笔画式编码

将汉字分解为笔画,每种笔画用一个数字代替编码,每字取6码或5码。

② 字根代码类

五笔字型汉字编码主要是字根码。优点是输入速度快,重码率低。缺点是字根的归类记忆难,输入操作时汉字的拆分难。

2、拼音编码

拼音编码是利用《汉语拼音方案》,将汉字的读音转换成汉语拼音的声母、韵母,或将双字母声母、复合韵母用单字母替代组成的编码。

拼音编码可分为全拼音式和压缩拼音式。优点是易学,缺点是重码多,输入效率低,难以处理生字,要求用户懂得拼音。

3、形音结合编码

形音结合编码有音形码和形音码两类。音形码是以拼音为主、以字形为辅的编码方法,形音码则以字形为主,兼取字音的某些特点来编码。

上一篇 下一篇

猜你喜欢

热点阅读