计算机汉字的引入和发展经历了多个阶段,以下是主要的步骤和里程碑:
早期尝试与困难
1946年,世界上第一台计算机在美国诞生时,汉字无法在计算机中显示,因为汉字的数量比英文多得多,且字形复杂,无法直接转化为坐标参数输入计算机。
字形显示与存储
在计算机出现的早期,字形以点阵形式进行显示和存储。一个黑体或宋体的汉字字形需要几十兆字节的内存,而当时主流个人计算机的存储空间只有几万字节,因此存储汉字成为一个巨大挑战。
编码与输入方法的发展
机器自动识别:通过光学字符阅读器或其他装置,用光电扫描等方法识别汉字。
语音识别输入:利用计算机的“听觉器官”自动辨别汉语语音要素,从不同的音节中找出不同的汉字。
汉字编码输入:根据一定的编码方法(如GB2312码、big5码等),由人借助输入设备将汉字输入计算机。
数字化拟合与人工修字
数字化拟合是将扫描进电脑的字体通过特殊软件进行“肢解”,将汉字转化为若干可以被电脑识别和处理的坐标。
人工修字是整个过程中最复杂和最耗时的工作,制作人员需要调整汉字的各个部分,使其既美观又便于电脑识别,并组合到一起。
字体与字库
电脑中的汉字显示依赖于字体文件,这些文件控制字的显示方式。字体文件通常存储在操作系统的字体库中,如Windows的Fonts文件夹中。
输入法与输入技术的进步
1978年,上海电工仪器研究所的支秉彝发明了“见字识码”法,用26个拉丁字母进行编码,使计算机的汉字输入进入了实用阶段。
1984年,五笔字型汉字编码输入法在联合国做操作演示,达到了每分钟输入120个字的速度,每个汉字及词组的输入最多4键,彻底解决了汉字输入问题。
标准与编码
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码,为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。
通过上述步骤和技术的不断进步,汉字最终成功地进入了计算机系统,并广泛应用于各种应用场景中。尽管过程中遇到了许多挑战,但通过多学科的合作和共同努力,这一目标最终得以实现。