精华内容
下载资源
问答
  • 常用的汉字输入码分为
    2021-07-24 02:14:21

    汉字输入编码是汉字编码方案的一种,可归结为5种类型。

    中文名

    汉字输入编码

    类    型

    5种属    于

    汉字编码方案的一种

    背    景

    使用汉字人口最多

    汉字输入编码介绍

    编辑

    语音

    为便于将汉字送入中文处理终端或系统,用预先设计好的方法,将汉字音、形、义有关要素变成数字、字母或键位名称的转换方法。汉字输入编码是人到机(计算机)交换汉字特征信息的界面。汉字输入码的长度随着输入方法的不同而不同。

    汉字输入编码背景

    编辑

    语音

    世界上使用汉字的人口约占世界总人口的 1/4,因此研究和发展汉字输入编码是一项非常急迫的任务。中国是汉字的发源国,汉字应用已有数千年历史。1987年中国研究汉字输入编码的人员已近 400人,不论在深度和广度上,都走在世界前列。

    1981年,中国国家标准局公布的国标 GB2312-80《汉字信息交换用编码字符集》,收汉字6763个,到80年代中期除专业用字符集外,都以国标字符集所收汉字作为输入编码范围。

    汉字输入编码入手的方法,是在汉字中寻找统一的有规律的特征信息,将汉字二维平面图形信息转换成一维线性代码。根据所取特征信息的不同,汉字输入编码分从音编码和从形编码两大类。其他类型是相互结合型,或与字义结合,或与检字法结合,或与词组结合。因设计的目的、思想不同,用以编码的元素、所用码元的数量、取码方法和规则,避开同码字和占用键盘键位的方法等,都因设计者而异,因此产生了数百种汉字输入编码方案。

    从音编码是以1958年 2月11日中国全国人民代表大会批准公布的《汉语拼音方案》为基本编码元素。汉语拼音是以北京语音为标准音,以北方语为基础方言,以典范的白话文著作为语法规范的普通话。自推广普通话以来,已有相当数量的人掌握了汉语拼音,以此为基础作汉字输入编码,为这部分人所乐于接受。但中国各地方言复杂,不少人还难以做到准确认读汉字,因此容易出现差错。此外,北京语系只有21个声母,39个韵母,1332个音节,不能区别成千上万个汉字,同音字很多,所以需要增加定字编码。这就要从形、从义去找,或借助计算机将同音字全显示出来,再去选择定字,可见从音编码方式输入繁琐,输入速度低。但日常汉语口语中有词、语句的限定,同音字不会被人误解。利用这一汉语特征,拼音编码已向拼音词组编码发展来解决部分欠缺。

    从形编码是以笔画和字根(字元、部件)为编码元素。现代汉字是从甲骨文、金文演变而来,经过篆书、隶书、楷书等演变而形成的。在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单。造字原则从表形、表义到形声,汉字数量增多主要是形声字数量多。汉字从形编码是充分利用现代汉字这些特征,把汉字平面图形编成线性代码。

    汉字从形编码利用人们已有的汉字书写知识,在键盘上象写字一样打入笔画和字根,从计算机内选出汉字,既直接又方便。这样就要把上千个字根和上百个笔画尽可能归纳,减少它们的数量,以便于记忆字根所在键位。到1987年已能将字根归纳为100个左右,笔画为5个。字根少了会造成分解汉字图形的难度,字根多了又会增加记忆量,所以设计者需从中选取最佳的取舍方案,做到易学易记,因此形码方案数量很多。为达到高速输入,从形编码也向词组编码发展。

    汉字输入编码将会随着计算机应用的普及,通过学术评议和用户实践,由数百种优选成数种实用方案。

    汉字输入编码类型

    编辑

    语音

    汉字编码方案的一种,可归结为下列几种类型:

    (1)汉字拼音编码 以汉语拼音为基础的汉字输入编码,在汉语拼音键盘或经过处理的西文键盘上,根据汉字读音直接键入拼音。

    (2)汉字字形编码所有的汉字都由横、竖、撇、点、折、弯有限的几种笔划构成,并且又可分为‘左右’、‘上下’、‘包围’、‘单体’有限的几种构架,每种笔划都赋予一个编码并规定选取字形构架的顺序,不同的汉字因为组成的笔划和字形构架不同,就能获得一组不同的编码来表达一个特定的汉字,广泛使用的‘五笔字形’就属于这一种。

    (3)汉字直接数字编码 利用一串数字表示一个汉字,电报码就属于这种。

    (4)整字编码 设置汉字整字大键盘,每个汉字占一个键,类似中文打印机,操作人员选取汉字,机器根据所选汉字在盘面上的位置将其对应编码送入计算机。

    如今,通过语音和图像识别技术,计算机能直接将汉语和汉字文本转换为机器码,已经有多种语音识别系统和多种手写体、印刷体的汉字识别系统面世,相信还有更完美的产品推出。

    更多相关内容
  • 汉字编码输入系统和

    千次阅读 2021-07-28 03:51:46
    汉字编码法计算机传入我国后,在其中输入、输出和存储汉字是用户必然...目前,计算机中汉字输入方法可以分为自然输入和键盘编码输入两大类。其中自然输入包括手写输入和语音输入,虽然自然输入更加简单,但是手写...

    汉字编码法

    计算机传入我国后,在其中输入、输出和存储汉字是用户必然的需求。计算机的键盘从英文打字机键盘发展而来,用户可以方便地利用键盘输入英文,却无法直接输入中文。针对这一问题,我国的学者和计算机工作者进行了长期的研究与开发工作,到目前为止已经基本解决了汉字的输入问题。

    目前,计算机中汉字的输入方法可以分为自然输入和键盘编码输入两大类。其中自然输入包括手写输入和语音输入,虽然自然输入更加简单,但是手写输入速度慢,语音识别需要相对安静的环境。可以预见:在相当长的一段时间内,键盘编码输入还是最主流的输入方法。键盘编码输入汉字具有如下两个优点,第一,它无需添加任何外部硬件设备,手写输入通常要添加手写笔,语音输入需要麦克风和声卡结合使用,而键盘编码输入只要基于计算机的键盘;第二,输入速度快、准确率高,手写输入的速度通常较低,语音输入的准确率不太高,而且容易受到外界声音的干扰。

    汉字编码法可以主要分成:流水码、音码、形码和音形码(形音码)。流水码也被称为无理码,它通常没有重码,但是用户如果要使用该输入法输入汉字,记忆量极大。例如“区位码输入法”就是一种流水码,几乎没有用户能够记住所有汉字的区位码。音码是目前比较常见的编码法,通常基于汉语拼音方案,或者对拼音方案进行一些变革与改良。例如:“全拼”就是完全基于汉语拼音,“双拼”就是为了减少输入时的击键数而作的变革。因为我国目前大多数计算机用户在中小学阶段接受过良好的汉语拼音教育,所以比较容易学习与使用该类编码法。但是由于数万个汉字只有一千多个发音,所以音码类的编码法的重码比较高,直接导致用户需要经常在候选字词中选择字词,因此降低了输入速度。形码类的输入法从汉字的形状出发,通常重码低、输入速度快,但是它们往往记忆量较大、用户学习时间长。音形码从汉字的音和形两个角度出发,有的以音为主,有的以形为主。因为结合了汉字的两部分信息,这样重码往往更加低,但是用户在输入时既要考虑音也要考虑形,考虑时间变长,所以用户学习和使用都相对困难。

    汉字输入系统

    汉字输入系统通常由硬件与软件两部分组成。例如:汉字语音识别输入系统,它包括:声卡、麦克风和识别软件部分。显然,软件部分应该是一个汉字输入系统中的主体部分,所以目前通常我们所说的“汉字输入系统”就是指汉字输入系统的软件部分。

    一个汉字输入系统主要完成三方面的任务:第一、接受用户输入;第二、将输入码转换为候选字词的机内码;第三、将汉字或词组的机内码传递给应用程序。其中第一、第三与具体汉字编码无关,而第二的过程和不同的汉字编码是密切相关的。

    对用户而言,Windows中汉字输入系统通常有三个窗口,第一个是输入法状态条窗口,第二个是输入码编辑窗口,第三个是候选字词列表窗口。另外为了便于用户有选择地使用输入法的功能,通常还提供输入法功能选项的设置界面。图1显示了纵横汉字输入法的三个相关窗口,图4.2是纵横汉字输入法的功能选项配置窗口。

    e0fe2299-c87f-4322-a848-49df7a25c558.jpg

    图1纵横汉字输入法的三个窗口

    汉字输入系统码本

    汉字输入系统的主要作用是把用户输入的输入码转换为对应字词的机内码。有些汉字编码输入系统根据用户的输入码就可以直接计算出候选字词的机内码,例如“区位输入法”和“内码输入法”。但是大多数的汉字编码输入系统需要通过查询一个存储了从输入码到字词机内码映射关系的对照表,才能得出候选字词,该对照表通常称为该汉字输入系统的码本。

    汉字输入系统与操作系统结合紧密,它属于系统软件,不仅需要考虑效率,还要尽量少占用系统资源。如果汉字输入系统码本采用数据库形式存储,不仅使得输入系统依赖于一个特定的数据库引擎,还将影响汉字输入系统的发布与实际使用。此外,为了节约内存空间,在进程之间共享数据,汉字输入系统的码本往往不是以数据库的形式存在,需要为汉字输入系统码本设计一些便于检索的码本结构。

    e0c709d5-bcb8-4234-a359-8b12488ad53b.jpg

    图2纵横汉字输入法的选项设置窗口

    目前,汉字输入系统的码本主要有三种结构:定长结构、变长结构和索引结构。定长结构特别适用于重码少、且每个输入码候选字词分布平均的编码法。对定长码本按照输入码排序后,在查找的时候可以使用二分查找,效率很高。如果不同输入码候选字词分布不均匀,重码多,或者不同输入码的候选字词条存储长度区别很大,此时可是使用变长结构的码本,变长结构的码本在存储上可以节约空间,但是不便于快速检索。索引结构的码本兼有定长结构便于快速检索和变长结构节约存储的优点,可以高效检索,而且能够节约存储空间,所以被广泛使用。

    展开全文
  • 汉字输入码种类数字编码.ppt

    千次阅读 2021-07-26 07:32:41
    汉字输入码种类数字编码.ppt4、汉字编码 汉字与英文字符一样,也是一种字符,在计算机内部也是以二进制代码形式表示的,这些代码,称为汉字编码。 GB 2312-1980 使用2个字节编码,共收录6763个简体汉字,其中包括:一...

    汉字输入码种类数字编码.ppt

    4、汉字编码 汉字与英文字符一样,也是一种字符,在计算机内部也是以二进制代码形式表示的,这些代码,称为汉字编码。 GB 2312-1980 使用2个字节编码,共收录6763个简体汉字,其中包括:一级汉字3755个,以拼音顺序排列;二级汉字3008个,以偏旁笔画顺序排列。 4、汉字编码 一个汉字用2个字节(16个二进制位)来表示 如:“中”在GB2312中对应的编码是:0011011000110000 汉字除了最常用的GB2312编码外还有其它几种编码方案(参见P7 表1.2.4) 试一试:查看输入法所用的字符集。 完成实践体验(P8) 二、汉字编码 对于汉字,计算机的处理技术必须解决三个问题:汉字输入、汉字储存与交换、汉字输出,它们分别对应着汉字输入码、内码、字模码的概念。 因此,汉字编码系统存在以下三种编码: 1、汉字输入码 2、汉字内码 3、汉字字模码 1、汉字输入码 汉字输入码也称外码,是为了将汉字输入计算机而编制的代码,是代表某一汉字的一串键盘符号。 汉字输入码种类: 数字编码:如区位码、国标码、电报码等。 拼音编码:如全拼码、双拼码、简拼码等。 字形编码:如王码五笔、郑码、大众码等。 音形编码:如表形码、钱码、智能ABC等。 1、汉字输入码 两种典型的数字编码: 区位码:是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。例如“中”字位于54区48位,“中”字的区位码即为“5448”。 国标码:将区位码加2020H,占用两个字节。例如“中”字的国标码为区位码5448的区码和位码转化为16进制,为3630H,再加2020H得国标码5650H。 2、汉字机内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。 汉字可以通过不同的输入法输入,但其内码在计算机中是唯一的。 英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。 机内码等于汉字国标码加上8080H。例如“中”字的机内码为D6D0H。 3、汉字字模码 汉字字模码又称汉字字形码,它是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印。 根据汉字输出的要求不同,点阵有以下几种: 简易型汉字:16×16, 32字节/汉字 普通型汉字:24×24, 72字节/汉字 提高型汉字:32×32,128字节/汉字。 汉字字库:将所有汉字的字模点阵代码按内码顺序集中起来,构成了汉字库。 多媒体编码 1、声音信息数字化 一首美丽动听的歌曲在计算机内部是如何数字化的呢? ⑴转换方法:采样和量化 ⑵部件:模数转换器 ⑶模数转换 ⑷关系:采样频率越高,量化的分辨率越高,所得数字化声音的保真程度也越好,数据量也会越大。(P10) 2、图像和视频数字化 像素(P10) 演示:画图工具-查看-缩放-大尺寸 查看-缩放-显示网格 问:如何查看图像文件的分辨率(长、宽分别有多少个像素)? 黑白位图图像存储空间计算 彩色位图图像存储空间计算 试一试: 计算640×480像素的黑白图像至少需要多少字节? 用画图工具保存640×480像素的黑白图像(单色位图) 查看文件大小是否和计算出来的结果一样。 视频是如何数字化的呢? 视频由连续的图像帧组成。 我国使用的PAL制式的视频每秒显示25帧。 问: 一段长5秒钟的分辨率为1024×768的PAL制式的彩色视频所包含的数据量是多少? 视频是如何数字化的呢? 声音、图像、视频经过数字化后产生的数据量很大,为了提高存储、处理和传输的效率,很多种关于图像、声音、视频的压缩标准就制订出来了。 如:JPEG是静态图像常用的压缩格式,MP3是声音常用的压缩格式,VCD和DVD分别使用MPEG-1和MPEG-2的压缩格式。 小结: 当今社会是信息社会,计算机由旧时王谢堂前燕,如今也飞入了寻常百姓家。通过这节课的学习,我们知道:计算机中所处理的一切信息都要转化成数字才能进行传播和交流,用数字表示各种信息,也就是信息的编码,在今后的学习中,我们要更好的利用计算机获取信息、处理信息、使用信息。 课外拓展资料:数字音频的获取方法 /mmc/chapt/chapt9/1.htm 练习 1.大写字母C的ASCII码为67,则大写字母A的ASCII值是() A 69 B 68 C 65 D 63 2.下列数值最小的是() A (1101)2 B (1110)2 C (12)10 D(16)10 3 十进制数14的二进制表示是() A 111 B 11110

    展开全文
  • 专利名称::计算机汉字输入坐标码编码方法技术领域::本发明涉及一种计算机汉字输入编码方法。形码,是目前广泛应用的一类计算机汉字输入方法,它的典型代表是″五笔字型″,″五笔字型″以汉字的″拼形″特性做为...

    专利名称::计算机汉字输入坐标码编码方法

    技术领域:

    :本发明涉及一种计算机汉字输入编码方法。形码,是目前广泛应用的一类计算机汉字输入方法,它的典型代表是″五笔字型″,″五笔字型″以汉字的″拼形″特性做为它的理论根据,从字形入手,见形识码,完全避开汉字的读音。它克服了″音码″不知道读音或读音不准便无法正确输入的缺点,具有重码率低,输入快的优点。形码,靠提取汉字的形特征信息进行编码,一般都拆分汉字,形码的设计思想可概括为首先,基于″某种认识″确定汉字的拆分结果---即″字根集″;然后,根据字根集反过来解决″汉字的拆分″问题,以及编码和输入等问题,″字根集″是形码的核心,不同的形码本质上是″字根集″的不同,汉字的拆分方法也因之不同。不足之处是记忆难,它的一百多个字根含有很多非字部件,而且没有规律性,记忆负担重;学习难,汉字的结构规律是客观存在的,五笔字型的字根集无疑也是汉字构成的主要部分,但是,将字根集定义成唯一的汉字结构单元,用它去机械地硬性拆分汉字,便偏离了汉字的结构规律,也远离了人们的文字习惯,典型的例子就是″相交笔画被拆分,基本汉字被拆开″,如此,人们深厚的母语文字知识用不上,长年的文字习惯不被认同,不仅造成了学习上的困难,也造成了心理上的隔膜。为解决以上编码方法之不足,本发明的目的提供一种计算机汉字输入坐标码编码方法,利用汉字的结构特点,建立拆分原则,不使用″字根集″,可以实现计算机快速编码输入,重码率低,便于记忆,便于学习的目的。本发明计算机汉字输入坐标码编码方法,其内容包括1.坐标码无″字根集″的拆字方法五个不拆分原则;汉字拆分的依据--型元集;汉字拆分的相关因素;汉字的拆分规则。2.坐标码的编码方法用于编码和输入的信息;坐标码与键盘的对应关系;编码规则。其中坐标码无″字根集″的拆字方法和坐标码的编码方法分别说明如下为什么叫坐标码汉字可以看成是分布于某一空间的点阵,为汉字编码其实质就是寻找一个坐标,该坐标应可以很好地离散汉字(重码率低),并使之具有唯一性(一字一码),只要能建立这样一个坐标,设甘思想是不受约束的。鉴于这一认识,本码取名为″坐标码″。一.汉字的基本笔画有五种横,竖,撇,捺,折.其中横包括″提″;竖包括″左竖钩″亅;捺包括″点″、。笔画之间的组合方式有三种(1)相交笔画之间彼此交越的组合方式称相交,如十,九,丰;(2)离散笔画之间彼此分离的组合方式称离散,如氵,彡,儿,川,灬;(3)粘连笔画之间彼此相连但不交越的组合方式称粘连。粘连又分三种A.直连笔画横、竖以及折的横、竖段之间的粘连方式称直连。如丁,卫,山,支;B.斜连相粘连的一方是撇、捺或是折的撇捺断的粘连方式称斜连。如人,不,,亻;C.端连笔画连于彼此端点的粘连方式称端连;如凸,冂,厂,几,凹,口。二.五个不拆分原则型坐标码将笔画的组合体称为″型″。基本型坐标码中,汉字的基本结构单位称为″基本型″。坐标码认为将汉字还原成笔画而取码的方法是最不可取的,它最大限度地丢失了汉字的结构信息。坐标码总结出五个不拆分原则。1.一个笔画不允许拆成两截,断在两个型中。原因单一笔画理应完整。2.相交叉的笔画不允许拆分,如丰,十,又,原因″交叉″是一种紧密的组合方式。3.相端连的笔画不允许拆分,如弓,厂,口,凸。原因″端连″也是一种紧密型组合方式。4.由两笔构成的汉字和常用非字偏旁不允许拆成笔画,如人,儿,丁,亻,冖,阝,讠,刂,冫,等。原因由笔画的原始功能推理而得。5.至少被某一笔画完全隔离的,结构上对称分布并被包容的,两个单笔画不允许拆出组成一个型。如平,不可以拆成″干与丷″;木,不可以拆成″十与八″,原因文字学指出″汉字的结构是一种积木式结构″这五个不拆分原则在一定程度上保护了汉字的结构,但这还不足以成为一种方法。三.型元集1.型元集的产生文字学指出″汉字由合体字与独体字组成,而且在早期的汉字中,合体字完全由独体字构成″。可见早期汉字的基本结构单元就是汉字,即不可拆分的独体字,汉字的结构规律呈现出完全的″文字性″。汉字发展到今天,它的结构规律也再变化,但是″文字性″仍然是它最重要的内容,此内容可表述如下″汉字结构是以基本汉字和常用非字偏旁为主,辅之以众多的使用频率很低的部件所构成″。根据汉字结构规律的″文字性″,结合″易于记忆″的设计原则和″限制拆分″的设计思想,坐标码将″结构不可再拆分的汉字和常用非字偏旁″做为汉字拆分的依据。型元坐标码将结构不可再拆分的汉字和常用非字偏旁称″型元″,型元的总和称型元集。型元集由三部分组成(1)符合五个不拆分原则的汉字和常用非字偏旁如十,九,口,厂,乙,木,等。(2)拆不出(1)中型元的汉字和常用非字偏旁,也是型元,如非,年,永,承等。(3)含有型元,但在坐标码的拆分规则中不允许拆分的汉字和常用非字偏旁,也是型元。如函,成,飞,王,失等。对于国标GB2312(80)字符集,共有型元334个,其中汉字279个,常用偏旁55个,详见附表。2.型元集的易记性型元集所含型元的数量并不少,但记忆起来十分容易,原因有两条第一,它具有文字性,279个字型元是结构最简单的汉字,而且绝大多数是常用汉字;55个常用非字偏旁虽不是汉字,但由于它的常用性,它们实际上是一种″准文字″,人们对它们的熟悉程序不低于常用汉字,所以型元集易于掌握。第二,它具有规律性,型元具有结构不可再拆分的特点,而且型元集是此类汉字,及常用非字偏旁的集合,所以型元的鉴别十分容易,″文字性″使型元集易于掌握,″规律性″使型元集易于区别,二者使型元集具有″易记性″。四.汉字拆分的关联因素1.型的分类与性质坐标码研究发现,一个型在汉字中的″稳定性″---既做″基本型″能力的大小,与构成它的笔画数有关,也与笔画间的组合方式有关,坐标码根据笔画数和组合方式将汉字中的型分类如下(1)单型仅有一个笔画的型称″单型″,型元集有两个单型型元,一和乙。性质单型的稳定性最弱,只有特殊情况下才可以做基本型。(2)偶型由两笔构成的型称″偶型″。如偶型元,人,儿,八,七,亠,等。性质偶型的性质很特殊,汉字结构不确定因素集中地反映在偶型的身上。偶型的″稳定性″居于单型和成型之间,偶型可否作基本型受诸多因素的影响。(3)成型由三笔及三笔以上笔画构成的型称″成型″,成型根据笔画之间的组合方式又分为三种1)正闭合型至少三面是由横,竖线段构成的闭合型及与之相交叉的笔画称″正闭合型″。如口,开,用,中,田等,2)相交型笔画间含有相交关系的成型称″相交型″。如木,寸,丰,才,等。3)堆积型笔画间仅含粘连,离散关系的成型称″堆积型″。如彡,巛,灬,立,火等。性质成型的″稳定性″比较强,以成型元而言,一般情况下它们都是基本型,只有特殊情况下,成型元也可以不是基本型。2.型的部位关系部位关系是指汉字中型之间彼此的位置关系,汉字结构的部位关系共有四种单一关系,上下关系,左右关系,内外关系,(1)单一关系即孤立的关系如人,七,十,大。(2)上下关系型之间是上下排列的位置关系,如吕,古,竿,急,等。(3)左右关系型之同是左右排列的位置关系,如双,林,叶,彻,等。(4)内外关系型之间呈内外分布的位置关系,如国,同,右,凶等。坐标码认为上下,左右部位关系中的型,彼此之间相对独立,是一种并列关系,适宜拆分;而内外关系中的型,彼此之间存在一种联系,相对而言独立性较差,对拆分有一定的约束。3.型之同的″连接关系″″连接关系″是指两型之间的接触方式,即笔画之间的连接方式。型之间的连接关系分为两类″离散″与″粘连″。离散,显然是有利于拆分的条件。粘连,根据情况又可分为三种具体情况(1)正闭合,两个型若组成正闭合型,则两个型之间的粘连方式称″正闭

    表1注CELMET是三维网状多孔件,由SumitomoElectricIndustriesLtd.制造;#7是型号,表示每单位长度(1英寸)微孔数为50-70。B.存在粘连情况(直连或是斜连)或内外关系时,偶型元是基本型的一部分,不可拆。如函(),辰(厂),亥(亠),午(十),贝(人),今(人),严(厂)等,简而言之,此种情况下有一种外在约束(或是内外关系,或是粘连关系),偶型元便不能自保,成为基本型的一部分,(2)当对方为相交型时(正闭合型,见后述的准型元)A.在斜连或离散情况下,不论部位关系如何,双方均是基本型,可拆。如发,,又;匆勹,B.在直连情况下,上下,左右部位关系可拆,双方均为基本型;内外部位关系不可拆,型元是基本型的一部分。如击,,;叟,又;皮不可拆,″又″是字型元的一部分。简而言之,对方为相交型时,一种外界的约束束缚不了偶型元,两种外界的约束才能使双方成为一个基本型。规则3-4″当型元是单笔型元′一′和′乙′时,仅当(1)对方是成型;(2)彼此离散;(3)不为内外关系。三个条件均满足时,可拆,双方均为基本型。否则不可拆。″如丽一,;丝,一;乞,不可拆,是偶型;丞,不可拆,双方粘连。六.拆字规则的扩展规则1~3是坐标码的基本拆字规则,以此为基础还可以得到一些其它的结论。1.单笔画做基本型的条件坐标码中,单笔画是可以做基本型的,但条件很严格。规则4单笔画撇、捺不允许单独做基本型;单笔画横、竖、折可以单独做基本型,但要同时满足下面三个条件第一.与相邻型不为内外关系;第二.与相邻型不粘连;第三.相邻型是型元。如私,禾,;孔子,乚;日,丨,日言,亠,一,一口;旦日,一。2.关于″一″的规则″一″很特殊,即是笔画横,又是型元壹″。汉字中有许多字是由某字与″一″组成的,如王一,土;天一,大;千,一;再一,冉;生牛,一;正一,止;丙一,内;亚一,业;灭一,火;土十,一;闩门,一,酉西,一等等。为保护汉字结构的完整性,规则5当″一″与其它型元相组合时,″一″在拆分过程中以笔画横对待,拆分结果不受它的型元身份的影响,拆分结果是基本型,″一″是型元;否则,就是笔画横。如亘,一,日,一;″一″是型元。生,不可拆,″一″是笔画。3.准型元坐标码将汉字的型分为型元和非型元,基本型也分为型元基本型和非型元基本型,坐标码以型元集为核心,判定非型元型是否是基本型的拆字方法,是一种智能化的方法,也是独一无二的。以往的码,汉字的拆分结果必须是字根,字根是必须死记硬背的,而坐标码是不要求记忆非型元的,坐标码的这种拆分方法,其优点是明显的,第一,它只须记忆″文字性″的东西,这就拥有了易记忆的基础。(型元集还具有″规律性″)第二,它承认的汉字基本结构单元是开放的(型元也可,非型元也可)所以,它的拆分结果容易符合汉字的结构特点。事实上,目前得到公认的,文字学界统计出来的六百余个构字部件,反映在坐标码中,除少部分可以继续拆分外,其中最常用,最主要的部分便反映在型元集中;另一部分约二百个使用频率低,文字性差的构字部件便以非型元基本型的形式出现,而这一部分在坐标码中恰恰是不需要记忆的。这也就是坐标码既符合汉字的结构规律,又易学易记的原因之一。成型元是型元集的主体,它具有两个特征(1)文字性,(2)结构的稳定性。汉字的结构中有一种型,它不具文字性(不是汉字,也不常用),却具有成型元的稳定性,对拆分一些汉字很有帮助,坐标码称之为″准型元″,准型元有两种。(1)正闭合型正闭合型,笔画之间结合紧密,边界清晰易于判别,所以坐标码将之做为准型元。如鹿中″″,革中″″,面中″″。(2)成型元与某一笔画交,连而成,由拆分规则,此单笔画是不可拆分的,同时坐标码认为此型的独立性不应低于型中的成型元,所以将之列入准型元。如囱中,老中,系中。规则6″准型元在汉字拆分上,其功能等同于成型元″。准型元与型元的区别有两点第一、准型元不具备文字性;第二、键盘输入方式不同,见后。引入准型元后,坐标码的拆字手段更加完善。如“考、面”均无型元,引入准型元后,拆分简单而合理。考,面,4.型层型层是基本型的组合体,是可拆的;同时型层的结构完整性也更强,判定非型元型是否是基本型的能力也更强,规则7型层与单笔画″横,竖,折″相组合时,单笔画是基本型。如买,乛,大(头是型层)。司,一,口,(是型层)。5特例规则8(1)″一″与″相交型型元″粘连的情况当″一″与型元相粘连时,根据规则4,5,″一″是不可拆的。但是,当″一″相交型型元″粘连成非字型时,由于整体非字,如得中于,徐中禾,所以人们很容易识别出整体中的相交型型元,而且这样做也便于取码。为兼顾理论的严谨和实际的需求,坐标码将此种情况做为特例,并规定如下当条件1)″一″与″相交型型元″粘连,但不是内外关系;2)两者之和是非字型,且不与第三者上下粘连,均被满足时,′一′可拆,双方均是基本型。如徐彳,,一,木;得彳,日,一,寸,余,一,木。(2)关于″一″的优选方案″一″毕竟是型元,所以在一些场合,在不违反理论的前提下,″一″的拆分是一种优选方案。如咸拆成″戊,一,口″正确;拆成″戌,口″错误。司,拆成″,一,口″正确,拆成″,口″错误。合,拆成″,一,口″正确,拆成″口″错误。规则9拆分汉字出现两种情况时,根据下述顺序拆分(1)对于型元″型元优于非型元;成型元优于偶型元;正选型元优于归并型元″。如″卡″,有二种情况″上与卜″和″与下″;是卜的归并型元,所以第一种正确。又如″圭″,有″土与土″和″十与王″;根据″成型元优于偶型元″,所以第一种正确。(2)对于连接关系″离散优于粘连;斜连优于直连″。如敖中″″,有两种情况″与″和″与万″;根据″斜连优于直连″,所以第一种正确。解决了汉字拆分这一问题之后,便可以进行汉字的编码与输入了,在编码与输入环节上,坐标码具有音码的优点;简单,直观。在坐标码中,汉字的特征信息元就是基本型,型元集有334个型元,加上非型元基本型的存在,基本型的形式很多,如果和以往的码一样,将基本型的形式归并在键位上进行输入,将会带来很重的记忆负担,坐标码将不是一个好的汉字输入法。坐标码在其汉字拆分方法的基础上,形成了自己的独特的编码理论和方法,它不是输入″基本型″这一特征信息元,而是输入特征信息元″基本型″的特征信息,形象地说,它是汉字拆分后的″音形码″。七.用于编码和输入的信息坐标码采用两种信息进行编码与输入,(1)音信息;(2)序码1.音信息音信息,型元基本型码名的第一个拼音字母,称音信息,什么是″码名″呢?型元分两种,一种是字型元,一种是偏旁型元,对字型元而言,码名就是该字本身,对于偏旁型元而言,坐标码根据它们俗名的特点,用一个字做它们的码名,音信息实际上就是码名的声母或是韵母的第一个字母,它不涉及汉语拼音的″平,卷舌音″,也不涉及″四声″,所以它不受发音是否准确的干扰。关于偏旁型元的码名常用非字偏旁一般都有一个约定俗成的俗名,其取名的方法可归纳为三种(1)偏旁是某一合体字的一部分,用该合体字为偏旁取名,这叫″合体字名称″。如赵中″″,称赵字旁;虎中″″,称虎字头;(2)根据偏旁的特征取名,这叫″形特征名称″,如巛,称三拐,彡,称三撇;口,称方框。(3)根据偏旁与某字的联系取名(是某字的古形或变形),这叫″同源名称″。如忄与,称竖心旁,(是心的古形),氵,称三点水,(是水的古形);牛与称牛字旁,(牛的变形)。在坐标标码中,一般地具有″合体字名称″的偏旁型元,它的″码名″就是该合体字;具有″形特征名称″的偏旁型元,它的″码名″就取俗名的中心字;具有″同源名称″的偏旁型元,它的″码名″就是它的同源字。具体见下表。偏旁型元的码名序号偏旁型元俗名类型码名字母01亠文字头合体字文W02廴建之儿合体字建J03丬将字旁合体字将J04廾弄字底合体字弄N05宀宝字盖合体字宝B06彐寻字头合体字寻X07疒病字头合体字病B08虎字头合体字虎H09春字头合体字春C10卷字头合体字卷J11祭字头合体字祭J12癶登字头合体字登D13赵字旁合体字赵Z14青字头合体字青Q15共字头合体字共G16冂同字匡合体字同T17灰字头合体字灰H18勹包字头合体字包B19衣字底合体字衣Y20出字头合体字出C21冫两点水形特征点D22冖秃宝盖形特征秃T23三框栏形特征框K24口方框形特征方F25彡三撇形特征撇P26巛三拐形特征拐G27纟乱绞丝形特征乱L28采形特征采C29形特征刀D30讠言字旁同源言Y31刂立刀同源刀D32丷倒八字同源八B33私字同源私S34卩单耳刀形特征耳E35阝双耳刀形特征耳E36忄竖心同源心X37辶走之儿同源走Z38小反小同源小X39攵反文同源文W40夂折文同源文W41犭反犬同源犬Q42饣食字旁同源食S43礻示补儿同源示S44牛牛字旁同源牛N45爫爪字头同源爪Z46衤衣补儿同源衣Y47竹字头同源竹Z48足足定旁同源足Z49钅金字旁同源金J50四四字头同源四S51灬同源火H氵,扌,艹,亻4个偏旁型元的音信息是定义的。见后2.序码坐标码通过″序码″来提取汉字结构的″形信息″。序码″有规律的两笔笔画的组合称序码″。坐标码采用下述三种序码(1)音序码基本型的第一,二两笔组合称″音序码″。(2)端序码基本型或是型层,合体字的首末笔画的组合称″端序码″。(3)全序码全序码由两码构成,首码即基本型的″音序码″,次码即基本型余部的″端序码″。即提取基本型的第1,2,3末,笔画编码。它们的使用方法将在编码规则中述及。序码的可行性我们知道每一个人均可以正确书出自己并不认识的汉字,因为″笔顺″是汉字中最基本的常识,而且序码所涉及的笔画仅为两个位置特殊的笔画,所以说序码具有简单易行性。序码的意义序码的形式很简单,却是坐标码不可缺少的理论支柱之一。第一,它解决了非型元基本型的输入问题。第二,它可以进入汉字结构的内部,准确地提取形信息,保证了编码信息的多样性与完备性。第三,它的引入,使得坐标码可以不用以往码所使用的″特征信息元归并后输入″的形信息输入方法,使坐标码的输入环节异常简单,方便,坐标码的键盘内容比音码中的双拼双音方法的键盘内容还要简单。序码的基础---笔顺笔顺写正楷字时,下笔的先后顺序叫″笔顺″。笔顺,是人们长期书写经验的总结,是实践中形成的,有如下主要规则从上到下三言豆分早吕;从左到右以叶川块形朋;先横后竖十寸井正丰木;先撇后捺人入八尺火爪;先中间后两边小承办水永亦;从外到内飞月风向内间;从里到外凶函这远建;先主体后串心韦册丰串书;先主体后点点我发犬威龙;先点点后主体义主为;八.型元的变形与归并在坐标码中,型元存在归并现象,归并有两种情况。1.归并的双方形状差异较大如忄与,尤与尢,聿与肀,这种归并常见于汉字字典之中,有其归并的道理。在坐标码中,只承认型元归并表中列出的情况。2.归并的双方结构相似汉字是一种方块文字,不论汉字结构的繁简,也不论汉字笔画的多少,汉字的外形都是一个方块,为保持方块内部的平衡,构字的″基本型″就只能做一些改变---变得或大或小,或长或扁,以适应方块的要求;一些笔画也因此做一定的改动,以避免笔画间的覆压。如材中的″木-″;撬中的″-毛″;鸠中的″-九″。(1)对于含″折″笔的″非交叉″偶型元,由于″折″笔的形态很多,而且非交叉的两笔型其结构特征点又少,所以坐标码规定″含折笔的非交叉偶型元,只要折笔发生形变,型元归并表又未承认,两个型就不能归并,变化后的型是一个非型元型。″如见中″″,就不是偶型元″冂″。(2)对余下的型元坐标码规定下述两种情况下可以自然归并,而且不列入型元并表。A.全等型归并若型元的某一笔画发生形变,但整体的结构关系不变,笔画的种类也未变,则称这两个型是″全等型″可以归并如又--;八-;毛-;王-;木-。B.复纵笔型归并按运笔方向将竖,竖撇及折的竖段,称为″纵向笔画或线段″,一个型元如果含有两个及两个以上的″长的″″纵向笔画或线段″,当″纵向笔画或线段″形变,但仍为″纵向笔画或线段″时,允许两个型归并。如甩--;用--;开-;井--亦;月-;。注″月″与″″在坐标码中,是有规律可循的,在上下关系中,认为是″″,而在左右关系时,认为是″月″,如明,朋,胃,娟,复纵笔型允许归并,是因为此类型的结构特征点多,变化一点之后,仍然易于识别,仍然相近,所以坐标码认为它们可以自然归并。其它情况其它的变形,仅当型元归并表承认的情况可以归并,否则不可以归并。相归并的型元有何不同输入时,它们的″音″信息相同,但它们的″序码″将有所不同(全等形不变)。九.坐标码的键盘键盘用来输入汉字的编码信息,坐标码的键盘非常简单,它的内容少于音码的″双拼双音″,详见附录中的坐标码键盘示意图。坐标码键盘由四部分组成1英文字母用以输入型元的″音″信息″-第一个拼音字母。英文字母位置不变。2序码用以输入″形″信息-序码。将键盘上的25个个英文字母(N不用)分成五个区,对应序码的首笔″横,竖,撇,捺,折″,每个区按″横,竖,撇,捺,折″顺序从中间向两侧排列对应序码的次笔,这样25个序码元对应了25个英文字母,构成了″序码键盘″。由于″序码键盘″极简单又极富规律,所以无须记忆,容易掌握,3.一级简码坐标码的26个一级简码,被组成5句话定义在26个字母键上,输入时一字一键,用以提高单字输入的速度。4.6个特殊型元型元艹,木,氵,扌,月,亻的音信息是定义的,借以离散汉字,减少重码,定义关系如下氵-U;扌-l;艹-A;木-V;亻-O;月-P序码和键盘的对应关系如下序码(首笔/次笔)一/一一/丨一/丿一/丶一/字母GFDSA序码(首笔/次笔)丨/一丨/丨丨/丿丨/丶丨/字母HJKLM

    表7注CELMET是三维网状多孔件,由SumitomoElectricIndustriesLtd.制造;#7是型号,表示每单位长度(1英寸)微孔数为50-70。爽大,DZZZ座广,人,人,土;GRRT2.特殊情况(1)特殊的型元汉字在键位上的分布(即第1码的分布情况)是不均匀的。V,U,I,不是汉语拼音,只是序码键位,所以键位上的汉字极少;O.P.A键位上的汉宇也很少,如A键,不算序码的话只有一个″凹″字,为了充分地利用键位,更好地离散汉字减少重码,坐标码将汉字中最大的6个型元部首氵,木,扌,艹,月,亻,采用定义的方式放在上述6个键位上,如此,它们的输入也就与本身无关。对应关系如下氵-U;扌-I;艹-A;木-V;亻-O;月-P。(2)特殊情况的编码规则上述6个键位和K键上的汉字,第1个基本型绝大部分是一样的,即氵,扌,艹,木,亻,月,口。若按一般情况取码,双型字的第3码,三型字的第4码(端序码)首笔将失去离散汉字的功能,为此,坐标码将首基本型为上述6个型元(不包括″月″)的汉字,做为特殊情况,单立编码规则。1)单型字(包括偏旁)多型字编码规则同一般情况。2)双型字码长为4,第1,2码,同一般情况;第3,4码,取″次基本型″的全序码″。实际上,后三码就是″次基本型″的″全码″。3)三型字码长为4,第1,2,3码,同一般情况;第4码,取后两个基本型的″端序码″。词组编码规则单字取码,取的是基本型的特征信息,词组取码则以单字的拼音首字母为主。由于词组输入方式更多地引入整字的拼音首字母,彻底地消除了单字的端序码,所以词组方式下的坐标码文字性更显著,取码更直观,快速,这是坐标码可以快速输入汉字的另一个理论根据。双字词每个字取其全码的前两个码如坐标,RRVY人民,RW*MB三字词第1,2,3码分别是三个字的拼音首字母。第4码取末字全码的首码。如自行车ZXCC中草药ZCYA多字词顺序提取第1,2,3,末字的拼音首字母。如经济特区JJTQ艰苦奋斗JKFD本发明之优点编码方法简单,易于实现计算机汉字快速输入,重码率低,便于记忆,便于学习。具体实施例方式例1″月″,″禾″字月,是满是五个不拆分原则的字型元,码长为3,月YQ*G*禾,含有型元″木″,但根据规则″单笔画撇不可以单独做基本型″,所以,″禾″也是字型元码长为3,禾HT*L*月,禾两字第1个码是它们的″音信息″,第2,3码是它们的″全序码″。例2″所″字″所″含有两个基本型,一个是型元基本型″斤″,一个是非型元基本型″″。编码为所E*JT*R*例3″科″字″科″含有三个型元基本型,禾,,十编码为HDSR*,第四码补的是整字的端序码R*。例4″攀″字攀,有6个型元基本型,为″木,,,木,大,手″。编码顺序提取第1,2,3末,基本型编码;攀MZZS。例5″考″字考,根据″准型元″予以拆分,含有两个非型元基本型″″,编码完全由序码构成考F*A*D*A*权利要求1.一种计算机汉字输入坐标码编码方法,其特征是该编码方法由坐标码无″字根集″的拆字方法及坐标码的编码方法两部分组成,坐标码无″字根集″的拆字方法由五个不拆分原则;汉字拆分的依据--型元集;汉字拆分的相关因素;汉字的拆分规则组成,坐标码的编码方法由用于编码和输入的信息;坐标码与键盘的对应关系编码规则组成;其中型元集由三部分组成(1)符合五个不拆分原则的汉字和常用非字偏旁;(2)拆不出(1)中型元的汉字和常用非字偏旁,也是型元;(3)含有型元,但在坐标码的拆分规则中不允许拆分的汉字和常用非字偏旁,也是型元对于国标GB2312(80)字符集,共有型元334个,其中汉字279个,常用偏旁55个;汉字拆分的相关因素由型的分类与性质,型的部位关系,型之间的连接关系所组成;其中用于编码和输入的信息由″音信息″和″序码″组成。2.按权利要求1所述之编码方法,其特征在于所述之五个不拆分原则为(1)一个笔画不允许拆成两截,断在两个型中,原因单一笔画理应完整;(2)相交叉的笔画不允许拆分,原因″交叉″是一种紧密的组合方式;(3)相端连的笔画不允许拆分,原因″端连″也是一种紧密型组合方式;(4)由两笔构成的汉字和常用非字偏旁不允许拆成笔画,原因由笔画的原始功能推理而得;(5)至少被某一笔画完全隔离的,结构上对称分布并被包容的,两个单笔画不允许拆出组成一个型,原因文字学指出″汉字的结构是一种积木式结构″。3.按权利要求1所述之编码方法,其特征在于汉字拆分的相关因素一型的分类与性质为一个型在汉字中的″稳定性″---既做″基本型″能力的大小,与构成它的笔画数有关,也与笔画间的组合方式有关,坐标码根据笔画数和组合方式将汉字中的型分类如下(1)单型仅有一个笔画的型称″单型″,型元集有两个单型型元,一和乙。性质单型的稳定性最弱,只有特殊情况下才可以做基本型;(2)偶型由两笔构成的型称″偶型″;性质偶型的性质很特殊,汉字结构不确定因素集中地反映在偶型的身上。偶型的″稳定性″居于单型和成型之间,偶型可否作基本型受诸多因素的影响,(3)成型由三笔及三笔以上笔画构成的型称″成型″,成型根据笔画之间的组合方式又分为三种1)正闭合型至少三面是由横,竖线段构成的闭合型及与之相交叉的笔画称″正闭合型″;2)相交型笔画间含有相交关系的成型称″相交型″3)堆积型笔画间仅含粘连,离散关系的成型称″堆积型″性质成型的″稳定性″比较强,以成型元而言,一般情况下它们都是基本型,只有特殊情况下,成型元也可以不是基本型。4.按权利要求1所述之编码方法,其特征在于汉字折分的相关因素--型的部位关系,部位关系是指汉字中型之间彼此的位置关系,汉字结构的部位关系共有四种单一关系,上下关系,左右关系,内外关系,坐标码认为上下,左右部位关系中的型,彼此之间相对独立,是一种并列关系,适宜拆分;而内外关系中的型,彼此之间存在一种联系,相对而言独立性较差,对拆分有一定的约束。5.按权利要求1所述之编码方法,其特征在于汉字折分的相关因素--型之间的″连接关系″,″连接关系″是指两型之间的接触方式,即笔画之间的连接方式,型之间的连接关系分为两类″离散″与″粘连″,离散,显然是有利于拆分的条件;粘连,根据情况又可分为三种具体情况(1)正闭合两个型若组成正闭合型,则两个型之间的粘连方式称″正闭合″;(2)直连两型之间相粘连笔画之间的关系,均为直连关系时,两型之同是″直连″关系;(3)斜连两型之间相粘连笔画之间的关系,存在斜连关系时,两型之间就是″斜连″关系;坐标码认为,正闭合是型之间紧密的粘连方式;直连是比较紧密的连接方式,斜连是最弱的粘连方式。6.按权利要求1所述之编码方法,其特征在于汉字的折分规则为规则1完全由型元组成的汉字和型层,型元均是基本型,可拆;规则2拆不出型元的汉字和常用非字偏旁,即无型元做为判定依据时,其本身也是型元,不可拆;规则3当型元和非型元型相组合时,型元不一定是基本型,拆分结果与(1)型的类别(2)部位关系,(3)连接关系三者有关;1)型与型之间有四种连接方式,对于正闭合″坐标码规定规则3-1型与型为正闭合关系时,仅当双方均为型元时可拆,两者都是基本型,否则不可拆;2)对于型之同的″离散″和″直连″″斜连″三种连接方式,坐标码有如下规则规则3-2当型元是成型元时,只要对方不是单型,即可拆分,双方均为基本型″;规则3-3当型元是偶型元时,拆分结果将取决于″型的类别,部位关系和连接关系″三个因素″;①当对方为偶型和堆积型时即不粘连也不是内外关系时,双方均是基本型,可拆;存在粘连情况(直连或是斜连)或内外关系时,偶型元是基本型的一部分,不可拆;②当对方为相交型时在斜连或离散情况下,不论部位关系如何,双方均是基本型,可拆;在直连情况下,上下,左右部位关系可拆,双方均为基本型;内外部位关系不可拆,型元是基本型的一部分;规则3-4″当型元是单笔型元′一′和′乙′时,仅当(1)对方是成型;(2)彼此离散;(3)不为内外关系,三个条件均满足时,可拆,双方均为基本型,否则不可拆规则4单笔画撇、捺不允许单独做基本型;单笔画横、竖、折可以单独做基本型,但要同时满足下面三个条件与相邻型不为内外关系;与相邻型不粘连;相邻型是型元;规则5当″一″与其它型元相组合时,″一″在拆分过程中以笔画横对待,拆分结果不受它的型元身份的影响,拆分结果是基本型,″一″是型元;否则,就是笔画横;规则6准型元在汉字拆分上,其功能等同于成型元;规则7型层与单笔画″横,竖,折″相组合时,单笔画是基本型;规则8拆分汉字出现两种情况时,根据下述顺序拆分(1)对于型元″型元优于非型元;成型元优于偶型元;正选型元优于归并型元″;(2)对于连接关系″离散优于粘连;斜连优于直连″;7.按权利要求1所述之编码方法,其特征在于用于编码和输入的信息--为音信息和序码,音信息是型元基本型码名的第一个拼音字母;序码为有规律的两笔笔画的组合,它们是汉字特征信息元″基本型″的特征信息。8.按权利要求1所述之编码方法,其特征在于坐标码与键盘的对应关系为音信息与键盘字母一一对应,序码对应关系如下序码(首笔/次笔)一/一一/丨一/丿一/丶一/字母GFDSA序码(首笔/次笔)丨/一丨/丨丨/丿丨/丶丨/字母HJKLM序码(首笔/次笔)丿/一丿/丨丿/丿丿/丶丿/字母TREWQ序码(首笔/次笔)丶/一丶/一|丶/丿丶/丶丶/字母YUIOP序码(首笔/次笔)/一/丨/丿/丶/字母BVCXZ。9.按权利要求1所述之编码方法,其特征在于编码规则为单字编码规则和词组编码规则,其中单字编码规则一般情况为单型字码长为3,由字型元的音和全序码组成,即″音″+″全序码″+空格双型字码长为4,第1,2码,按笔顺提取基本型的″音″或″音序码″,第3,4码,按笔顺提取基本型各自的″端序码″;三型字码长为4,第1,2,3码,按笔顺提取三个基本型的″音″或″音序码″,第4码取整字的″端序码″;多型字码长为4,按笔顺提取第1,2,3末基本型的″音″或″音序码″;特殊情况为坐标码将首基本型为艹,木,氵,,亻,口6个型元的汉字做为特殊情况,单立编码规则,单型字与多型字编码规则同一般情况;双型字码长为4,第1,2码,同一般情况;第3,4码,取″次基本型″的全序码″三型字码长为4,第1,2,3码同一般情况,第4码取后两个基本型的端序码;词组编码规则双字词每个字取其全码的前两个码;三字词第1,2,3码分别是三个字的拼音首字母,第4码取末字全码的首码;多字词顺序提取第1,2,3,末字的拼音首字母。全文摘要本发明属于一种计算机汉字输入之编码方法,本编码方法由坐标码无“字根集”的拆分方法与坐标码的编码方法所组成,其拆分方法包括坐标码五个不拆分原则,汉字拆分依据---型元型,汉字拆分相关因素,汉字拆分规则,其编码方法有编码和输入的信息,坐标码与键盘的对应关系,编码规则等。优点:编码方法简单,易于实现计算机汉字快速输入、重码率低,便于记忆,便于学习。文档编号G06F3/023GK1173660SQ9611952公开日1998年2月18日申请日期1996年10月31日优先权日1996年10月31日发明者叶平申请人:叶平

    展开全文
  • 汉字输入码和内码

    千次阅读 2018-10-07 22:33:47
    1.数字输入码 常用的是国标区位码,用数字串代表汉字; 将6763个二级汉字分为94个区,每区94位,把汉字表示成二维数组,数组下标就是区位码。 优点:无重码,输入码与内部码的转换方便; 缺点:代码难以记忆。 ...
  • 计算机中的汉字编码

    千次阅读 2021-07-20 05:21:36
    计算机首先是西方人发明和使用的,他们...在计算机上处理汉字要比处理西文字符复杂得多,处理汉字首先要确定汉字集合的大小,要解决汉字输入、传输、存储、输出等一系列问题。在处理过程中每一个环节需要各自...
  • 《计算机汉字输入方法第3章 计算机汉字输入方法 3.1 汉字输入基础 3.2 智能ABC输入法 3.3 五笔字型输入法 本章...掌握五笔字型的编码规则及字根表 3.1 汉字输入基础 3.1.1 汉字代码 3.1.2 汉字处理系统 3.1.3 汉字...
  • 计算机处理汉字的过程实际上是汉字输入码汉字信息交换码、汉字机内码、汉字输出码等编码间的转换过程。下面对这些编码做一些介绍,仅仅起抛砖引玉的作用。一、输入码(外码)1、输入码也叫外码、输入法编码,是用来...
  • python汉字输入

    千次阅读 2020-11-21 02:37:22
    使用 %xy 对特殊字符例如汉字进行百分比编码,其中“x”和“y”为十六进制字符(0-9 和大写字母 a-f),使用小写将引发错误。 7. api 3.0 签名 v1示例 注意: 如果是在 python 2环境中运行,需要先安装 requests ...
  • 汉字编码汉字处理包括汉字编码输人、汉字的存储和汉字的输出等环。节。也就是说计算机处理汉字,首先必须先将汉字代码化,即对汉字进行编码。无论西方的拼音文字还是汉字这种象形文字,它们的"意"都寓于它们的"形...
  • 汉字输入的发展历程

    千次阅读 2021-07-15 01:48:34
    汉字输入的发展历程以下文字资料是由...而汉字是方块字,每个字都不同,而且中国人也没有使用键盘的传统,因此计算机的输入问题阻碍了计算机在中国的普及和发展。1978年,上海电工仪器研究所部工程师支秉彝创造了一...
  • 人”9的数:键把汉字输入计算机中,期咖是:叫)把汉字中的笔形分为十类,分别用0~9十个数字作为它们的代码,每类笔形相应的的包含的各种笔兆女吓:笔形~’为“头笔”,代码为卜笔形一,、、为“横笔”,代码为1;...
  • 满意答案汉字编码分为外码、交换码、机内码和字形码。1.外码(输入码)外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。目前常用输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等...
  • 汉字编码解析

    2021-03-21 09:58:49
    汉字编码解析一、汉字编码的种类汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5。1 、GB2312又称国标, 由国家标准总局发布, 1981 年 5 月 1 日实施,通行于大陆。新加坡等地也使用此编码。它是一个简化...
  • python输入汉字

    2020-11-23 22:58:21
    使用 %xy 对特殊字符例如汉字进行百分比编码,其中“x”和“y”为十六进制字符(0-9 和大写字母 a-f),使用小写将引发错误。 7. api 3.0 签名 v1示例 注意: 如果是在 python 2环境中运行,需要先安装 requests ...
  • [计算机汉字输入方法第3章 计算机汉字输入方法 3.1 汉字输入基础 3.2 智能ABC输入法 3.3 五笔字型输入法 本章...掌握五笔字型的编码规则及字根表 3.1 汉字输入基础 3.1.1 汉字代码 3.1.2 汉字处理系统 3.1.3 汉字...
  • 汉字的ASCII表示和编码是怎样的?

    千次阅读 2021-07-27 01:51:11
    汉字的ASCII表示和编码是怎样的?发布于:2020-09-12 15:51:11什么是ASCII?我们知道我们日常见到的数字(0~9)、符号比如:#、%、+、@等、英语字母如:(A~z)、(a~z),它们在计算机中都是以二进制来表示存储的,...
  • Java读取文件的方式总体可以分为两类:按字节读取和按字符读取。按字节读取就是采用InputStream.read()方法来读取字节,然后保存到一个byte[]数组中,最后经常用new String(byte[]);把字节数组转换成String。在最后...
  • 整个GB2312字符集分成94个区,每区有94个位,每个区位上只有一个字符,即每区含有94个汉字或符号,用所在的区和位来对字符进行编码(实际上就是字符编号、点编号),因此称为区位。 换言之,GB2312将包括汉字在内...
  • Java字符编码转换过程说明常见问题JVMJVM启动后,JVM会设置一些系统属性以表明JVM的缺省区域。user.language,user.region,file.encoding等。可以使用System.getProperties()详细查看所有的系统属性。如在英文操作...
  • 用于汉字输出的是什么编码

    千次阅读 2021-07-29 06:00:38
    计算机汉字处理的不同阶段使用不同的编码方法,在输入汉字时使用 , 在输入汉字时使用英文ASCII, 在输出汉字时使用双字节中文码。 计算机只识别由0、1组成的代码,ASCII是英文信息处理的标准编码汉字信息...
  • Java读取文件的方式总体可以分为两类:按字节读取和按字符读取。按字节读取就是采用InputStream.read()方法来读取字节,然后保存到一个byte[]数组中,最后经常用new String(byte[]);把字节数组转换成String。在最后...
  • 键盘输入方法是通过键入汉字输入码方式输入汉字,通常要敲击1~4个键输入一个汉字,它的输入码主要有拼音码、区位码、纯形码、音形码、形音码等,用户需要会拼音或记忆输入码才能使用,一般对于非专业打字的使用者...
  • 文档介绍:计算机的常用输入设备有键盘和鼠标器第一套第1题计算机的常用输入设备有键盘和鼠标器第2题软盘要远离如电话、录音设备等热源、磁源。第3题硬盘格式化分二个阶段低级格式化和高级格式化第4题硬盘格式化分三...
  • Java中文编码小结

    千次阅读 2021-03-01 09:10:56
    Java中文编码小结1.只有 字符到字节 或者字节到字符 的转换才存在编码转码;2. Java String 采用 UTF-16 编码方式存储所有字符。unicode体系采用唯一的点表示唯一的字符信息, 点的存储方式有UFT-16、UTF-8 等等...
  • 为了使每一个汉字有一个全国统一的代码,区位是国家规定的94*94的一个方阵,其中每行叫做一个区,每列叫做一个位,组合起来就组成了区位,我们可以在相关网站查询某个汉字的区位,例如汉字“我”的区位是46 ...
  • 目前,计算机汉字输入方法种类繁多,按输入方式,一般分为、形、音形结构、声、声控输入、手写输入等形式。纵观这些编码方法普遍存在规则复杂,难学难记的弊端。在诸多输入方法中用数码输入是较理想的输入...
  • 微软双拼输入法只需输入汉字的声母和韵母,每个汉字输入两个。三、智能ABC汉字输入法智能ABC汉字输入法是一种以拼音为主的智能化键盘输入法,字、词输入既可采用全拼、简拼、混拼形式,也可以采用纯笔形代码,或者...
  • 神奇的汉字编码,了解一下

    千次阅读 2021-07-27 03:06:26
    一直觉得不是由中国人发明的计算机,却可以使用汉字进行...国家标准GB2312-80提出了中华人民共和国国家标准信息交换用汉字编码,简称国标。国标有时又称区位。GB2312-80标准包括了6763个汉字,按其使用额度分...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 99,438
精华内容 39,775
热门标签
关键字:

常用的汉字输入码分为