精华内容
下载资源
问答
  • 汉字输入编码汉字编码方案的一种,可归结为5种类型。中文汉字输入编码类型5种属于汉字编码方案的一种背景使用汉字人口最多汉字输入编码介绍...汉字输入码的长度随着输入方法的不同而不同。汉字输入编码背景编辑...

    汉字输入编码是汉字编码方案的一种,可归结为5种类型。

    中文名

    汉字输入编码

    类    型

    5种属    于

    汉字编码方案的一种

    背    景

    使用汉字人口最多

    汉字输入编码介绍

    编辑

    语音

    为便于将汉字送入中文处理终端或系统,用预先设计好的方法,将汉字音、形、义有关要素变成数字、字母或键位名称的转换方法。汉字输入编码是人到机(计算机)交换汉字特征信息的界面。汉字输入码的长度随着输入方法的不同而不同。

    汉字输入编码背景

    编辑

    语音

    世界上使用汉字的人口约占世界总人口的 1/4,因此研究和发展汉字输入编码是一项非常急迫的任务。中国是汉字的发源国,汉字应用已有数千年历史。1987年中国研究汉字输入编码的人员已近 400人,不论在深度和广度上,都走在世界前列。

    1981年,中国国家标准局公布的国标 GB2312-80《汉字信息交换用编码字符集》,收汉字6763个,到80年代中期除专业用字符集外,都以国标字符集所收汉字作为输入编码范围。

    汉字输入编码入手的方法,是在汉字中寻找统一的有规律的特征信息,将汉字二维平面图形信息转换成一维线性代码。根据所取特征信息的不同,汉字输入编码分从音编码和从形编码两大类。其他类型是相互结合型,或与字义结合,或与检字法结合,或与词组结合。因设计的目的、思想不同,用以编码的元素、所用码元的数量、取码方法和规则,避开同码字和占用键盘键位的方法等,都因设计者而异,因此产生了数百种汉字输入编码方案。

    从音编码是以1958年 2月11日中国全国人民代表大会批准公布的《汉语拼音方案》为基本编码元素。汉语拼音是以北京语音为标准音,以北方语为基础方言,以典范的白话文著作为语法规范的普通话。自推广普通话以来,已有相当数量的人掌握了汉语拼音,以此为基础作汉字输入编码,为这部分人所乐于接受。但中国各地方言复杂,不少人还难以做到准确认读汉字,因此容易出现差错。此外,北京语系只有21个声母,39个韵母,1332个音节,不能区别成千上万个汉字,同音字很多,所以需要增加定字编码。这就要从形、从义去找,或借助计算机将同音字全显示出来,再去选择定字,可见从音编码方式输入繁琐,输入速度低。但日常汉语口语中有词、语句的限定,同音字不会被人误解。利用这一汉语特征,拼音编码已向拼音词组编码发展来解决部分欠缺。

    从形编码是以笔画和字根(字元、部件)为编码元素。现代汉字是从甲骨文、金文演变而来,经过篆书、隶书、楷书等演变而形成的。在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单。造字原则从表形、表义到形声,汉字数量增多主要是形声字数量多。汉字从形编码是充分利用现代汉字这些特征,把汉字平面图形编成线性代码。

    汉字从形编码利用人们已有的汉字书写知识,在键盘上象写字一样打入笔画和字根,从计算机内选出汉字,既直接又方便。这样就要把上千个字根和上百个笔画尽可能归纳,减少它们的数量,以便于记忆字根所在键位。到1987年已能将字根归纳为100个左右,笔画为5个。字根少了会造成分解汉字图形的难度,字根多了又会增加记忆量,所以设计者需从中选取最佳的取舍方案,做到易学易记,因此形码方案数量很多。为达到高速输入,从形编码也向词组编码发展。

    汉字输入编码将会随着计算机应用的普及,通过学术评议和用户实践,由数百种优选成数种实用方案。

    汉字输入编码类型

    编辑

    语音

    汉字编码方案的一种,可归结为下列几种类型:

    (1)汉字拼音编码 以汉语拼音为基础的汉字输入编码,在汉语拼音键盘或经过处理的西文键盘上,根据汉字读音直接键入拼音。

    (2)汉字字形编码所有的汉字都由横、竖、撇、点、折、弯有限的几种笔划构成,并且又可分为‘左右’、‘上下’、‘包围’、‘单体’有限的几种构架,每种笔划都赋予一个编码并规定选取字形构架的顺序,不同的汉字因为组成的笔划和字形构架不同,就能获得一组不同的编码来表达一个特定的汉字,广泛使用的‘五笔字形’就属于这一种。

    (3)汉字直接数字编码 利用一串数字表示一个汉字,电报码就属于这种。

    (4)整字编码 设置汉字整字大键盘,每个汉字占一个键,类似中文打印机,操作人员选取汉字,机器根据所选汉字在盘面上的位置将其对应编码送入计算机。

    如今,通过语音和图像识别技术,计算机能直接将汉语和汉字文本转换为机器码,已经有多种语音识别系统和多种手写体、印刷体的汉字识别系统面世,相信还有更完美的产品推出。

    展开全文
  • 汉字编码法计算机传入我国后,在其中输入、输出和存储汉字是用户必然...目前,计算机中汉字输入方法可以分为自然输入和键盘编码输入两大类。其中自然输入包括手写输入和语音输入,虽然自然输入更加简单,但是手写...

    汉字编码法

    计算机传入我国后,在其中输入、输出和存储汉字是用户必然的需求。计算机的键盘从英文打字机键盘发展而来,用户可以方便地利用键盘输入英文,却无法直接输入中文。针对这一问题,我国的学者和计算机工作者进行了长期的研究与开发工作,到目前为止已经基本解决了汉字的输入问题。

    目前,计算机中汉字的输入方法可以分为自然输入和键盘编码输入两大类。其中自然输入包括手写输入和语音输入,虽然自然输入更加简单,但是手写输入速度慢,语音识别需要相对安静的环境。可以预见:在相当长的一段时间内,键盘编码输入还是最主流的输入方法。键盘编码输入汉字具有如下两个优点,第一,它无需添加任何外部硬件设备,手写输入通常要添加手写笔,语音输入需要麦克风和声卡结合使用,而键盘编码输入只要基于计算机的键盘;第二,输入速度快、准确率高,手写输入的速度通常较低,语音输入的准确率不太高,而且容易受到外界声音的干扰。

    汉字编码法可以主要分成:流水码、音码、形码和音形码(形音码)。流水码也被称为无理码,它通常没有重码,但是用户如果要使用该输入法输入汉字,记忆量极大。例如“区位码输入法”就是一种流水码,几乎没有用户能够记住所有汉字的区位码。音码是目前比较常见的编码法,通常基于汉语拼音方案,或者对拼音方案进行一些变革与改良。例如:“全拼”就是完全基于汉语拼音,“双拼”就是为了减少输入时的击键数而作的变革。因为我国目前大多数计算机用户在中小学阶段接受过良好的汉语拼音教育,所以比较容易学习与使用该类编码法。但是由于数万个汉字只有一千多个发音,所以音码类的编码法的重码比较高,直接导致用户需要经常在候选字词中选择字词,因此降低了输入速度。形码类的输入法从汉字的形状出发,通常重码低、输入速度快,但是它们往往记忆量较大、用户学习时间长。音形码从汉字的音和形两个角度出发,有的以音为主,有的以形为主。因为结合了汉字的两部分信息,这样重码往往更加低,但是用户在输入时既要考虑音也要考虑形,考虑时间变长,所以用户学习和使用都相对困难。

    汉字输入系统

    汉字输入系统通常由硬件与软件两部分组成。例如:汉字语音识别输入系统,它包括:声卡、麦克风和识别软件部分。显然,软件部分应该是一个汉字输入系统中的主体部分,所以目前通常我们所说的“汉字输入系统”就是指汉字输入系统的软件部分。

    一个汉字输入系统主要完成三方面的任务:第一、接受用户输入;第二、将输入码转换为候选字词的机内码;第三、将汉字或词组的机内码传递给应用程序。其中第一、第三与具体汉字编码无关,而第二的过程和不同的汉字编码是密切相关的。

    对用户而言,Windows中汉字输入系统通常有三个窗口,第一个是输入法状态条窗口,第二个是输入码编辑窗口,第三个是候选字词列表窗口。另外为了便于用户有选择地使用输入法的功能,通常还提供输入法功能选项的设置界面。图1显示了纵横汉字输入法的三个相关窗口,图4.2是纵横汉字输入法的功能选项配置窗口。

    e0fe2299-c87f-4322-a848-49df7a25c558.jpg

    图1纵横汉字输入法的三个窗口

    汉字输入系统码本

    汉字输入系统的主要作用是把用户输入的输入码转换为对应字词的机内码。有些汉字编码输入系统根据用户的输入码就可以直接计算出候选字词的机内码,例如“区位输入法”和“内码输入法”。但是大多数的汉字编码输入系统需要通过查询一个存储了从输入码到字词机内码映射关系的对照表,才能得出候选字词,该对照表通常称为该汉字输入系统的码本。

    汉字输入系统与操作系统结合紧密,它属于系统软件,不仅需要考虑效率,还要尽量少占用系统资源。如果汉字输入系统码本采用数据库形式存储,不仅使得输入系统依赖于一个特定的数据库引擎,还将影响汉字输入系统的发布与实际使用。此外,为了节约内存空间,在进程之间共享数据,汉字输入系统的码本往往不是以数据库的形式存在,需要为汉字输入系统码本设计一些便于检索的码本结构。

    e0c709d5-bcb8-4234-a359-8b12488ad53b.jpg

    图2纵横汉字输入法的选项设置窗口

    目前,汉字输入系统的码本主要有三种结构:定长结构、变长结构和索引结构。定长结构特别适用于重码少、且每个输入码候选字词分布平均的编码法。对定长码本按照输入码排序后,在查找的时候可以使用二分查找,效率很高。如果不同输入码候选字词分布不均匀,重码多,或者不同输入码的候选字词条存储长度区别很大,此时可是使用变长结构的码本,变长结构的码本在存储上可以节约空间,但是不便于快速检索。索引结构的码本兼有定长结构便于快速检索和变长结构节约存储的优点,可以高效检索,而且能够节约存储空间,所以被广泛使用。

    展开全文
  • 汉字输入码种类数字编码.ppt4、汉字编码 汉字与英文字符一样,也是一种字符,在计算机内部也是以二进制代码形式表示的,这些代码,称为汉字编码。 GB 2312-1980 使用2个字节编码,共收录6763个简体汉字,其中包括:一...

    汉字输入码种类数字编码.ppt

    4、汉字编码 汉字与英文字符一样,也是一种字符,在计算机内部也是以二进制代码形式表示的,这些代码,称为汉字编码。 GB 2312-1980 使用2个字节编码,共收录6763个简体汉字,其中包括:一级汉字3755个,以拼音顺序排列;二级汉字3008个,以偏旁笔画顺序排列。 4、汉字编码 一个汉字用2个字节(16个二进制位)来表示 如:“中”在GB2312中对应的编码是:0011011000110000 汉字除了最常用的GB2312编码外还有其它几种编码方案(参见P7 表1.2.4) 试一试:查看输入法所用的字符集。 完成实践体验(P8) 二、汉字编码 对于汉字,计算机的处理技术必须解决三个问题:汉字输入、汉字储存与交换、汉字输出,它们分别对应着汉字输入码、内码、字模码的概念。 因此,汉字编码系统存在以下三种编码: 1、汉字输入码 2、汉字内码 3、汉字字模码 1、汉字输入码 汉字输入码也称外码,是为了将汉字输入计算机而编制的代码,是代表某一汉字的一串键盘符号。 汉字输入码种类: 数字编码:如区位码、国标码、电报码等。 拼音编码:如全拼码、双拼码、简拼码等。 字形编码:如王码五笔、郑码、大众码等。 音形编码:如表形码、钱码、智能ABC等。 1、汉字输入码 两种典型的数字编码: 区位码:是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。例如“中”字位于54区48位,“中”字的区位码即为“5448”。 国标码:将区位码加2020H,占用两个字节。例如“中”字的国标码为区位码5448的区码和位码转化为16进制,为3630H,再加2020H得国标码5650H。 2、汉字机内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。 汉字可以通过不同的输入法输入,但其内码在计算机中是唯一的。 英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。 机内码等于汉字国标码加上8080H。例如“中”字的机内码为D6D0H。 3、汉字字模码 汉字字模码又称汉字字形码,它是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印。 根据汉字输出的要求不同,点阵有以下几种: 简易型汉字:16×16, 32字节/汉字 普通型汉字:24×24, 72字节/汉字 提高型汉字:32×32,128字节/汉字。 汉字字库:将所有汉字的字模点阵代码按内码顺序集中起来,构成了汉字库。 多媒体编码 1、声音信息数字化 一首美丽动听的歌曲在计算机内部是如何数字化的呢? ⑴转换方法:采样和量化 ⑵部件:模数转换器 ⑶模数转换 ⑷关系:采样频率越高,量化的分辨率越高,所得数字化声音的保真程度也越好,数据量也会越大。(P10) 2、图像和视频数字化 像素(P10) 演示:画图工具-查看-缩放-大尺寸 查看-缩放-显示网格 问:如何查看图像文件的分辨率(长、宽分别有多少个像素)? 黑白位图图像存储空间计算 彩色位图图像存储空间计算 试一试: 计算640×480像素的黑白图像至少需要多少字节? 用画图工具保存640×480像素的黑白图像(单色位图) 查看文件大小是否和计算出来的结果一样。 视频是如何数字化的呢? 视频由连续的图像帧组成。 我国使用的PAL制式的视频每秒显示25帧。 问: 一段长5秒钟的分辨率为1024×768的PAL制式的彩色视频所包含的数据量是多少? 视频是如何数字化的呢? 声音、图像、视频经过数字化后产生的数据量很大,为了提高存储、处理和传输的效率,很多种关于图像、声音、视频的压缩标准就制订出来了。 如:JPEG是静态图像常用的压缩格式,MP3是声音常用的压缩格式,VCD和DVD分别使用MPEG-1和MPEG-2的压缩格式。 小结: 当今社会是信息社会,计算机由旧时王谢堂前燕,如今也飞入了寻常百姓家。通过这节课的学习,我们知道:计算机中所处理的一切信息都要转化成数字才能进行传播和交流,用数字表示各种信息,也就是信息的编码,在今后的学习中,我们要更好的利用计算机获取信息、处理信息、使用信息。 课外拓展资料:数字音频的获取方法 /mmc/chapt/chapt9/1.htm 练习 1.大写字母C的ASCII码为67,则大写字母A的ASCII值是() A 69 B 68 C 65 D 63 2.下列数值最小的是() A (1101)2 B (1110)2 C (12)10 D(16)10 3 十进制数14的二进制表示是() A 111 B 11110

    展开全文
  • 汉字输入码和内码

    千次阅读 2018-10-07 22:33:47
    1.数字输入码 常用的是国标区位码,用数字串代表汉字; 将6763个二级汉字分为94个区,每区94位,把汉字表示成二维数组,数组下标就是区位码。 优点:无重码,输入码与内部码的转换方便; 缺点:代码难以记忆。 ...

    包括:数字码、拼音码、字形码

    1.数字输入码

    常用的是国标区位码,用数字串代表汉字;

    将6763个二级汉字分为94个区,每区94位,把汉字表示成二维数组,数组下标就是区位码。

    优点:无重码,输入码与内部码的转换方便;

    缺点:代码难以记忆。

    2.拼音输入码

    以汉字拼音为基础的输入方法;

    优点:简单方便;

    缺点:同音字多,重码率高,影响输入速度。

    3.字形输入码

    根据汉字的形状进行编写。

    把汉字的笔划部首用字母或数字进行编码,按笔画顺序依次输入,就能对应一个汉字。

    优点:简单方便,符合书写习惯;

    缺点:需要记住字形结构。

    4.内码:

    用于汉字信息的存储、转换、检索等操作的计算机内代码,一般用两字节表示。

    国标码:10进制区位码转换为16进制,再加上2020H;

    机内码:国标码+8080H(与ASCII区别),或者区位码转为16进制+A0A0H

    展开全文
  • 专利名称::计算机汉字输入坐标码编码方法技术领域::本发明涉及一种计算机汉字输入编码方法。形码,是目前广泛应用的一类计算机汉字输入方法,它的典型代表是″五笔字型″,″五笔字型″以汉字的″拼形″特性做为...
  • 计算机首先是西方人发明和使用的,他们...在计算机上处理汉字要比处理西文字符复杂得多,处理汉字首先要确定汉字集合的大小,要解决汉字输入、传输、存储、输出等一系列问题。在处理过程中每一个环节需要各自...
  • 汉字编码汉字处理包括汉字编码输人、汉字的存储和汉字的输出等环。节。也就是说计算机处理汉字,首先必须先将汉字代码化,即对汉字进行编码。无论西方的拼音文字还是汉字这种象形文字,它们的"意"都寓于它们的"形...
  • 目前,计算机汉字输入方法种类繁多,按输入方式,一般分为、形、音形结构、声、声控输入、手写输入等形式。纵观这些编码方法普遍存在规则复杂,难学难记的弊端。在诸多输入方法中用数码输入是较理想的输入...
  • [计算机汉字输入方法第3章 计算机汉字输入方法 3.1 汉字输入基础 3.2 智能ABC输入法 3.3 五笔字型输入法 本章...掌握五笔字型的编码规则及字根表 3.1 汉字输入基础 3.1.1 汉字代码 3.1.2 汉字处理系统 3.1.3 汉字...
  • 人”9的数:键把汉字输入计算机中,期咖是:叫)把汉字中的笔形分为十类,分别用0~9十个数字作为它们的代码,每类笔形相应的的包含的各种笔兆女吓:笔形~’为“头笔”,代码为卜笔形一,、、为“横笔”,代码为1;...
  • 1.一种汉字编码计算输入方法,其特征在于取字根拼音首字母、字根笔数和/或被编码汉字前后笔划之间关系笔名一一双关编码依椐;所述双关是把所有汉字笔划依其与相关笔的五种方位关系上下、左右、交叉、左上右下...
  • 当今信息时代,汉语系文化进入国际交流网的关键入口是汉字的计算机键盘输入。而汉字的计算机键盘输入法虽然已有数百种之多,例如,王码(即五笔字型),区位,首尾,拼音等等,但是各自都存在着不同程度的缺陷。...
  • 汉字编码

    2018-10-19 19:26:50
    计算机中汉字的表示是用二进制编码,根据应用目的不同,汉字编码分为外码,交换码,机内码,字形码 1.外码(输入码) 外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号,英文字母只有26个,可以把所有的...
  • 为了使每一个汉字有一个全国统一的代码,区位是国家规定的94*94的一个方阵,其中每行叫做一个区,每列叫做一个位,组合起来就组成了区位,我们可以在相关网站查询某个汉字的区位,例如汉字“我”的区位是46 ...
  • 微软双拼输入法只需输入汉字的声母和韵母,每个汉字输入两个。三、智能ABC汉字输入法智能ABC汉字输入法是一种以拼音为主的智能化键盘输入法,字、词输入既可采用全拼、简拼、混拼形式,也可以采用纯笔形代码,或者...
  • 中文输入纠错任务整理

    千次阅读 2017-07-09 11:40:06
    整理了一下关于中文输入纠错相关的内容
  • 【技术实现步骤摘要】【国外来华专利技术】本专利技术属于计算机汉字信息处理汉字的电脑编码方法,目前已提出很多方案,都以汉字的代码代表一个字或一组词,通过键盘输入,形成计算机中文信息。众多的方案中均存在...
  • 汉字输入的发展历程以下文字资料是由...而汉字是方块字,每个字都不同,而且中国人也没有使用键盘的传统,因此计算机的输入问题阻碍了计算机在中国的普及和发展。1978年,上海电工仪器研究所部工程师支秉彝创造了一...
  • 满意答案汉字编码分为外码、交换码、机内码和字形码。1.外码(输入码)外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。目前常用输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等...
  • 该楼层疑似违规已被系统折叠隐藏此楼查看此楼国标与机内码的转换国标并不等于区位,它是由区位稍作转换得到,其转换方法为:先将十进制区和位转换为十六进制的区和位,;这样就得了一个与国标有一个...
  • 目前我国计算机中有许多汉字输入法,不同的汉字输入 法有不同的输入码,但它们却能找到同一个汉字。例如,使用 拼音输入“ma”,或用五笔字型输入法输入“deg”,或者用郑码 备入“gxvv”时,都能找到同一个汉字“码...
  • 在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。 每个汉字使用2个字节。 区位GB2312-80 GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位...
  • 文档介绍:项目四文字录入任务1了解输入法任务2搜狗输入法返回任务1了解输入法1汉字输入技术的分类文字输入的方法主要分为键盘输入法和非键盘输入法两大类,非键盘输入法又包括手写识别输入、语音识别输入和光学识别...
  • 使用 %xy 对特殊字符例如汉字进行百分比编码,其中“x”和“y”为十六进制字符(0-9 和大写字母 a-f),使用小写将引发错误。 7. api 3.0 签名 v1示例 注意: 如果是在 python 2环境中运行,需要先安装 requests ...
  • 这一部分主要是对郑的基本编码规则做一个了解,然后学习郑汉字的分解方式。 一、 认识郑输入法 1. 简介 郑输入法是一种较为流行的汉字输入法,与传统的形输入法的相似之处在于:从汉字的结构入手,将...
  • 国标码 区位码 机内码 输入码

    千次阅读 2012-05-04 15:41:11
    在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。 每个汉字使用2个字节。 共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,原则上,两个字节可以表示 256×256=...
  • 根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。1、外码外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。常用输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码...
  • 文档介绍:计算机的常用输入设备有键盘和鼠标器第一套第1题计算机的常用输入设备有键盘和鼠标器第2题软盘要远离如电话、录音设备等热源、磁源。第3题硬盘格式化分二个阶段低级格式化和高级格式化第4题硬盘格式化分三...
  • 键盘输入方法是通过键入汉字输入码方式输入汉字,通常要敲击1~4个键输入一个汉字,它的输入码主要有拼音码、区位码、纯形码、音形码、形音码等,用户需要会拼音或记忆输入码才能使用,一般对于非专业打字的使用者...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 85,038
精华内容 34,015
关键字:

常用的汉字输入码分为