做hdoj2030时的问题
汉字内码是为计算机内部对汉字进行存储.处理的汉字代码,它应能满足存储.处理和传输的要求.当一个汉字输入计算机后就会转换为内码,然后才能在机器内传输.处理.汉字内码的形式也有多种多样.目前,对应于国标码一个汉字也用2个字节存储,并把每个字节的最高二进制位置"1"作为汉字内码的表识,以免与单字节的ASCII码产生歧义性.
汉字系统对每个汉字预先规定输入计算机中的代码,即汉字的外部码(例如拼音输入码)。计算机为了识别汉字,要把汉字的外部码转换成内部码(二进制代码)进行存储和处理。输出时,还将汉字的内部码转换成汉字的字形码。计算机处理汉字的总过程如下:
键盘管理程序 汉字处理程序 外部(输入)码 → 机内码 → 字形(输出)码
(键盘) (计算机存储、传输) (计算机输出汉字)
↑ ↓↑ ↓
汉字信息 交换码(国标码) 汉字信息
↓ ↑
其它系统代码
交换码 用于计算机与其他系统或设备之间进行汉字代码信息交换的标准汉字代码,目前最常使用的是国标码1981年的GB2312-80, 7445; 2000的GB18030-2000,27000
特 点
每个汉字(图形符号)用两个字节表示,每个字节只用低7位,即最高位为0的二进制码。
在128种编码表示中,有94种用来表示汉字的编码。此标准的汉字编码表有94行、94列,分别为区号和位号。汉字编码使用的高字节称为区码,低字节称为位码。
汉字分为两级:一级为使用频度高的常用汉字;
二级为次常用的汉字;
内部码 也称汉字内码或汉字机内码,是计算机对汉字进行存储、运算、传码的实际代码。
特 点
是由 0和1组成的二进制代码。一个汉字对应一个机内码,即汉字数目=机内码数目;
一般用两个字节表示一个汉字的内码且每个字节最高位为 1。 还有少数三字节、四字节等内部码最多能表示128×128 = 16384 个汉字和图形符号;
机内码目前虽未完全统一,但已趋于标准化。
内部码与国标码的对应关系:内码=国标码+8080
即国标码每个字节最高位为1 → 内部码。
例如:国标码 3B7A → 00111011 01111010 那么,机内码 BBFA→ 10111011 11111010
外部码 也叫汉字输入编码,主要是从键盘(语音、手写、光电)输入计算机中的代表汉字的编码。
做hdoj2030时的问题
汉字内码是为计算机内部对汉字进行存储.处理的汉字代码,它应能满足存储.处理和传输的要求.当一个汉字输入计算机后就会转换为内码,然后才能在机器内传输.处理.汉字内码的形式也有多种多样.目前,对应于国标码一个汉字也用2个字节存储,并把每个字节的最高二进制位置"1"作为汉字内码的表识,以免与单字节的ASCII码产生歧义性.
转载于:https://www.cnblogs.com/anderson0/archive/2009/04/04/1429438.html
显示或打印汉字时使用汉字的字形码,在计算机内部时使用汉字(对汉字进行传输、处理、存储使用)的机内码
MIPS是运算速度、MB是存储容量、MB/S是传输速率、GHz是主频单位
磁盘扫描用来检测磁盘,不能修复磁盘
CPU时间划分成许多小片,轮流为多个程序服务,这些小片称为时间片
P&P的含义是及插及用。硬件安装在计算机上后,系统会自动识别并完成驱动程序的安装和配置
对话框不能改变大小,没有最大/小化按钮,选择了带省略号的菜单项能弹出对话框。窗口可以改变大小
操作系统
Unix多用户、多任务、分时操作系统
Linux多用户、多任务、支持多线程和多CPU的操作系统
DOS单用户,单任务操作系统
Windows7多用户、多任务操作系统
WinXP单用户、多任务操作系统
Windows Professional多任务操作系统
操作系统是一种管理系统资源的系统软件,是用户和计算机的接口
操作系统的功能:作业管理、设备管理、文件管理、存储管理、进程管理
设备管理负责解决I/O设备速度慢、效率低,不可靠等
存储管理主要对内存管理
微软公司开发的操作系统有win、vista
文件是命名的相关信息的集合
从网络位置删除的项目不经过回收站,不能恢复
当"回收站"的空间被用空时,被删除的文件将不经过回收站而直接从磁盘上删除
用户标识就是用户的账号
文件夹是目录
CPU的指令系统又叫符号语言
Win7文档清单中的文件最多有60个,默认10个。WinXP最多15个。
Win7目前有6个版本:Windows7 Starter(初级版,功能最少)、Windows7 Home Basic(家庭普通版)、Windows7 Home Premium(家庭高级版) 、Windows7 Professional(专业版)、Windows7 Enterprise(企业版) 、Windows7 Ultimate(旗舰版,功能最多)。64位版本支持16GB(最高至192GB)内存,而32位版本只能支持最大4GB内存。
Windows 的整个显示屏幕称为桌面
Guest来宾用户
苹果内核:Unix
安卓内核:Linux
资源管理器的窗口被分成两部分,其中左部显示的内容是系统的树形文件夹结构
计算机只能处理数字,那么对于人类的语言最终怎么输入计算机并且使用计算机存储和传输呢?我们只能对每个字符进行数字编码,这就是各个字符集存在的意义,如果地球上只有英文一种语言那么ASCII编码就足够了,但是对于亚洲这些象形文字,不是使用字母逻辑的排列组合生成的文字进行数字编码就比较麻烦了,对于汉字常用字大概是七万左右,而简体加繁体汉字大概有六七万个,对于ASCII编码只有一个字节的长度显然是不够的,所以为表示世界上大部分语言有过很多种字符集,字符集的不唯一这也是导致乱码的原因,可以想象如果世界上就一种字符集涵盖世界上人类语言的所有字符,那么乱码问题就会消除了,这就是Unicode字符集出现的原因,Unicode是很大的字符集,预计可以容纳100万个字符,比如“我”字对应“\u6211”,字母“A”对应“\u0041”。但是Unicode只是一个字符集,想象一下当你有一个文本文件,内部有各种字符,如果全部使用Unicode字符集的编码表示,内部会是什么样的呢?因为在Unicode字符集中比如“A”只需要占用一个字节就可以表示,而“我”字则需要两个字节表示,还有其他的语言有的会用三个字节四个字节。如果这些二进制混在一起我们是没办法分辨出来哪几个字节代表一个字符的,我们当然可以让所有字符都占用4个字节,这样每四个字节就是一个字符是可以表示的,但是有一个很大的问题就是会导致文件很大占用过多的存储空间,所以就出现了变长的utf-8编码。utf-8的原理:1.对于单字节的字符,则第一位为0,后面7位为Unicode的码,因此对于英文字符的ASSCII码和Unicode码是相同的。2.对于n字节(n>1),第一个字节的前n位都为1,第n+1位全部为0,后面字节的前两位全部为10,剩下的没有被占用的位全部为这个字符的Unicode码。接下来以“我”为例:“我”的Unicode码为0x6211属于第三行,占用三个字节,则UTF-8编码为11100110 10001000 10010001,以上就是UTF-8的原理。