精华内容
下载资源
问答
  • ANSI编码是什么

    千次阅读 2019-01-21 09:43:03
    ANSI就是其他外文编码,且不同国家和地区的ANSI各有不同,即不兼容。举例,在中文简体下,你如果想编码表,保存时

    ANSI就是其他外文编码,且不同国家和地区的ANSI各有不同,即不兼容。
    举例,在中文简体下,你如果想编码表,用记事本操作,保存时会出现“该文件含有Unicode格式的字符,当文件保存为ANSI编码的文本文件时,该字符将丢失。要保存Unicode信息,单击下面的‘取消’,然后从编码列表中选择一个Unicode选项。继续吗?”
    如果不改即按“确定”,再打开就会出现许多问号(?)这就是结果。
    access数据库也用ANSI字符集,测一测吧。源资料在这里插入图片描述
    select birth,name from teacher where name = "李䏲"
    结果如下
    在这里插入图片描述
    就是分辨不出

    展开全文
  • 大家可能在计算机上看到过类似ASCII, GBK, GB2013,Unicode等等这些东西,但是却搞不清楚它们的关系,没办法正确...但是,具体使用哪些二进制数代表哪个具体的符号,每个地区都有自己约定的一套规则,这就是编码。 ...

    大家可能在计算机上看到过类似ASCII, GBK, GB2013,Unicode等等这些东西,但是却搞不清楚它们的关系,没办法正确地使用。再此,特对编码进行简要说明,让大家可以更好地理解和运用。

    1. 编码产生的原因

    在计算机中,所有的数据在存储和运算时,都要使用二进制数(也就是0和1两个数)表示。但是,具体使用哪些二进制数代表哪个具体的符号,每个地区都有自己约定的一套规则,这就是编码。

     

    2.常见编码类型

    a. ASCII

    ASCII (American Standard Code for Information Interchange),美国信息交换标准代码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,它是最通用的信息交换标准ASCII。第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。

    由此我们可以看出ASCII是美国人自己搞的一套编码,它可以适用于英语的书写,英语的26个大小写字母以及一些常用的符号都包含在内。

    但是,对于其它国家自己的语言来说,这就不适用了。以中文为例,常用的汉字就有5000多个,这个怎么用ASCII码去表示呢?这个是无法表示的。

    所以,我们国家研发了自己的一套编码规则,也就是GB 2312-1980和GBK两套编码。

     

    b. GB 2312-1980

    GB是啥意思? 2312是什么意思? 1980又是什么意思呢?

    GB就是汉语拼音国标的首字母,也就是国家标准的意思;

    2312是套标准的一个编号,就类似你家的邮政编号一样,只是一个编号而已;

    那1980呢? 这个很显然就是年份嘛,就是说这个是在1980年发布的。

    那么它完整的意思应该就是:在1980年发布的一套编号为2312的国家标准编码规则。

    哈哈,是不是一下就清楚了!?

    下面是详解: 

    《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。

    GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

    基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码

    把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。

     

    c. GBK 

    有了GB 2312,中国的计算机事业得以发展壮大。但是发展发展着,发现,诶, GB 2312的的编码不够用了,我们有更多的内容需要传入到计算机里面,怎么办?那就扩展一下嘛,所以就有了GBK 这种编码(我悄悄地告诉你,这个K不就是扩的汉语拼音嘛?)

    下面是详解:

    1995年,国家颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。简单来说,不就是可以储存的东西变多了嘛!

     

    d. Unicode

    上面讲了一下中国的编码方式。但是如果这样看的话,那是不是每个地区都得自己弄一套编码规则啊?世界上有那么多国家,那么多语言,这个怎么办呢?

    为了解决这一问题,我们的万国码诞生了。

    Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。

    这样一来,是不是不同地区的编码就统一了呢? 大家用不同语言写的东西,都可以适用于这一套规则,这多方便啊!

     

    e. UTF-8

    Unicode码,这里是UTF-8,是不是长得很像啊?都是U开头的。没错,你猜对了,UTF-8又是Unicode的升级版本。为什么会有这个版本呢?

    这是因为,对于原本的ASCII码,我们至于要占一个位(使用一个字节的内存)就可以储存信息了,但是Unicode码包含了更多的语言文字,就需要更长的编码去表示一个文字/字符,那么对于原本只需要用ASCII就能解决的问题,用Unicode码去编写,这样就造成了一种极大的浪费,大大占用了计算机的储存空间。所以,UTF-8就是为了解决这个问题而诞生的。

    详解:

    UTF-8(Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

    这里的8表示8位元,就是说,一个字符最多可以占8个位置。但是如果只要要一个位置就能表达,就别扯淡去占用空间了,能用一位表示就用一位;不行就两位,再不行就三位........一直到8位。


    为啥会乱码???

    知道了编码规则,就很好解释为什么会出现乱码现象了。

    如果你在大街上看到一个法语单词,你以为这是英语单词,你就去抱着英汉词典去查,这样能查到吗?

    有些人要反驳了!

    的确有可能查到啊。 比如英文的style和法语的style一模一样,只是发音不同。 

    这就对了嘛!!! 所以,有的时候,出现错误了编码,我们还是能看懂一些东西,或者说有那么一部分它的编码还是相通的。

    那要怎么去解决乱码的问题呢? 最简单有效的方法就是在代码的后面加上一个encoding = '编码',比如,encoding = 'utf-8'就可以了。 

    有的人可能还是不理解,以上图为例,报错出现了UnicodeDecodeError: 'utf-8' codes cant't decode byte 0xd0 in position 0: invalid continuation byte。

    这个是什么意思呢? 就是解析解码出错了!!! 使用utf-8无法正确地解析一些编码,那我们换一种编码就好了嘛!!

    也就是这个亚子:

    f = open('Demo.txt', 'r+', encoding = 'gbk')

    注意:可以多尝试不同的编码方式!


    如何查看文件的编码方式?

    详见:https://jingyan.baidu.com/article/ff42efa9e04733c19e2202f4.html

    展开全文
  • 计算机毕业不干编码什么好 “代码小时”一项全球运动,旨在通过直接参与开放源代码软件项目,向学生和老师介绍编程基础知识,从而使代码神秘化。 目前,它覆盖了近200个国家/地区的数千万学生。 同样,“ 儿童...

    计算机毕业不干编码做什么好

    “代码小时”是一项全球运动,旨在通过直接参与开放源代码软件项目,向学生和老师介绍编程基础知识,从而使代码神秘化。 目前,它覆盖了近200个国家/地区的数千万学生。 同样,“ 儿童可以编码”基于对软件工程的基本理解提供了一套对孩子的未来和全球经济至关重要的基本技能的信念,教导孩子们进行编码。 Kids That Code提供了独特的程序,孩子们可以在其中学习计算机编程,游戏开发,网站创建,电子产品等。 Google的Code-In是一项年度编程竞赛,面向13-17岁的高中和中学生。 该计划鼓励年轻人完成各种合作的开源组织指定的任务。 这些只是不断增加的社区致力于引入软件开发和开源软件并引起人们兴趣的几个例子。 诸如AliceHackety Hack, Scratch之类的工具提供了一个平台,以及用于教学的活动和资源。

    但是有一个陷阱:如果学生没有计算机,他们将无法参加任何这些有价值的程序-他们也不能使用Alice,Hackety Hack,Scratch或任何其他软件。

    对于服务不足的太多学生,在上学期间,仅在几个小时内就可以使用计算机,例如在选定的课程中,或者在图书馆或计算机实验室。 这种有限的访问权限并不只影响正在探索计算机软件或硬件兴趣的学生。 对平面设计,CAD或数字媒体感兴趣的学生,以及仅想上网研究家庭作业或与同学合作的学生,也会错失良机。 这些学生离开校园后,就会失去获得技术及其机会的机会。 实际上,这些学生可能总是花一个小时的时间编写代码-这意味着我们正在忽略潜在的开发人员,工程师,系统管理员,建筑师,计算机科学家,图形设计师,动画师,建筑师等整个社区。 通过技术提供的机会必须对所有人都可用。 这是开放的价值,也是使“所有事物都开放”的承诺。

    我们都已经看到-有些人可能亲身经历过-紧缩的预算和学校努力获取技术以支持不断增长的科学,技术,工程和数学(STEM)的需求。 确实,上面列出的许多编码程序都突出显示了为教育和工业界支持计算机科学和工程的需求。

    FLOSS儿童桌面程序

    FLOSS儿童台式机计划采用了创新的方法,以使服务不足的学生受益。 FLOSS Desktops作为开放源代码计划孵化器项目于2014年在纽约启动 ,旨在补充不断增长的“创客”和开放源代码软件运动,FLOSS台式机通过动手项目来培养技术和工程技能。 孩子们使用多余的和废弃的学校计算机来分解和修复计算机硬件组件,并安装开源软件,例如Linux操作系统,LibreOffice, GIMP等。该项目通过向孩子们介绍计算机和计算技术,教授关键的分析和开发当今数字化教室和职业中重视的技能。

    今天,面向儿童的FLOSS台式电脑遍布美国,提供资源和指导者来帮助全国各地的学区,教师和孩子们。 最近的一大亮点是锡耶纳学院采用FLOSS桌面来支持“ 城市学者计划” 由物理学教授Michele McColgan博士(将在万物公开赛上进行演讲)领导,Urban Scholars将大学生导师与来自纽约首都地区城市学区的孩子们一起参加各种STEM的研讨会式课程相关主题,从计算机编程到建筑和数学。 参与最早从五年级开始,并且鼓励学生继续读高中。 “我们的目标是帮助向孩子展示在现实科学领域的工作,” McColgan说。 “许多参加活动的孩子在家中无法使用计算机或这种技术,因此该计划确实可以帮助他们发展重要技能。”

    该程序为已经报废的计算机提供了新的生命,这些计算机已经由学区或其他社区团体支付,否则将被发送到回收站。 当学生通过动手实验来学习计算机硬件时,计算机便成为实验室的资源。 并且作为教育的平台,学生可以保留自己的作品以用于学术界和其他工作。 由于计算机和软件都是免费的,因此所有学生都可以在教室内外享受技术带来的好处。

    课程

    FLOSS儿童桌面版通过“ MAKE”为中学生提供模块化的,自定进度的计算机和技术课程。 每个MAKE为讲师提供材料 (每节课的用品,工具和技术的清单), 活动 (教学和学习练习,工作表和项目), 知识 (特定的学习目标)和评估 (与国际社会一致)。教育技术 ,或ITSE标准)。

    社区

    FLOSS桌面社区为地区和管理员提供了有关如何查找和访问资源(例如计算机硬件和软件,工作空间等)的建议。教育者的同等网络围绕教育模型,教与学活动进行协作,并为新教师的聘用提供建议,学生,教职员工和学区。 该社区还提供参考和资源,以解决IT员工,地区管理员,教师工会等常见的启动和运营问题。

    胜任力

    完成该计划的学生不仅参加了真实的STEM体验,而且还获得了有助于提高学历和塑造未来的技术技能。 从本地退役的机器翻新了自己的计算机后,参加活动的学生可以将其用于学术活动和发展他们的技术技能,这对于太多的学生和家庭来说仍然是不可能的。

    在10月23日至24日在北卡罗来纳州罗利举行的All Things Open 2017FLOSS儿童游戏台式机会议上了解更多信息。 All Things Open上 演示文稿和研讨会将介绍FLOSS儿童台式机计划,并使参加者准备将其介绍给当地的学区或社区中心。

    翻译自: https://opensource.com/article/17/9/floss-desktops-kids

    计算机毕业不干编码做什么好

    展开全文
  • 印度尼西亚地区和邮政编码的集合。 该存储库包含成千上万的二进制数据! 克隆之前,请确保您知道要做什么。 集合 邮政编码: 14955 村庄: 83342 分区: 7228 城市: 514 省份: 34 国家: 1 (仅...
  • ANSI编码

    2019-11-15 17:10:15
    文章目录1 ANSI编码 1 ANSI编码 关于ANSI编码需要知道以下几点: 这玩意只在Windows中存在。 ANSI编码并不是指某一种特定的编码,而是跟地区相关的。比如:中国默认就是GBK;...ANSI是什么编码? ...

    文章目录

    1 ANSI编码

    关于ANSI编码需要知道以下几点:

    • 这玩意只在Windows中存在。
    • ANSI编码并不是指某一种特定的编码,而是跟地区相关的。比如:中国默认就是GBK;美国默认就是ASCII。

    更加详细的内容参见如下博客,写的非常精彩:
    ANSI是什么编码?

    展开全文
  • 哈夫曼编码的实现

    万次阅读 多人点赞 2016-08-08 21:13:17
    哈夫曼编码虽然在acm上...我们用一个简单的例子,来简单描述下哈夫曼编码是什么?有什么好处? 场景:X地区需要向Y地区发送一些文本,两地之间通过电缆(或者通过电报)连接,要求用最少的二进制流传递信息:ABACDAAB
  • 中文有三种字符集,统一文字的编码进一步交流的基础。 ·国内网站和BLOG较多使用简体中文编码GB2312 字符集; ·港澳台地区网站和部落格使用繁体中文网页编码BIG5字符集; ·UTF-8 包含了简体和繁体中文字符,能...
  • ANSI是什么

    2015-10-13 00:14:10
    不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、Big5、Shift_JIS 等各自的编码标准。这些使用 1 至 4 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。 在简体中文...
  • C程序的编码方式

    万次阅读 2018-05-24 13:47:22
    编码是用预先规定的方法将文字、数字或其它对象编成数码。为保证编码的正确性,编码要规范化、标准化,即需有标准的编码格式。 我们都知道文本在计算机中是以二进制来进行存储,这就需要把文字通过一定的规则...
  • 编码是用预先规定的方法将文字、数字或其它对象编成数码。为保证编码的正确性,编码要规范化、标准化,即需有标准的编码格式。 我们都知道文本在计算机中是以二进制来进行存储,这就需要把文字通过一定的规则转换成...
  • 字符集编码

    2012-05-02 17:45:56
    1)什么是ANSI 为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。 不同的国家和地区制定了不同的标准,由此产生...
  • 今天碰到一个问题,有人问是否...由于系统语言版本获取都 国际化标准组织 ISO 639语言编码标准的第一部分 这一段来自MSDN的示例代码 int count; String[] userLang = Request.UserLanguages; for (co...
  • Java编码问题

    2015-12-13 18:53:51
    最近在看,How Tomcat Works,反正感觉上就是叼叼的,看完第一章就想自己写个服务器出来了,大概原理应该弄得差不多了:客户端与服务器端通讯,不管是什么B/S,C/S啊,都是在通讯,通讯就是交换信息,就像是两个人...
  • 为了解决字符显示乱码的问题,不同国家和地区针对自己使用的字符进行了编码,但每种编码都无法涵盖所有字符,所以Unicode编码诞生了.Unicode的诞生为了解决所有字符使用统一的一套编码,这样就统一了字符显示. ...
  • Gecko一套网络排版引擎,由来已久,为当年大名鼎鼎的netscape网络浏览器流传而来,后面...所以,在这种场景下,浏览器是否能正确识别每个地区的网页的编码格式,并正确地显示出来,就尤为重要了。有一部分网页,可能
  • 字符编码发展及规范

    2014-03-04 16:26:33
    一、为什么要进行编码的规范化?? 举个例子,在一个国家的...通过邮件传送一个字符,实际上传送的这个字符对应的编码数字,同一个数字在不同的国家和地区代表的很可能不同的符号,如十六进制的D6D0在中国大陆的
  • 如何使用Erdas进行分类重编码

    千次阅读 2018-02-05 16:31:09
    作为分类后处理命令之一的分类重编码,主要针对非监督分类而言的,由于非监督分类之前,用户对分类地区没有什么了解,所以在非监督分类过程中,一般要定义比最终需要多一定数量的分类数;在完全按照像元灰度值通过...
  • 计算机毕竟西方国家的发明,最开始并没有想到会普及到全世界,只用一个字节中的7位(ASCII)来表示字符对于现在庞大的文字数量来说显然不够,所以先后经历了好几套编码方案,不同国家和地区又有自己的方案,造成了...
  • 一、什么是字符编码?为了满足人与计算机的交互需要,首先要解决的问题就是语言的翻译问题。作为计算机,其语言的符号集合确定的:{0,1}。然而人的语言却多种多样的,不同国家或地区的语言符号集合存在很大的...
  • 商品条码作为商品在全球自由流通的“身份证”,已在全球150多个国家和地区广泛...唯一性原则商品编码的基本原则,指相同的商品应分配相同的商品代码,基本特征相同的商品视为相同的商品;不同的商品必须分配不同的
  • 10.1 设置默认地区

    2021-03-04 20:23:17
    什么是Locale Locale一组描述世界上某一特定区域文本格式和语言习惯的设置的集合。locale名通常由三个部分组成:第一部分,一个强制性的,表示语言的缩写,例如"en"表示英文或"zh"表示中文。第二部分,跟在一个...
  • 是什么? 从页面链接的KML文件的导出,也已转换为GeoJSON。 注意:每个GeoJSON文件代表一个邮政编码区域,并包含一个FeatureCollection ,每个组成邮政编码区域都具有一个Feature 。 例如: : 依存关系 从...
  • 因为生活在大中华地区,编程过程中铁定会遇上’中文’字符串,而存储跟传输中文字符串之前需要对其进行编码的,这就涉及到字符串编码的问题了。而这篇博客记录的不是对编码问题的讨论,而是对编码问题的几点备忘...
  • 什么是BIG5

    2008-12-05 16:26:00
    “大五码(Big5)”在1984年由... Big5,又称为大五码或五大码,使用繁体汉字社群中最常用的电脑汉字字符集标准,共收录13,053个中文字,其中有二字为重复编码。Big5常用于台湾、香港和澳门等使用繁体中文的地区
  • 一共有三种方式来发送和接收SMS信息:Block Mode, Text Mode和PDU Mode。Block Mode已昔日黄花,...PDU Mode被所有手机支持,可以使用任何字符集,这也手机默认的编码方式。Text Mode比较简单,而且不适合做自定义
  • 修改字符编码解决linux终端中文乱码

    千次阅读 2014-02-14 11:01:21
    到底什么是locale?locale这个单词中文翻译成地区或者地域,其实这个单词包含的意义要宽泛很多。Locale根据计算机用户所使用的语言,所在国家或者地区,以及当地的文化传统所定义的一个软件运行时的语言环境。这个...

空空如也

空空如也

1 2 3 4 5 ... 8
收藏数 157
精华内容 62
关键字:

地区编码是什么