精华内容
下载资源
问答
  • python 编码 中文汉字显示问题小

    千次阅读 2017-11-02 10:35:40
    很多场景下,我都需要和中文汉字打交道,但是总有一些乱码的问题困扰我们,这篇文章简单介绍几种情况以及对应的处理方法。 1.场景1 我们上头上有一份数据。在notepad上打开是长这个样子的。 每一列是以Tab ('...

    摘要:

    很多场景下,我都需要和中文汉字打交道,但是总有一些乱码的问题困扰我们,这篇文章简单介绍几种情况以及对应的处理方法。


    1.场景1

    我们上头上有一份数据。在notepad上打开是长这个样子的。

    每一列是以Tab ('\t')做分割的。

    现在,我们尝试把这个文件用python自带的open打开。
    for x in open("file"):
    	print x
    打开后发现是乱七八糟的。
    我们可以来做个简单的小实验,用记事本打开文件,然后另存为的地方选择不同的编码方式可以看到显示不同的内容结果。具体来说:


    下面尝试用编码方式为unicode的来保存文件,然后显示的结果如下:


    尝试用ascii来保存文件,结果如下:



    我们发现以ascii来显示的竟然显示中文了。

    其实这个和我们控制空默认的编码方式有关系的。
    我们输入以下代码然后运行:
    import sys
    print sys.getdefaultencoding() 
    后会在控制台显示:

    也就是说我们控制台输出的默认编码方式是ascii。所以当文件格式是ascii时,能够得到正常的输出。
    注意:记事本另存为可以选择的编码方式比较少,使用notepad可以选择更多的编码方式保存。


    2.场景2


    当我们需要判断某个字符串是否包含某个字时,可以采取以下的方法。

    比如说,我们有一个句子 “生活,别有新意”,想判断“有”字是否存在。在介绍之前需要先介绍一下python的docode和encode。



    2.1 decode & encode


    字符串在python内部的表示是unicode编码。python内部自带两个转码的方法,decode和encode。decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicode编码。 
    encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串str2转换成gb2312编码。

    参考文章:编码



    下面我举个的例子来说明一下。
    print u'有'
    会显示


    如果提示错误:
    SyntaxError: Non-ASCII character '\xe6' in file E:\hqs\quanhao\blog\run.py on line 13, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

    用notepad打开程序,程序的编码方式选择红框的内容



    接着,我们来说如何判断“有”字是否在刚刚那个句子里。
    我们需要把握的原则 待比较的两个字符串需要是相同的编码方式
    由于 “有”字前面已经加了u,也就这个字符串已经使用Unicode来表示了。我们只需要把 “生活,别有新意”这句话也转成unicode的编码方式就可以比较了。

    在场景1我们提到,我们所使用的文件是utf-8的编码方式。
    所以首先需要将utf-8 转化为 unicode
    for x in open("file"):
    	print x.split('\t')[14].decode('utf-8').find(u'有')
    	raw_input('wait')

    这里说明一下 x.split('\t')[14],这个由于文件是以'\t'分隔的,取分割后的第14列。取完后就可以进行转编码。转完后使用find来判断是否有这个“有”字。
    find 输出 -1时说明不存在所查询字符,输出其他任意数字的时候说明存在某个字符。

    OK,至此我们需要判断某个字是否存在就已经完成,总之我们需要把握一个原则就是待比较的两个字符串需要是相同的编码方式。
    另外,要正确理解deocode和encode的意义(2.1已经提到了)




    展开全文
  • 1、有时h5页面文字显示字体大小不准确,是因为h5存在字体爆炸填充的效果。 所以可以设置容器的高度,不确定高度的情况下,将其高度设为max-length=9999px; 这样的话,字体会有空间展示,不会出现字体大小不准确的...

    1、有时h5页面文字显示字体大小不准确,是因为h5存在字体爆炸填充的效果。

    所以可以设置容器的高度,不确定高度的情况下,将其高度设为max-length=9999px;

    这样的话,字体会有空间展示,不会出现字体大小不准确的请。

    2、还有flexible.js文件需要在所有js之前加载,所以要将其压缩之后的代码,放在html页面里面引入。

    用<script>引入。

    3、适当使用min-height,可以将div撑起来。


    展开全文
  • 今天下载了eclipse的indigo版本,使用了一下,发现注释时的中文字体太,看起来不方便。为什么这样呢? 在windows 7系统中,font的状态分为“显示”和“隐藏”这两种状态,默认情况下,eclips使用的字体...

    今天下载了eclipse的indigo版本,使用了一下,发现注释时的中文字体太小,看起来不方便。为什么这样呢?


    在windows 7系统中,font的状态分为“显示”和“隐藏”这两种状态,默认情况下,eclips使用的字体courier new是“隐藏”状态的。因此,eclipse就会使用另外一种字体consolas。

    这个可以在eclipse-->Preferences-->General-->Appearance-->Colors and Fonts-->basic中的Test Font可以查看。

    解决办法:

    1.首先,在windows 7 系统中的Courier new字体改为“显示”状态。


    2.在eclipse中将字体改为“courier new”,打开“eclipse-->Preferences-->General-->Appearance-->Colors and Fonts-->basic”的Text Font



    然后我们就可以发现,注释的中文字体变得正常了。。。


    展开全文
  • 遇到一个关于spinner的小问题,怎么修改下拉列表中列表选项的字体大小
  • 今天在写代码的时候遇上了中文编码报错的问题,ASCII和Unicode转化的问题,报错如下: UnicodeEncodeError: '...每次遇上中文都感觉头大,这次由于需要使用中文来作为键值所以必须解决好这个问题,同样的汉字使用utf-

    今天在写代码的时候遇上了中文编码报错的问题,ASCII和Unicode转化的问题,报错如下:

    UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

    每次遇上中文都感觉头大,这次由于需要使用中文来作为键值所以必须解决好这个问题,同样的汉字使用utf-8编码之后变为:
    如:武汉------>u'\u6b66\u6c49'
           可是做键的时候就变成了:'\xe6\xad\xa6\xe6\xb1\x89'
         实在是不知道怎么回事,后来找到了解决办法就是使用字符串编码检测方法找到字符串的编码方式,然后使用该编码方式来编码即可,具体实现如下:


    #!usr/bin/env python
    #encoding:utf-8
    
    '''
    __Author__:沂水寒城
    功能:中文编码问题
    '''
    
    
    import xlrd
    import chardet
    
    
    def create_huoche_station_dict(data='china_station_names.xls'):
        '''
        创建:站名--字母简称字典
        '''
        station_name_dict={}
        content=xlrd.open_workbook(data)
        table=content.sheets()[0] 
        nrows=table.nrows #行数
        ncols=table.ncols #列数
        for i in range(1,nrows):
            row=table.row_values(i)
            if row:
                station_name_dict[row[1]]=row[-1]
        return station_name_dict
    
    
    if __name__ == '__main__':
        station_name_dict=create_huoche_station_dict(data='data/xidu/china_station_names.xls')
        station_list=["武汉","青岛北","北京西","菏泽","郑州东","哈尔滨西","重庆北","广州东","大同","新乡","拉萨","上海","兰州",
                      "桂林","洛阳","泰安","威海","烟台","济南西","沈阳北","长春","长沙","福州","偃师","成都"]
    
    
        for one in station_list:
            JX=station_name_dict[unicode(one,chardet.detect(one)['encoding'])]
            print '{0}车站简写为:{1}'.format(one,JX)


    结果如下:


    武汉车站简写为:WHA
    青岛北车站简写为:QDB
    北京西车站简写为:BJX
    菏泽车站简写为:HZE
    郑州东车站简写为:ZZD
    哈尔滨西车站简写为:HEX
    重庆北车站简写为:CQB
    广州东车站简写为:GZD
    大同车站简写为:DTO
    新乡车站简写为:XXI
    拉萨车站简写为:LSA
    上海车站简写为:SHA
    兰州车站简写为:LZH
    桂林车站简写为:GLI
    洛阳车站简写为:LYA
    泰安车站简写为:TAN
    威海车站简写为:WHA
    烟台车站简写为:YTA
    济南西车站简写为:JNX
    沈阳北车站简写为:SYB
    长春车站简写为:CCH
    长沙车站简写为:CSH
    福州车站简写为:FZH
    偃师车站简写为:YSH
    成都车站简写为:CDU
    [Finished in 0.5s]


    展开全文
  • python中将中文汉字转换为英文首字母的代码及遇到的小问题 在地名地址工作中,有一步是将属性表中的单位汉字名称转换为对应的英文首字母名称 def multi_get_letter(str_input): if isinstance(str_input, unicode...
  • 微信程序路径传参汉字乱码问题

    千次阅读 2019-03-26 13:33:17
    1.微信程序页面跳转的时候进行路由传参,value含有汉字。并且跳转进入的页面中使用到了这个value 2.点击右上角胶囊分享 3.从分享的链接中点击进入页面,在传入value汉字使用的地方会出现乱码 解决办法 接收这个...
  • 彻底解决Qt中文乱码以及汉字编码的问题(UTF-8/GBK)

    万次阅读 多人点赞 2014-02-15 16:46:22
    默认编码:System(简体中文windows系统默认指的是GBK编码,即下拉框选项里的GBK/windows-936-2000/CP936/MS936/windows-936) 二、编码知识科普 Qt常见的两种编码是:UTF-8和GBK ★UTF-8:Unicode Transformat
  • 最近碰到linux下jboss应用中中文字体显示为方框:“在JRE 5以上的java环境中,java会自动加载$JAVA_HOME/jre/lib/fonts目录下的字体。链接或复制宋体或微软雅黑等字体到该目录即可解决。”进行操作:在Windows XP...
  • 我想提取一个文本中除了中文以外的英文,数字,以及各种符号,用以下代码,能把所有的中文提取出来,有没有什么办法能在原文件中将提取出来的这一部分中文去掉剩下英文数字和各种符号,请求各位大佬帮忙,不尽感激。...
  • C 语言数组存储汉字问题小

    千次阅读 多人点赞 2020-10-25 14:52:40
    常见的中文编码 GB2312(国标简体中文字符集)和 GBK(国标扩展)使用 2 个字节编码来表示一个汉字,不常用的 GB18030 使用 4 个字节编码来表示一个汉字,更通用的 UTF-8 编码使用 3 个字节编码来表示一个汉字关于...
  • 关于解决Codeblocks中文乱码问题

    千次阅读 2019-03-05 20:28:53
    最近有很多博友在问我关于另一篇博文“表白心心”等问题,我于是又年轻了一把———把代码复制下来,运行了一下,发现了诸多问题,当然不是代码的问题,而是编译器的一些问题。 1、Codeblocks乱码 Codeblocks在...
  • eclipse目前最新版代号indigo, 在win7上使用时中文注释时字体太问题. 为什么会这样? 首先我们应该知道, 在win7系统中, font是有"显示"和"隐藏" 状态的. 默认情况下, eclipse使用的默认字体...
  • 关于微信程序的video播放问题

    万次阅读 2019-11-05 13:33:01
    需求:程序首页有两个视频,视频标签上方覆盖本地图片一张;进入默认暂停,点击播放一个,另一个暂停。 wxml部分: <view class="cp_video"> <cover-image src="/image/pink1.png" class="cpv_img...
  • 输入框文字上移问题 wxlm <input autoFocus="true" bindconfirm="confirmSearch" bindinput="search" class="srch-ipt" confirmType="search" placeholder="搜索内容" placeholderClass="ipt-placeholder" type=...
  • 微信小程序3个关于字体和图片的小问题 01字体自适应居中 代码: view> text>\n\n欢迎来到微信小程序text> view> view{ width: 100%; height: 100%; display: flex; align-items: center; justify...
  • 一款项目的发布和使用,开发者均希望...程序数据分析,是面向程序开发者、运营者的数据分析工具,提供关键指标统计、实时访问监控、自定义分析等,帮助程序产品迭代优化和运营。数据分析主要包括: (1)概...
  • 我们可以通过下面步骤进行更改:在页面中选择window&gt;preference&gt;general&gt;appearance&gt;color and font&gt;basic&gt;...在字体中找到courier new字体并选择。......
  • 在公司用eclipse写代码,发现没有svn插件, 结果安了插件发现代码变得很奇怪,多行...默认字体是Consolas,因为字库的问题,有的文字变成了方框问号, 开成微软雅黑或者其他的就好了。还以为是插件的锅。。。丢 ...
  • eclipse目前最新版代号indigo, 在win7上使用时中文注释时字体太问题. 为什么会这样? 首先我们应该知道, 在win7系统中, font是有"显示"和"隐藏" 状态的. 默认情况下, eclipse使用的默认字体courier new是处于 ...
  • 首先是网上比较常见的方法:Window --> Preferences --> General --> Appearance --> ...经过查各种各样的资料才发现原来不是字体大小问题,而是是字体问题! myeclipse新版的字体是Consolas,而老版本的是Courier
  • 程序端输入文字用微信程序wx.request的方法请求和提交数据,然后返回给后端,后端用PHP连接MySQL数据库,然后把返回的数据以接送格式发送回程序,而json格式对中文是有讲究的,这时候就出现了中文转换的乱码...
  • TabLayout的Tab切换时文字大小问题

    千次阅读 2016-10-13 14:53:50
    在Tab切换时可以设置Tab的文字颜色,但是现在需要同时改变Tab的字体大小。如上图,设置颜色的变化用tabSelectedTextColor就可以了,但是设置TextSize的选中与非选中状态的方法却找不到
  • Chrome 文字最小限制方法失效问题

    千次阅读 2013-06-26 14:53:49
    (Safari支持)Chrome支持这个属性间接解决了文字最小问题,好象仅有Chrome中文版有文字最小限制问题) 如果是用户只能更改浏览器高级设置里的选项(默认是12px,改成11px或更)。 用CSS应该如何解决呢。有人说...
  • 在微信程序开发者工具中运行时,发现图片能显示,但使用真机运行时,图片无法显示? 解决:在wxml页面中,不允许出现中文命名的图片。
  • 注意 不是每个中文都是乱码 而是只要出现以中文开头的字符串,字符串第一个中文正常输出,其后的文字全部乱码,和网络上的其他问题有点不一样,cb按其他问题的答案设置了什么complier other option 不管怎么样都不行...
  • 图片命名不能含有中文 图片命名也不能有空格 图片大写要区分 以接口或者链接形式的图片开头不能是大写的HTTP结尾也不能是.PNG 上面就是我在今天碰到问题时在网上搜到的普遍解决方法 但如果问题还没解决,...
  • 关于 qt中文乱码问题 的详解

    万次阅读 2017-11-23 09:16:29
     很简单的问题,"我是中文"这样写的时候,它是传统的 char 类型的窄字符串,我们需要的只不过是通过某种方式告诉QString 这四个汉字采用的那种编码。而问题一般都出在很多用户对自己当前的编码没太多概念。 ...
  • python2 中文编码问题小

    千次阅读 2017-08-12 15:00:57
    最近处理中文数据,python2各种编码问题,看了好多博客和文章,终于弄懂了一些,所以在这里总结一发。供大家学习和参考!1.编码(1)ASCII码ASCII码是规定的最早的计算机系统将英文文字转为数字存储的编码方式,一共...
  • MySQL5.0中文问题汉字编码问题解决方法总结 解决这类问题的方法很多,今天在此简单的终结一下, 把常碰到的问题解决方法记下来! 一、MySQL5.0中文问题解决方案如下: 1、在dos环境下,用mysql --default-character...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 917,738
精华内容 367,095
关键字:

关于汉字的小问题