精华内容
下载资源
问答
  • 解决Mac文件乱码问题

    千次阅读 2020-10-26 18:20:12
    《一行shell解决Mac文件乱码问题》   使用Mac工作的小伙伴,经常面对一个问题就是,同事发来的一个文件是乱码的,尝试各种工具进行解码,如果文件少还好,文件多,几乎是崩溃的,所以本文记录了一个利用一行shell...

    《一行shell解决Mac文件乱码问题》

      使用Mac工作的小伙伴,经常面对一个问题就是,同事发来的一个文件是乱码的,尝试各种工具进行解码,如果文件少还好,文件多,几乎是崩溃的,所以本文记录了一个利用一行shell就能够解决乱码问题的代码,其功能是对当前文件夹下所有的GB18030编码的文件进行转码为UTF-8

    Key Words:Mac接受文件乱码


    Beijing, 2020

    Agile Pioneer  

    • 单个文件转换
    iconv -f GB18030 -t UTF-8 ./your_file_name > ./new_your_file_name
    
    • 当前文件夹所有文件转换
    for name in `ls ./`;do iconv -f GB18030 -t UTF-8 ./$name > ./new_$name;mv ./new_$name $name;done
    
    展开全文
  • c++实现txt文件的读写,并解决txt编码格式为UTF-8显示乱码问题。
  • 我们可能会遇到这一现象,把Linux上的文件上传到Windows,或者把Windows上的文件上传到Linux,然后打开文件后中文会出现乱码,这是什么原因呢? Windows的文件编码一般是gb2312,Linux的编码是UTF-8(我的是这个。)...

    我们可能会遇到这一现象,把Linux上的文件上传到Windows,或者把Windows上的文件上传到Linux,然后打开文件后中文会出现乱码,这是什么原因呢?

    Windows的文件编码一般是gb2312,Linux的编码是UTF-8(我的是这个。)因此文件如果包含中文的话就会出现乱码。

    解决方案
    假设我们将Windows上的a.txt文件上传到Linux上,只需要对文件进行转码即可。

    通过iconv命令转码
    输入/输出格式规范:
    -f, --from-code=NAME 原始文本编码
    -o, --output=FILE 输出文件
    -l, --list 列举所有已知的字符集
    
    $iconv -f gb2312 a.txt -o aa.txt
    

    这样我们就会得到一个不乱码的aa.txt文件了

    展开全文
  • 如何解决爬取某时段微博数据但保存在csv文件中出现乱码问题 1、(1获取微博数据以及存储在csv中) 源代码如下 # start_chrome -> input_date -> scroll_down-> find_cards_info -> ...

    如何解决爬取某时段微博数据但保存在csv文件中出现乱码问题
    1、(1获取微博数据以及存储在csv中)
    源代码如下

    # start_chrome -> input_date -> scroll_down-> find_cards_info -> save -> find_next (goto)
    from selenium import webdriver
    from selenium.webdriver.common.keys import Keys
    import time
    import csv
    import os
    
    # 运行前先下载 chrome driver,下载地址是:https://sites.google.com/a/chromium.org/chromedriver/downloads,点击【Latest Release: ChromeDriver x.xx】进入下载
    
    def start_chrome():
        driver = webdriver.Chrome(executable_path='./chromedriver')  # Windows 需写成'./chromedriver.exe'
        driver.start_client()
        return driver
    # weibo.com/sxbg? + start_t ...
    
    def q(st,et):
        return f'?is_ori=1&key_word=&start_time={st}&end_time={et}&is_search=1&is_searchadv=1#_0'
    
    def scroll_down():
        html_page = driver.find_element_by_tag_name('html')
        # ...# form > input
        for i in range(15):
            print(i)
            html_page.send_keys(Keys.END)
            time.sleep(0.6)
    
    def find_cards_info():
        cards_sel = 'div.WB_feed_detail'
        cards     = driver.find_elements_by_css_selector(cards_sel)
        info_list = []
    
        for card in cards:
            content_sel = 'div.WB_text.W_f14'
            time_sel    = 'div.WB_from.S_txt2'
            link_sel    = 'div.WB_from.S_txt2 > a:nth-child(1)'
            content     = card.find_element_by_css_selector(content_sel).text
            time        = card.find_element_by_css_selector(time_sel).text
            link        = card.find_element_by_css_selector(link_sel).get_attribute('href')
    
            info_list.append([content,time,link])
            # [[1,2,3],[4,5,6]...]
        return info_list
    
    def find_next():
        next_sel  = 'a.page.next'
        next_page = driver.find_elements_by_css_selector(next_sel)
        if next_page:
            return next_page[0].get_attribute('href')
    
    def save(info_list,name):
        full_path = './' + name + '.csv' # 2018-01-02~2018-03-05.csv
        if os.path.exists(full_path):
            with open(full_path,'a') as f:
                writer = csv.writer(f)
                writer.writerows(info_list)
                print('Done')
        else:
            with open(full_path,'w+') as f:
                writer = csv.writer(f)
                writer.writerows(info_list)
                print('Done')
    
    def run_crawler(base,duration):
        # 2018-01-02~2018-03-05
        if not base.endswith('feedtop'):
            st, et = duration.split('~')
            driver.get(base+q(st,et))
        else:
            driver.get(base)
        time.sleep(5)
        scroll_down()
        time.sleep(5)
        info_list = find_cards_info()
        save(info_list,duration)
        next_page = find_next()
        if next_page:
            run_crawler(next_page,duration)
    
    base = 'https://weibo.com/bgsxy'   #这里可以替换成你想爬取的微博用户
    driver = start_chrome()
    input()
    run_crawler(base, '2017-06-20~2018-02-03')   #这里可以替换成你想爬取的时间段
    

    之后产生相关乱码问题
    (2、如何解决在Windows系统不兼容的问题?爬取数据在csv里面产生乱码,可采用三明治方法解决)
    代码如下:

    import csv
    import os
    
    #网站是UTF-8编码,之后用UTF-8解码编码写入Windows电脑中,但是windowcsv默认是gbk解码,所以会产生乱码(mac系统没事,默认是utf8编码)
    path = 'D:\\2017-06-20~2018-09-03.csv'#爬取数据的路径
    full_path = 'D:\hsf.csv'#要保存数据的路径
    info_list = []
    c = open(path,'r',encoding='utf-8')#用utf8解码,因为大多数网站都是用utf8编码
    read = csv.reader(c)
    for line in read:
        if line:
            info_list.append(line)
            print(line)
    print('D')
    if os.path.exists(full_path):
        with open(full_path,'a',encoding='gb18030') as f:#用gb18030编码的话,适用于Windows系统
            writer = csv.writer(f)
            writer.writerows(info_list)
            print('Done')
    else:
        with open(full_path,'w+',encoding='gb18030') as f:
            writer = csv.writer(f)
            writer.writerows(info_list)
            print('Done')
    

    IDE中记得重新设置一下,不然依旧会报错

    这里写图片描述

    说明:源代码选自麻瓜教程实用主义课程中的,同时也感谢帮我解惑的蔡坤林同学和夏老师指导!如有不当之处,敬请指正!

    展开全文
  • @Test public void testFileName() throws IOException { ... // 组装post请求体,以文件的形式发送 MultipartEntityBuilder builder = MultipartEntityBuilder.create(); // 解决上传文件,文件名中文乱码问题 bui

    示例代码如下:

    @Test
        public void testFileName() throws IOException {
            File file = new File("E:\\中文1.docx");
            // 组装post请求体,以文件的形式发送
            MultipartEntityBuilder builder = MultipartEntityBuilder.create();
            // 解决上传文件,文件名中文乱码问题
            builder.setCharset(StandardCharsets.UTF_8);
            builder.setMode(HttpMultipartMode.BROWSER_COMPATIBLE);
    
            // 两种发送文件的方式
            builder.addBinaryBody("file", file);
    //        builder.addPart("file", new FileBody(file));
            HttpEntity reqEntity = builder.build();
            // 创建post请求
            HttpPost httpPost = new HttpPost("http://127.0.0.1:8500/upload");
            // 设置请求体
            httpPost.setEntity(reqEntity);
            try (
                    // 创建Httpclient对象
                    CloseableHttpClient httpClient = HttpClients.createDefault();
                    // 发送请求并处理返回的响应
                    CloseableHttpResponse response = httpClient.execute(httpPost);
            ) {
                StatusLine statusLine = response.getStatusLine();
                System.out.println("statusLine = " + statusLine);
            }
        }
    

    核心代码为

    builder.setCharset(StandardCharsets.UTF_8);
    builder.setMode(HttpMultipartMode.BROWSER_COMPATIBLE);
    

    这两句

    展开全文
  • 基于labview2011开发的,使用操作系统自带的编码.net转换UTF8编码,实测从未出错,比LabVIEW自带...可用于中转,使得labview可以上传繁体数据到服务器,或解析服务器发送的繁体字数据,或读取UTF8编码的繁体字txt文档。
  • 1.解决adb在push 或者pull过程中因文件带有中文,出现中文乱码文件失效的问题 2.重写adb.exe的源码,解决编码问题(Windows下为GBK,Android则为UTF-8)
  • 使用同样的方法(java)将查询数据生成通过ftp将文件上传到linux主机,发现有个文件类型的编码是utf-8 有个文件文件是ANSI(latin1) 求各位大神这是怎么引起的 ,可以怎么解决 谢谢
  • 情况是这样,在项目用调用文件服务的文件上传接口,出现存储的文件名显示为问号。 HttpHeaders requestHeaders = uploadUtility.setHeaders(); MultiValueMap<String, Object&...
  • Mac压缩文件传到window中文乱码

    千次阅读 2020-10-15 15:39:48
    方法一 软件:Win RAR(5.0)以上;将zip的压缩包后缀名改为.rar格式,通过WinRAR直接解压。 方法二 软件:2345好压;打开2345好压,点击右上角的设置按钮,点击下拉菜单中的代码页,将默认代码页设为UTF-8,......
  • 解决csv文件乱码问题

    2020-11-30 21:03:46
    excel自带编码是ANSI所以要让csv文件与其编码一样 1.将文件使用文本文档打开,另存为编码选择ANSI 2. 再使用excel打开
  • springcloud环境下springboot 上传中文名文件乱码问题背景文件名乱码原理处理方式总结 背景 由于同事前两天在做文件上传时,测试中文名文件上传后,后端获取到的文件名称为???.png,刚开始以为是前端编码问题,则...
  • ftplib进行文件传输的时候,经常会出现文件名含有中文而出现乱码的情况,出现的问题是ftplib文件传输默认采用的编码方式为“latin-1”,我们打开源码可以看到 解决的方法就是将编码改成utf-8即可。 在ftp登陆...
  • 主要介绍了Jmail发送邮件与带附件乱码解决办法,有需要的朋友可以参考一下
  • 需求:按行解析读取csv文件存入关系型数据库——主要是中文字体解析;遇到的问题:直接解析出来的数据为list形式,而且编码格式为unicode;解决问题:前提了解:中文编码的规则 —— GB2312字符串在Python内部的表示...
  • ftp传输文件名称乱码

    千次阅读 2019-07-02 18:46:07
    UTF-8编码格式改成GBK(汉语拼音)
  • .zip的压缩包,解压到当前目录,进入解压后的文件夹,文件夹名称乱码: 原因: ... unzip命令的使用: ...解决mac上文档发送到windows系统下乱码的问题 ubuntu下如何解压rar文件 ubuntu解压zip文件 ...
  • HttpClient4.2.5实现文件上传,无中文文件名乱码问题。亲测无问题。有问题可吐槽!
  • xftp上传文件到linux后乱码的解决方法
  • 问题描述:发送压缩文件到qq邮箱,发现标题为中文名称,能正常显示,但是附件的中文名称为乱码。 任务:解决附件中文名称的乱码问题。 前期资料总结: 1、SMTP乱码解决方案(源自...
  • 关于 MAC 下解压文件乱码的问题

    千次阅读 2017-07-27 10:34:23
    问题来源使用 mac 的用户应该都碰见过这样的情况 : 好不容易找到压缩文件, 下载下来之后却发现解压出来的文件乱码. 虽然一般来说, 文件里面的内容不会受到影, 但是认不出来文件的名字确实会带来很多困扰解决方案...
  • 乱码原因: 在resttemplate请求接口时,关于文件名的转码器里面写死了编码,由于ascii码不包含中文,所以出现乱码。 解决方案: 原则是复制FormHttpMessageConverter的代码,新建一个类,把上面的ascii码改为...
  • 上传文件时,文件名中文乱码

    千次阅读 2019-09-06 10:17:38
    遇到了一个问题,在开发时上传文件时,文件的中文名上传的是中文乱码,所解决方法: 文章转载自:https://blog.csdn.net/lengjinghk/article/details/51938644 一、对Tomcat_HOME/conf/server.xml文件进行配置(本...
  • msg.encode(‘utf-8’)是解决中文乱码问题。 quote():假如URL的 name 或者 value 值中有『&』、『%』或者『=』等符号,就会有问题。所以URL中的参数字符串也需要把『&=』等符号进行编码,quote()就是对参数字符串中...
  • 当前端上传的文件用后端Servlet接收时,会出现乱码问题。 上网搜集解决方案,找到的第一种解决方案是: //对文件名做如下转码,即可得到文件名: FileName=new String(FileName.getBytes("ISO-8859-1"), "UTF-8");...
  • Flask是支持文件上传的, 近来做了一个上传SQL文件的功能, SQL中会使用到中文, 泰文, 马来西亚文等多种语言, 我们通过Flask接收到文件, 先把文件保存在后端, 保存后却发现是乱码. 上传的逻辑参考Flask文档文件上传...
  • pscp 项目上传中文文件乱码问题

    千次阅读 2019-03-01 18:20:33
    pscp 项目上传中文文件乱码问题 putty工程是一个开源项目,可用于远程连接Linux 机器。其中pscp项目是其中的一个子项目,可用于加密地文件传输,类似于Linux系统中的scp命令,但在windows系统中运行pscp.exe,传输...
  • 使用spingmvc,在JS里面通过ajax发送请求,并返回json格式的数据,从数据库拿出来是正确的中文格式,展示在页面上就是错误的??,研究了一下,有几种解决办法。  我使用的是sping-web-3.2.2,jar  方法一:  在...
  • linux下fprintf写入文件乱码

    千次阅读 2018-09-20 21:27:35
    笔者最近经常在linux下运行一些C++程序,每次用fprintf将string类型的结果写入文件时,编译以后总会出现  警告:cannot pass objects of non-POD type ‘const struct std::basic_string<char, std::char_...
  • 通过发送一个Servlet请求,把文件名发送给服务器,发送给服务器后,接收到文件名参数,获取文件的绝对地址,通过流的形式来去写到浏览器。 还得要告诉文件是什么类型,浏览器是以MIME的类型来识别类型。 this....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 71,996
精华内容 28,798
关键字:

发送文件乱码