精华内容
下载资源
问答
  • 使用Python在指定文件夹新建一个文本文档(其他类型文件也可) 今天在做一个信息查询系统时需要对读入的信息进行保存,自然需要建立文件,于是就在网上寻找了很多见文件的方法。我选择了一种操作比较简单的文件处理...

    ☞☞☞点击查看更多优秀Python博客☜☜☜

    使用Python在指定文件夹新建一个文本文档(其他类型文件也可)

    今天在做一个信息查询系统时需要对读入的信息进行保存,自然需要建立文件,于是就在网上寻找了很多见文件的方法。我选择了一种操作比较简单的文件处理方式,希望对你有帮助。

    在指定路径下新建文件

    这里新建文件的方式理论上可以建成任意格式,在程序中可以改变文件的后缀,废话少说,直接上代码:

    import os
    #函数中的name是新建文件的名字,msg是写入的内容,类型为str类型,可任意传参
     def text_create(name, msg):    
         desktop_path = "F:\\ 文件存放的地址"  # 新创建的txt文件的存放路径    
         full_path = desktop_path + name + '.txt'   #也可以创建一个.doc的word文档    
         file = open(full_path, 'w')    # w 的含义为可进行读写
         file.write(msg)        #file.write()为写入指令
         file.close() 
         
    

    读指定文件(txt)里的内容

    要想读出txt里面的文件内容就需要首先打开文件,使用open()函数。然后使用file.readlines()读出里面的内容,最后进行打印。
    读出指定位置TXT文件里的内容代码如下:

    import os
    Address1 = "F:\信息统计系统\信息储存\表头.txt"    #你所要打开的特定目录的特定文件
    #打印表头
    with open(Address1,'r') as file:
        TXT1 = file.readlines()
        file.close()
    print(TXT1[0],"\n")  
    

    如果需要对文件名字进行变量表示可使用一下方式:

     ADD = "F:\信息统计系统\信息储存\\" + name +".txt"
     #其中的name为变量,类型为str类型,可进行传参
     Address2 = ADD  
      with open(Address2,'r') as file:
      TXT2 = file.readlines()
      file.close()
     print(TXT2[0],"\n")                          #假设你要读取第一行打印输出
     print("\n")
    

    打开文件的方法(只要路径已知理论上可以打开任何文件)

    代码比较简单只有一行,具体含义大家可以查阅资料,需要注意的是一定要有import os,若程序开头不含有import os程序会进行报错,代码如下:

    import os
    os.system("start explorer F:\信息统计系统\信息储存")
    

    注意如果你在复制过程中发现程序出错可能是复制过程中对齐的问题,大家注意一下格式即可!

    以上即为本次的全部内容,希望能够帮到你![比心]

    **文章导航:**

    零基础学Python教程
    在这里插入图片描述

    展开全文
  • 现有一文件,其扩展名未知或标记错误。...我们可以使用一个文本编辑工具如UltraEdit打开文件(16进制模式下),然后看文件头是什么字符,以下是常见文件类型文件头字符(16进制),希望对你有帮助:JPEG (jpg),文件头...

    现有一文件,其扩展名未知或标记错误。假设它是一个正常的、非空的文件,且将扩展名更正后可以正常使用,那么,如何判断它是哪种类型的文件?

    在后缀未知,或者后缀被修改的文件,依然通过文件头来判断该文件究竟是什么文件类型。我们可以使用一个文本编辑工具如UltraEdit打开文件(16进制模式下),然后看文件头是什么字符,以下是常见文件类型的文件头字符(16进制),希望对你有帮助:

    JPEG (jpg),文件头:FFD8FF

    PNG (png),文件头:89504E47

    GIF (gif),文件头:47494638

    TIFF (tif),文件头:49492A00

    Windows Bitmap (bmp),文件头:424D

    CAD (dwg),文件头:41433130

    Adobe Photoshop (psd),文件头:38425053

    Rich Text Format (rtf),文件头:7B5C727466

    XML (xml),文件头:3C3F786D6C

    HTML (html),文件头:68746D6C3E

    Email [thorough only] (eml),文件头:44656C69766572792D646174653A

    Outlook Express (dbx),文件头:CFAD12FEC5FD746F

    Outlook (pst),文件头:2142444E

    MS Word/Excel (xls.or.doc),文件头:D0CF11E0

    MS Access (mdb),文件头:5374616E64617264204A

    WordPerfect (wpd),文件头:FF575043

    Postscript (eps.or.ps),文件头:252150532D41646F6265

    Adobe Acrobat (pdf),文件头:255044462D312E

    Quicken (qdf),文件头:AC9EBD8F

    Windows Password (pwl),文件头:E3828596

    ZIP Archive (zip),文件头:504B0304

    RAR Archive (rar),文件头:52617221

    Wave (wav),文件头:57415645

    AVI (avi),文件头:41564920

    Real Audio (ram),文件头:2E7261FD

    Real Media (rm),文件头:2E524D46

    MPEG (mpg),文件头:000001BA

    MPEG (mpg),文件头:000001B3

    Quicktime (mov),文件头:6D6F6F76

    Windows Media (asf),文件头:3026B2758E66CF11

    MIDI (mid),文件头:4D546864

    下面在提供一个网上使用java写的根据头文件码判断文件类型

    packagecom;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.IOException;importjava.util.Date;importjava.util.HashMap;importjava.util.Iterator;importjava.util.Map;importjava.util.Set;public classFileType {public final static Map FILE_TYPE_MAP = new HashMap();privateFileType(){}static{

    getAllFileType();//初始化文件类型信息

    }/*** Discription:[getAllFileType,常见文件头信息]*/

    private static voidgetAllFileType()

    {

    FILE_TYPE_MAP.put("ffd8ffe000104a464946", "jpg"); //JPEG (jpg)

    FILE_TYPE_MAP.put("89504e470d0a1a0a0000", "png"); //PNG (png)

    FILE_TYPE_MAP.put("47494638396126026f01", "gif"); //GIF (gif)

    FILE_TYPE_MAP.put("49492a00227105008037", "tif"); //TIFF (tif)

    FILE_TYPE_MAP.put("424d228c010000000000", "bmp"); //16色位图(bmp)

    FILE_TYPE_MAP.put("424d8240090000000000", "bmp"); //24位位图(bmp)

    FILE_TYPE_MAP.put("424d8e1b030000000000", "bmp"); //256色位图(bmp)

    FILE_TYPE_MAP.put("41433130313500000000", "dwg"); //CAD (dwg)

    FILE_TYPE_MAP.put("3c21444f435459504520", "html"); //HTML (html)

    FILE_TYPE_MAP.put("3c21646f637479706520", "htm"); //HTM (htm)

    FILE_TYPE_MAP.put("48544d4c207b0d0a0942", "css"); //css

    FILE_TYPE_MAP.put("696b2e71623d696b2e71", "js"); //js

    FILE_TYPE_MAP.put("7b5c727466315c616e73", "rtf"); //Rich Text Format (rtf)

    FILE_TYPE_MAP.put("38425053000100000000", "psd"); //Photoshop (psd)

    FILE_TYPE_MAP.put("46726f6d3a203d3f6762", "eml"); //Email [Outlook Express 6] (eml)

    FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "doc"); //MS Excel 注意:word、msi 和 excel的文件头一样

    FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "vsd"); //Visio 绘图

    FILE_TYPE_MAP.put("5374616E64617264204A", "mdb"); //MS Access (mdb)

    FILE_TYPE_MAP.put("252150532D41646F6265", "ps");

    FILE_TYPE_MAP.put("255044462d312e350d0a", "pdf"); //Adobe Acrobat (pdf)

    FILE_TYPE_MAP.put("2e524d46000000120001", "rmvb"); //rmvb/rm相同

    FILE_TYPE_MAP.put("464c5601050000000900", "flv"); //flv与f4v相同

    FILE_TYPE_MAP.put("00000020667479706d70", "mp4");

    FILE_TYPE_MAP.put("49443303000000002176", "mp3");

    FILE_TYPE_MAP.put("000001ba210001000180", "mpg"); //

    FILE_TYPE_MAP.put("3026b2758e66cf11a6d9", "wmv"); //wmv与asf相同

    FILE_TYPE_MAP.put("52494646e27807005741", "wav"); //Wave (wav)

    FILE_TYPE_MAP.put("52494646d07d60074156", "avi");

    FILE_TYPE_MAP.put("4d546864000000060001", "mid"); //MIDI (mid)

    FILE_TYPE_MAP.put("504b0304140000000800", "zip");

    FILE_TYPE_MAP.put("526172211a0700cf9073", "rar");

    FILE_TYPE_MAP.put("235468697320636f6e66", "ini");

    FILE_TYPE_MAP.put("504b03040a0000000000", "jar");

    FILE_TYPE_MAP.put("4d5a9000030000000400", "exe");//可执行文件

    FILE_TYPE_MAP.put("3c25402070616765206c", "jsp");//jsp文件

    FILE_TYPE_MAP.put("4d616e69666573742d56", "mf");//MF文件

    FILE_TYPE_MAP.put("3c3f786d6c2076657273", "xml");//xml文件

    FILE_TYPE_MAP.put("494e5345525420494e54", "sql");//xml文件

    FILE_TYPE_MAP.put("7061636b616765207765", "java");//java文件

    FILE_TYPE_MAP.put("406563686f206f66660d", "bat");//bat文件

    FILE_TYPE_MAP.put("1f8b0800000000000000", "gz");//gz文件

    FILE_TYPE_MAP.put("6c6f67346a2e726f6f74", "properties");//bat文件

    FILE_TYPE_MAP.put("cafebabe0000002e0041", "class");//bat文件

    FILE_TYPE_MAP.put("49545346030000006000", "chm");//bat文件

    FILE_TYPE_MAP.put("04000000010000001300", "mxp");//bat文件

    FILE_TYPE_MAP.put("504b0304140006000800", "docx");//docx文件

    FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "wps");//WPS文字wps、表格et、演示dps都是一样的

    FILE_TYPE_MAP.put("6431303a637265617465", "torrent");

    FILE_TYPE_MAP.put("6D6F6F76", "mov"); //Quicktime (mov)

    FILE_TYPE_MAP.put("FF575043", "wpd"); //WordPerfect (wpd)

    FILE_TYPE_MAP.put("CFAD12FEC5FD746F", "dbx"); //Outlook Express (dbx)

    FILE_TYPE_MAP.put("2142444E", "pst"); //Outlook (pst)

    FILE_TYPE_MAP.put("AC9EBD8F", "qdf"); //Quicken (qdf)

    FILE_TYPE_MAP.put("E3828596", "pwl"); //Windows Password (pwl)

    FILE_TYPE_MAP.put("2E7261FD", "ram"); //Real Audio (ram)

    }/*** 得到上传文件的文件头

    *@paramsrc

    *@return

    */

    public static String bytesToHexString(byte[] src) {

    StringBuilder stringBuilder= newStringBuilder();if (src == null || src.length <= 0) {return null;

    }for (int i = 0; i < src.length; i++) {int v = src[i] & 0xFF;

    String hv=Integer.toHexString(v);if (hv.length() < 2) {

    stringBuilder.append(0);

    }

    stringBuilder.append(hv);

    }returnstringBuilder.toString();

    }/*** 根据制定文件的文件头判断其文件类型

    *@paramfilePaht

    *@return

    */

    public staticString getFileType(String filePaht){

    String res= null;try{

    FileInputStream is= newFileInputStream(filePaht);byte[] b = new byte[10];

    is.read(b,0, b.length);

    String fileCode=bytesToHexString(b);

    System.out.println(fileCode);//这种方法在字典的头代码不够位数的时候可以用但是速度相对慢一点

    Iterator keyIter =FILE_TYPE_MAP.keySet().iterator();while(keyIter.hasNext()){

    String key=keyIter.next();if(key.toLowerCase().startsWith(fileCode.toLowerCase()) ||fileCode.toLowerCase().startsWith(key.toLowerCase())){

    res=FILE_TYPE_MAP.get(key);break;

    }

    }

    }catch(FileNotFoundException e) {

    e.printStackTrace();

    }catch(IOException e) {

    e.printStackTrace();

    }returnres;

    }public static void main(String[] args) throwsException {

    String type= getFileType("C:/test/eee.WMV");

    System.out.println("eee.WMV : "+type);

    System.out.println();

    type= getFileType("C:/test/350996.wav");

    System.out.println("350996.wav : "+type);

    System.out.println();

    }

    }

    出处:http://blog.csdn.net/songylwq/article/details/6139753

    展开全文
  • 文本文件执行SQL语句参考文档 适用mysql5.7。 1. mysql客户端记录     MySQL的客户端可以做这些类型的日志记录,用于交互式执行的语句: 在Unix上,mysql将语句写入历史文件。默认情况下,此文件在您的家...

    适用mysql5.7。

    1. mysql客户端记录

        MySQL的客户端可以做这些类型的日志记录,用于交互式执行的语句:

    • 在Unix上,mysql将语句写入历史文件。默认情况下,此文件在您的家目录中命名为 .mysql_history。要指定其他文件,请设置MYSQL_HISTFILE环境变量的值 。
    • 在所有平台上,如果给出了 --syslog 选项,mysql会将语句写入系统日志记录工具。在Unix上,这是 syslog;在Windows上,它是Windows事件日志。记录的消息出现的目的地取决于系统。在Linux上,目标通常是 /var/log/messages文件。

        以下讨论描述了适用于所有日志记录类型的特征,并提供了每种日志记录类型所特有的信息。

    1.1 记录如何发生

        对于每个启用的日志记录目标,语句日志记录如下发生:

    • 只有交互执行时才会记录语句。语句是非交互的,例如,从文件或管道读取时。还可以使用 --batch 或 --execute 选项来禁止语句日志记录。
    • 如果语句与“ignore”列表中的任何模式匹配,则它们将被忽略且不被记录。
    • mysql分别记录每个非忽略的、非空的语句行。
    • 如果一个不可忽略的语句跨越多行(不包括终止定界符),则mysql将这些行连接起来以形成完整的语句,将换行符映射到空格,并记录结果以及定界符。
      因此,跨多行的输入语句可以记录两次。考虑以下输入:
    mysql> SELECT
        -> 'Today is'
        -> ,
        -> CURDATE()
        -> ;
    

        在这种情况下,mysql将记录 “SELECT”,“‘Today is’”,“,”,“CURDATE()”,和 “;”行读取它们。在将 SELECT\n’Today is’\n,\nCURDATE() 映射到 SELECT ‘Today is’ ,CURDATE() 后,它还记录完整的语句。因此,这些行出现在记录的输出中:

    SELECT
    'Today is'
    ,
    CURDATE()
    ;
    SELECT 'Today is' , CURDATE();
    

        出于记录目的, mysql忽略与“ ignore ”列表中的任何模式匹配的语句。默认情况下,模式列表为 “IDENTIFIED:PASSWORD”,以忽略引用密码的语句。模式匹配不区分大小写。在模式中,两个字符是特殊的:

    • ? 匹配任何单个字符。
    • * 匹配零个或多个字符的任何序列。

        要指定其他模式,请使用 --histignore 选项或设置 MYSQL_HISTIGNORE环境变量。(如果同时指定了两者,则选项值优先。)该值应该是一个或多个以冒号分隔的模式的列表,并附加到默认模式列表中。
        命令行上指定的模式可能需要加引号或转义,以防止命令解释器对其进行特殊处理。例如, 除了引用密码的语句之外,要禁止记录 UPDATE和DELETE语句,请像下面这样调用mysql:

    shell> mysql --histignore="*UPDATE*:*DELETE*"
    
    1.2 控制历史记录文件

        .mysql_history文件应该以限制性的接入方式进行保护,因为敏感信息可能会被写入到它,如包含密码的SQL语句。
        如果您不想维护历史记录文件,请先删除 .mysql_history(如果存在)。然后,使用以下两种技术之一阻止其再次创建:

    • 将MYSQL_HISTFILE环境变量设置为/dev/null。要使此设置在您每次登录时生效,请将其放在shell程序的启动文件之一中(比如/etc/profile)。
    • 创建/dev/null的符号链接.mysql_history。只需执行一次:
    shell> ln -s /dev/null $HOME/.mysql_history
    
    1.3 syslog日志记录特征

        如果给出了 --syslog 选项,则mysql将交互式语句写入系统日志记录工具。消息日志记录具有以下特征。
        日志记录发生在“信息”级别。这对应于Unix/Linux系统日志功能上syslog的LOG_INFO优先级和Windows事件日志的EVENTLOG_INFORMATION_TYPE。
        消息大小限制为1024个字节。
        消息由标识符MysqlClient和这些值组成:

    • SYSTEM_USER
      操作系统用户名(登录名)或 -‌- (用户未知的情况下)
    • MYSQL_USER
      MySQL用户名(由–user选项指定 )或 -‌- (用户未知的情况下)
    • CONNECTION_ID
      客户端连接标识符。这与会话中CONNECTION_ID()的函数值相同。
    • DB_SERVER
      服务器主机,或者 -‌- (主机未知情况下)
    • DB
      默认数据库,或者 -‌- (如果未选择数据库)
    • QUERY
      记录的语句的文本。

        这是在Linux上使用 --syslog 生成的输出示例。格式化此输出以提高可读性;每条记录的消息实际上只占一行。

    Feb  6 20:06:12 blog MysqlClient: SYSTEM_USER:'root', MYSQL_USER:'root', CONNECTION_ID:6, DB_SERVER:'--', DB:'--', QUERY:'show databases;'
    

    2. mysql客户端服务器端帮助

    mysql> help search_string
    

        如果为help 命令提供参数,则mysql将其用作搜索字符串,以从《 MySQL参考手册》的内容访问服务器端帮助。该命令的正确操作要求mysql使用帮助主题信息来初始化数据库中的帮助表。
        如果搜索字符串不匹配,则搜索失败:

    mysql> help me
    
    Nothing found
    Please try to run 'help contents' for a list of all accessible topics
    

        使用help contents查看帮助类别的列表:

    mysql> help contents
    You asked for help about help category: "Contents"
    For more information, type 'help <item>', where <item> is one of the
    following categories:
       Account Management
       Administration
       Data Definition
       Data Manipulation
       Data Types
       Functions
       Functions and Modifiers for Use with GROUP BY
       Geographic Features
       Language Structure
       Plugins
       Storage Engines
       Stored Routines
       Table Maintenance
       Transactions
       Triggers
    

        如果搜索字符串匹配多个项目,则 mysql显示匹配主题的列表:

    mysql> help logs
    Many help items for your request exist.
    To make a more specific request, please type 'help <item>',
    where <item> is one of the following topics:
       SHOW
       SHOW BINARY LOGS
       SHOW ENGINE
       SHOW LOGS
    

        使用主题作为搜索字符串,以查看该主题的帮助条目:

    mysql> help show binary logs
    Name: 'SHOW BINARY LOGS'
    Description:
    Syntax:
    SHOW BINARY LOGS
    SHOW MASTER LOGS
    
    Lists the binary log files on the server. This statement is used as
    part of the procedure described in [HELP PURGE BINARY LOGS], that shows
    how to determine which logs can be purged.
    
    mysql> SHOW BINARY LOGS;
    +---------------+-----------+
    | Log_name      | File_size |
    +---------------+-----------+
    | binlog.000015 |    724935 |
    | binlog.000016 |    733481 |
    +---------------+-----------+
    

        搜索字符串可以包含通配符%和\u。它们与使用LIKE运算符执行的模式匹配操作具有相同的含义。例如,HELP rep% 返回以rep开头的主题列表:

    mysql> HELP rep%
    Many help items for your request exist.
    To make a more specific request, please type 'help <item>',
    where <item> is one of the following
    topics:
       REPAIR TABLE
       REPEAT FUNCTION
       REPEAT LOOP
       REPLACE
       REPLACE FUNCTION
    

    3. 从文本文件执行SQL语句

        在MySQL的客户端通常交互使用,如下所示:

    shell> mysql db_name
    

        但是,也可以将SQL语句放入文件中,然后告诉mysql从该文件中读取其输入。为此,创建一个包含您要执行的语句的文本文件text_file 。然后调用 mysql,如下所示:

    shell> mysql db_name < text_file
    

        如果将 USE db_name 语句作为文件中的第一条语句放置,则无需在命令行上指定数据库名称:

    shell> mysql < text_file
    

        如果您已经在运行mysql,则可以使用source 或 . 命令执行SQL脚本文件:

    mysql> source file_name
    mysql> \. file_name
    

        有时,您可能希望您的脚本向用户显示进度信息。为此,您可以插入如下语句:

    SELECT '<info_to_display>' AS ' ';
    

        该语句显示输出 <info_to_display>。
        您也可以使用 --verbose 选项调用mysql,该选项使每个语句在产生结果之前显示。
        mysql在输入文件的开头忽略Unicode字节顺序标记(BOM)字符。以前,它会读取它们并将其发送到服务器,从而导致语法错误。BOM的存在不会导致 mysql更改其默认字符集。为此,请使用诸如 --default-character-set=utf8 的选项调用mysql。

    在这里插入图片描述

    参考文档

    https://dev.mysql.com/doc/refman/5.7/en/mysql-batch-commands.html

    展开全文
  • pandas.read_csv可以读取CSV(逗号分割)文件文本类型文件text、log类型到DataFrame 一、pandas.read_csv常用参数整理 也支持文件的部分导入和选择迭代,更多帮助参见:...

    pandas.read_csv可以读取CSV(逗号分割)文件、文本类型的文件text、log类型到DataFrame

    一、pandas.read_csv常用参数整理

    也支持文件的部分导入和选择迭代,更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html

    参数:

    filepath_or_buffer :可以是URL,可用URL类型包括:http, ftp, s3和文件。对于多文件正在准备中本地文件读取。 
    实例1:实现图片中文件的读取,注意图片中的所有输入基于英文输入下得到,返回DataFrame文件 

    In [1]: import pandas as pd
    #读取out.log文件,其他的参数默认
    In [2]: out = pd.read_csv('out.log')
    
    In [3]: out
    Out[3]:
            book  kook
    0      joke2  dddd
    1      fang3   NaN
    2      test1   NaN
    3      test2   NaN
    4      test3   NaN
    5  1997/10/2   NaN


    实例2:读取股票数据csv文件,返回DataFrame文件

    In [4]: stock = pd.read_csv('000777.csv')
    
    In [5]: stock
    Out[5]:
                date     code  closing   high    low  opening  pre_closing    zde  \
    0      2017/1/20  '000777    21.17  21.29  20.90    20.90        20.86   0.31
    1      2017/1/19  '000777    20.86  21.14  20.82    21.12        21.12  -0.26
    2      2017/1/18  '000777    21.12  21.44  21.09    21.40        21.37  -0.25
    3      2017/1/17  '000777    21.37  21.49  20.75    21.17        21.15   0.22
    4      2017/1/16  '000777    21.15  22.50  20.28    22.50        22.53  -1.38
    5      2017/1/13  '000777    22.53  22.88  22.43    22.71        22.85  -0.32
    6      2017/1/12  '000777    22.85  23.53  22.75    23.41        23.51  -0.66


    sep:如果不指定参数,则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子:’\r\t’。

    In [6]: a = pd.read_csv('out.log',sep = '\s')
    C:/Anaconda3/Scripts/ipython-script.py:1: ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex); you can avoid this warning by specifying engine='python'.
      if __name__ == '__main__':
    #设定空值作为分隔符,','不会分割每一行的数据
    In [7]: a
    Out[7]:
        book,kook
    0  joke2,dddd
    1       fang3
    2       test1
    3       test2
    4       test3
    5   1997/10/2
    #空值的设定两种方式:' ' or '\s'
    In [9]: a = pd.read_csv('out.log',sep = ' ')In [10]: a
    Out[10]:
        book,kook
    0  joke2,dddd
    1       fang3
    2       test1
    3       test2
    4       test3
    5   1997/10/2


    delimiter :定界符,备选分隔符(如果指定该参数,则sep参数失效)

    In [13]: a = pd.read_csv('out.log',sep = ', ',delimiter='o')
    #此时sep = ','设定失效
    In [14]: a
    Out[14]:
               b Unnamed: 1  k,k  Unnamed: 3   k
    0          j   ke2,dddd  NaN         NaN NaN
    1      fang3        NaN  NaN         NaN NaN
    2      test1        NaN  NaN         NaN NaN
    3      test2        NaN  NaN         NaN NaN
    4      test3        NaN  NaN         NaN NaN
    5  1997/10/2        NaN  NaN         NaN NaN


    delim_whitespace : 指定空格(例如’ ‘或者’ ‘)是否作为分隔符使用,等效于设定sep=’\s+’。如果这个参数设定为True那么delimiter 参数失效。

    In [20]: a = pd.read_csv('out.log',delim_whitespace = True)
    
    In [21]: a
    Out[21]:
        book,kook
    0  joke2,dddd
    1       fang3
    2       test1
    3       test2
    4       test3
    5   1997/10/2


    header :指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0【第一行数据】,否则设置为None。如果明确设定 header = 0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有多个标题),介于中间的行将被忽略掉。注意:如果skip_blank_lines=True 那么header参数忽略注释行和空行,所以header=0表示第一行数据而不是文件的第一行。

    In [22]: a = pd.read_csv('out.log',delim_whitespace = True,header = None)In [23]: a
    Out[23]:
                0
    0   book,kook
    1  joke2,dddd
    2       fang3
    3       test1
    4       test2
    5       test3
    6   1997/10/2


    names :用于结果的列名列表,如果数据文件中没有列标题行,就需要执行 header=None。names属性在header之前运行默认列表中不能出现重复,除非设定参数mangle_dupe_cols=True。

    In [32]: a = pd.read_csv('out.log',names='ko')
    
    In [33]: a
    Out[33]:
               k     o
    0       book  kook
    1      joke2  dddd
    2      fang3   NaN
    3      test1   NaN
    4      test2   NaN
    5      test3   NaN
    6  1997/10/2   NaN


    index_col :用作行索引的列编号或者列名,如果给定一个序列则有多个行索引。

    In [45]: a = pd.read_csv('out.log',header=None,prefix='XX',index_col=0)
    #指定第一列作为行索引
    In [46]: a
    Out[46]:
                XX1
    XX0
    book       kook
    joke2      dddd
    fang3       NaN
    test1       NaN
    test2       NaN
    test3       NaN
    1997/10/2   NaNIn [47]: a = pd.read_csv('out.log',header=None,prefix='XX',index_col=1)
    #指定第二列作为行索引
    In [48]: a
    Out[48]:
                XX0
    XX1
    kook       book
    dddd      joke2
    NaN       fang3
    NaN       test1
    NaN       test2
    NaN       test3
    NaN   1997/10/2


    usecols:返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。
    prefix:在没有列标题时,也就是header设定为None,给列添加前缀。例如:添加prefix= ‘X’ 使得列名称成为 X0, X1, …

    In [38]: a = pd.read_csv('out.log',header=None,prefix='XX')
    
    In [39]: a
    Out[39]:
             XX0   XX1
    0       book  kook
    1      joke2  dddd
    2      fang3   NaN
    3      test1   NaN
    4      test2   NaN
    5      test3   NaN
    6  1997/10/2   NaN


    dtype: 每列数据的数据类型。例如 {‘a’: np.float64, ‘b’: np.int32}

    In [49]: a = pd.read_csv('out.log',header=None,prefix='XX',index_col=1,dtype={'XX0':str})
    
    In [50]: a
    Out[50]:
                XX0
    XX1
    kook       book
    dddd      joke2
    NaN       fang3
    NaN       test1
    NaN       test2
    NaN       test3
    NaN   1997/10/2
    
    In [51]: a['XX0'].values
    Out[51]: array(['book', 'joke2', 'fang3', 'test1', 'test2', 'test3', '1997/10/2'], dtype=object)
    
    In [52]: a['XX0'].values[0]
    Out[52]: 'book'In [53]: type(a['XX0'].values[0])
    Out[53]: str


    skipinitialspace:忽略分隔符后的空白(默认为False,即不忽略).


    skiprows :需要忽略的行数(从文件开始处算起),或需要跳过的行号列表(从0开始)。
     

    In [54]: a = pd.read_csv('out.log',header=None,prefix='XX',index_col=1,skiprows= 1)
    #略去第二行的数据
    In [55]: a
    Out[55]:
                XX0
    XX1
    dddd      joke2
    NaN       fang3
    NaN       test1
    NaN       test2
    NaN       test3
    NaN   1997/10/2

    nrows :需要读取的行数(从文件头开始算起)。
     

    In [56]: a = pd.read_csv('out.log',header=None,prefix='XX',index_col=1,skiprows= 1,nrows=4)
    
    In [57]: a
    Out[57]:
            XX0
    XX1
    dddd  joke2
    NaN   fang3
    NaN   test1
    NaN   test2


    na_values :一组用于替换NA/NaN的值。如果传参,需要制定特定列的空值。默认为‘1.#IND’, ‘1.#QNAN’, ‘N/A’, ‘NA’, ‘NULL’, ‘NaN’, ‘nan’`.

    keep_default_na:如果指定na_values参数,并且keep_default_na=False,那么默认的NaN将被覆盖,否则添加

    na_filter:是否检查丢失值(空字符串或者是空值)。对于大文件来说数据集中没有空值,设定na_filter=False可以提升读取速度。

    skip_blank_lines :如果为True,则跳过空行;否则记为NaN。

     

    原文:https://blog.csdn.net/brucewong0516/article/details/79092579

    展开全文
  • VBA基础学习之文本文件 还可以读取Excel文件,并使用VBA将...顾名思义,FSO对象帮助开发人员使用驱动器,文件夹和文件。 在本节中,我们将讨论如何使用FSO。 编号 对象类型 描述 1 Drive Drive是一个对象。 ...
  • 现有一文件,其扩展名未知或标记错误。...我们可以使用一个文本编辑工具如UltraEdit打开文件(16进制模式下),然后看文件头是什么字符,以下是常见文件类型文件头字符(16进制),希望对你有帮助: JPEG (jpg)...
  • VBA文本文件(二十)

    2019-09-28 00:14:53
    还可以读取Excel文件,并使用VBA将单元格的...顾名思义,FSO对象帮助开发人员使用驱动器,文件夹和文件。 在本节中,我们将讨论如何使用FSO。 编号对象类型描述 1 Drive Drive是一个对象。 包含收集...
  • declare @s nvarchar(4000)Declare @path nvarchar(1000)Set @path = C:/inetsdk/if right(@path,1)--用游标构建每条记录的bcp导出语句,BCP的语法参考sql联机帮助declare Cur_Form cursor local for select BCP ...
  • 操作excel涵盖读写数据及批量快速读写及画图等,文本文件涵盖读写及批量读写各种数据类型文件及文件夹涵盖创建复制剪切及批量操作。这些都是笔者最常用最喜爱的基本文件。对建筑,测量,技术,会计,统计,PC开发...
  • 如果你认为本系列文章对你有所帮助,请大家有钱的捧个钱场,点击此处赞助,赞助额0.1元起步,多少随意 ...Linux中最多的一种文件类型, 包括 纯文本文件(ASCII);二进制文件(binary);数据格式的文件(data);各种...
  • 一、简单命令【文件类型帮助命令、变量等】 二、文件系统命令 三、文本操作命令 四、VI全屏文本编辑器 一、简单命令 1.查看命令类型文件文件类型,了解linux命令执行过程 type: 查看命令类型 使用示例 type...
  • 当csv文件中有字符串等其他类型的值时(如下图),只能跳过该行或该列(csvread的第2,3个参数是读取文件的指定行)。 不过,matlab的帮助中心现在已经不推荐使用这种方法读取csv文件了。其实有其他方法更好的读取...
  • 在linux这个一切皆文件的世界中,对文件的理解很是重要,自己将apue中的文件类型总结了以下,希望对大家有所帮助。一. linux下文件系统大概包括普通文件,目录文件,块特殊文件,字符特殊文件,FIFO,套接字,符号...
  • Windows 98 中把 CHM 类型文件称作“编译的 HTML 帮助文件”在Windows中我们不用安装软件也能打开文件进行查看,上图可以看出chm文件的展示凡是和网站很类似,使用起来结构很清xd晰,比较方便分类存储一些说明文本。...
  • ①内置命令(shell内置)②外部命令(在文件系统某个路径下有一个与命令名称相应的可执行文件)type:显示指定命令属于哪种类型Linux时间可分为系统时间和硬件时间,date(管理系统时间),clock=hwclock(管理硬件...
  • 软件大小: 3.54 MB软件版本: 7.8.9软件类型:文字处理查看详情直接下载Notepad++是一款不错的文本编辑软件,很多程序员都在使用,小编下面给大家讲一下Notepad++对比两个文件代码的方法,相信可以帮助到你们。...
  • 以下代码仅适用于从S3中的存储桶下载文本文件。这不适用于图像。有使用AWS SDK管理下载/类型的更简单的方法吗?文档中包含的示例并不清楚。谢谢!AWSCredentials myCredentials = new BasicAWSCredentials(String....
  • C++文件

    2020-12-21 11:04:42
    C++文件文件文件类型文件操作文件具体操作文本文件文本文件->写文件文本文件->读文件二进制文件二进制文件->写文件二进制文件->读文件 本文是在学习C++视频时所做的笔记,上传上来希望能帮助有需要的人 ...
  • 请单击左侧的标签来选择你想要查看的成员类型。 属性 SHOW: 属性 集合 事件 方法 对象 样式 属性 描述 activeElement 获取当父 document 拥有焦点时获得焦点的对象。 alinkColor 设置或获取元素中...
  • BERT生成文本摘要

    千次阅读 2020-07-10 16:58:10
    这就是自动摘要可以帮助我们的地方。机器学习在总结方面取得了长足的进步,但仍有很大的发展空间。通常,机器摘要分为两种类型 摘要提取:如果重要句子出现在原始文件中,提取它。 总结摘要:总结文件中包含的重要
  • 这是用于将文本和数据保存在钥匙串中的帮助器功能的集合。 您可能已经注意到,Apple的钥匙串API有点冗长。 该库旨在提供用于完成简单任务的较短语法:读取/写入指定键的文本值: let keychain = KeychainSwift () ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 768
精华内容 307
关键字:

帮助文件文本类型