精华内容
下载资源
问答
  • 常见的文本文件格式有
    2019-05-17 11:15:48

    常见文本文档格式,0为结构化或代码类,1为文档类.

    后缀类型
    C0
    CPP0
    H0
    asm0
    bat0
    c0
    cc0
    clj0
    cmake0
    coffee0
    cpp0
    cs0
    csproj0
    css0
    d0
    dd0
    ddoc1
    dot0
    erl0
    filters1
    fs0
    fsi0
    fsproj0
    fsx0
    go0
    h0
    hpp0
    hrl0
    htm1
    html1
    ini0
    java0
    js0
    json1
    kt0
    less0
    lua0
    m0
    mak0
    md1
    markdown1
    php0
    xhtml1
    rtf1
    txt1
    ps10
    py0
    rb0
    rc0
    rs0
    rst1
    sass0
    scala0
    scss0
    sdl1
    sh0
    sln0
    sql0
    toml0
    ts0
    vcproj0
    vcxproj0
    visualdproj0
    vue1
    wxml1
    wxss1
    xaml0
    xml0
    yml1
    更多相关内容
  • 常见文件格式有哪些

    千次阅读 2021-01-09 08:54:49
    A AAC:MPGE-4高级音频编码 ACC:苹果设备的专属音乐格式 ...APK:AndroidPackage /Android(安卓)安装包,APK是类似Symbian Sis或Sisx的文件格式。通过将APK文件直接传到Android模拟器或Android手机中执行即可安装 APS

    A
    AAC:MPGE-4高级音频编码
    ACC:苹果设备的专属音乐格式
    ACE:Ace压缩档案格式
    ACT:Microsoft office助手文件
    AIF,AIFF:音频互交换文件,Silicon Graphic and Macintosh应用程序的声音格式
    ANI:Windows系统中的动画光标
    APK:AndroidPackage /Android(安卓)安装包,APK是类似Symbian Sis或Sisx的文件格式。通过将APK文件直接传到Android模拟器或Android手机中执行即可安装
    APS:开发环境使用的资源文件,若要修改资源需要修改3个文件,.aps文件.rc文件 Resource.h
    ARC:LH ARC的压缩档案文件
    ARJ:Robert Jung ARJ压缩包文件
    ASD:Microsoft Word的自动保存文件;Microsoft高级流媒体格式(microsoft advanced streaming
    format,ASF)的描述文件;可用NSREX打开 Velvet Studio例子文件
    ASF:Microsoft高级流媒体格式文件
    ASM:汇编语言源文件,Pro/E装配文件
    ASP:动态网页文件;ProComm Plus安装与连接脚本文件;Astound介绍文件
    AST:Astound多媒体文件;ClarisWorks“助手”文件
    avi:Windows视频文件
    Axx:ARJ压缩文件的分包序号文件,用于将一个大文件压至几个小的压缩包中(xx取01-99的数字)
    A3L:Authorware 3.x库文件
    A4L:Authorware 4.x库文件
    A5L:Authorware 5.x库文件
    A3M,A4M:Authorware Macintosh未打包文件
    A3W,A4W,A5W:未打包的Authorware Windows文件

    B
    BAK:备份文件
    BAS:Visual Basic Module VB6模块文件
    BAT:批处理文件
    BDICT:百度输入法词库文件
    BIN:二进制文件,其用途依系统或应用而定
    BINHex:苹果的一种编码格式
    BMP:Windows或OS/2位图文件
    BOOK:Adobe FrameMaker Book文件
    BOX:Lotus Notes的邮箱文件
    BPL:Borlard Delph 4打包库
    BPS:百度输入法皮肤文件
    BSP:Quake图形文件
    BUN:CakeWalk 声音捆绑文件(一种MIDI程序)

    C
    C:C代码文件
    C0l:台风波形文件
    CAB:Microsoft压缩档案文件
    CAD:Softdek的Drafix CAD文件
    CAM:Casio照相机格式
    CAP:压缩音乐文件格式
    CAS:逗号分开的ASCⅡ文件
    CCB:Visual Basic动态按钮配置文件
    CCH:Corel图表文件
    CCO:CyberChat数据文件
    CCT:Macromedia Director Shockwave投影
    CDA:CD音频轨道
    CDF:Microsoft频道定义格式文件
    CDI:Philip的高密盘交互格式
    CDM:Visual dBASE自定义数据模块文件
    CDR:CorelDRAW绘图文件;原始音频CD数据文件
    CDT:CorelDRAW模板
    CDX:CorelDRAW压缩绘图文件;Microsoft Visual FoxPro索引文件
    CFG:配置文件
    CGI:公共网关接口脚本文件
    CGM:计算机图形元文件
    CH:OS/2配置文件
    CHI:.CHM文件的一个索引,用来支持对应的.CHM文件中的搜索功能,要和同名的.CHM文件放到一起用
    CHK:由Windows磁盘碎片整理器或磁盘扫描保存的文件碎片
    CHM:HTML格式的帮助文档
    CHP:Ventura Publisher章节文件
    CHR:字符集(字体文件)
    CHT:ChartViem文件;Harvard Graphics矢量文件
    CIF:Adaptec CD 创建器 CD映像文件
    CIL:Clip Gallery下载包
    CIM:SimCity 2000文件
    CIN:OS/2改变控制文件用于跟踪INI文件中的变化
    CLASS:Java类文件
    CLP:Windows 剪贴板文件
    CLL:Crick Software Clicker文件
    CLS:Visual Basic类文件
    CMD:Windows NT,OS/2的命令文件;DOS CD/M命令文件;dBASEⅡ程序文件
    COM:操作系统中的二进制可执行文件,可执行文件分两种一种是后辍名为.COM另一种就是.EXE 了,.COM一般用于DOS。
    CPI:Microsoft MS-DOS代码页信息文件
    CPL:控制面板扩展名,Corel颜色板
    CPP:C++代码文件
    CPR:Corel提供说明书文件
    CPT:Corel 照片-绘画图像
    CSS:层叠样式表文档,配合HTML使用,单独专门定义样式表
    CST:Macromedia Director Cast文件
    CSV:Comma Separated Value逗号分隔值,通常都是纯文本文件
    CTL:Visual Basic User Control VB6.0用户自定义控件
    CTX:Visual Basic User Control Binary FileVB6.0用户自定义控件二进制缓存文件
    CUR:Windows光标文件

    D
    DAT:数据流格式,DAT文件也是MPG格式的,是VCD刻录软件将符合VCD标准的MPEG-1文件自动转换生成的。也有数据文件的后缀名为.DAT,文件格式不确定,任何文件的后缀名都可以设为.DAT,因为读取数据不是从后缀名判断的,而是从文件格式判断
    DB:数据库文件,Thumbs.db是缩略图缓存
    DBF:dBASE文件,一种由Ashton-Tate创建的格式,可以被ACT!、Lipper、FoxPro、Arago、Wordtech、Xbase和类似数据库或与数据库有关产品识别;可用数据文件(能被Excel
    97打开);Oracle 8.1.x表格空间文件
    DBX:DataBearn图像;Microsoft Visual FoxPro表格文件
    DCF:数码照相机统一记录格式,DCF 也有音频格式
    DCT:Microsoft Visual FoxPro数据库容器
    DCU:Delphi编译单元文件
    DCX:Microsoft Visual FoxPro数据库容器;基于PCX的传真图像;宏
    DIR:MacromediaDirector文件
    DLF:一种INI配置文件格式的语言文件
    DLL:动态链接库
    DOC: Microsoft Word 2003文档文件
    DOCX:Microsoft Word 2007文档文件
    Perfect文档、Microsoft:Word文档;DisplayWrite文档
    DOT:Microsoft Word文档模板
    DPL:Borland Delph 3压缩库
    DRV:驱动程序
    DRW:Micrografx Designer/Draw;Pro/E绘画文件
    DSF:Micrografx Designer VFX文件
    DSG:DOOM保存的文件
    DSM:Dynamic Studio音乐模块(MOD)文件
    DSP:Microsoft Developer Studio工程文件
    DSQ:Corel QUERY(查询)文件
    DST:刺绣机图形文件
    DSW:Microsoft Developer Studio工作区文件
    DTA:World Bank(世界银行)的STARS数据文件
    DTD:SGML文档类型定义(DTD)文件
    DTED:地面高度数字数据(图形的数据格式)文件
    DTF:Symantec Q&A相关的数据库数据文件
    DTM:DigiTrakker模块文件
    DUN:Microsoft拔号网络导出文件
    DV:数字视频文件(MIME)
    DWG:AutoCAD工程图文件;AutoCAD或Generic CADD老版本的绘图格式
    DXR:Macromedia Director受保护(不可编辑)电影文件

    E
    E:易语言代码源文件
    EC:易语言模块文件
    EDA:Ensoniq ASR磁盘映像
    EDD:元素定义文档(FrameMaker+SGML文档)
    EDE:Ensoniq EPS磁盘映像
    EDK:Ensoniq KT磁盘映像
    EDQ:Ensoniq SQ1/SQ2/Ks32磁盘映像
    EDS:Ensoniq SQ80磁盘映像
    EDV:Ensoniq VFX-SD磁盘映像
    EFA:Ensoniq ASR文件
    EFE:Ensoniq EPS文件
    EFK:Ensoniq KT文件
    EFQ:Ensoniq SQ1/SQ2/Ks32文件
    EFS:Ensoniq SQ80文件
    EFV:Ensoniq VFX-SD文件
    EMD:ABT扩展模块
    EMF:Windows增强元文件
    EML:Microsoft Outlook Express邮件消息(MIME RTC822)文件
    EOT:是一种压缩字库,目的是解决在网页中嵌入特殊字体的难题,目前只有微软的IE浏览器支持
    EXE:可执行文件(程序)

    F
    FAV:Microsoft Outlook导航条
    FAX:传真类型图像
    FCD:虚拟CD-ROM
    FDF:Adobe Acrobat表单文档文件
    FLA:Macromedia Flash动画源文件
    FLAC:无损音频压缩编码
    FLV:Flash视频文件
    FNE:易语言的其中一种支持库文件,用于在易语言中装载和提供对应的命令和方法,易语言支持库还有FNR格式、NPK格式以及LPK文件包等。
    FND:Microsoft Explorer保存的搜索文件(Find applet)
    FNR:FNR文件是易语言的其中一种支持库文件,用于在易语言中装载和提供对应的命令和方法,但是与FNE格式支持库不同的是,FNR不带编辑信息,有运行支持代码的支持库。
    FON:系统字体
    FRM:Visual Basic Form File VB6.0窗体文件
    FRT:Microsoft FoxPro报表文件
    FRX:Visual Basic表单文本;Microsoft FoxPro报表文件
    FXP:经Microsoft FoxPro编译的源文件

    G
    GDM:铃声、口哨声和声音板模块格式
    GetRight:GetRight未完成的下载文件
    GHO:Norton 克隆磁盘映像
    GID:Windows 95全局索引文件(包括帮助状态)
    GiF:动态图片文件
    GL:动画格式
    GRP:程序管理组

    H
    H:C/C++ Header 头文件
    HEX:Macintosh BinHex2.0文件
    HLP:帮助文件;Date CAD Windows帮助文件
    HPP:C++程序头文件
    HQX:Macintosh BinHex 4.0文件
    HT:HyperTerminal(超级终端)
    HTM,HTML:超文本文档
    HTT:Microsoft超文本模板
    HTX:扩展HTML模板

    I
    ICO:Windows图标
    IDX:Microsoft FoxPro相关数据库索引文件;Symantec Q&A相关数据库索引文件;Microsoft Outlook
    Express文件
    IMG:GEM映像
    INC:Include File 引用文件,ASP中也会用到
    INF:Windows操作系统下用来描述设备或文件等数据信息的文件
    INI:配置文件,ini文件格式适合程序记录一些基本的配置设置
    INP:Oracle 3.0版或早期版本的表单源代码
    INRS:INRS远程通信声频
    INS:InstallShield安装脚本;X-Internet签字文件;Ensoniq EPS字簇设备;Cell/ⅡMAC/PC抽样设备
    INT:中间代码,当一个源程序经过语法检查后编译产生一个可执行代码
    IOF:Findit文档
    IQY:Microsoft Internet查询文件
    ISO:根据ISD 9660有关CD-ROM文件系统标准列出CD-ROM上的文件
    ISP:X-Internet签字文件
    ISS:Inno Setup 项目脚本文件 (Inno Setup 是一种安装包生成工具)
    IST:数字跟踪设备文件
    ISU:InstallShield卸装脚本
    IT:脉冲跟踪系统音乐模块(MOD)文件
    ITI:脉冲跟踪系统设备
    ITS:脉冲跟踪系统抽样,Internet文档位置
    IV:Open Inventor中使用的文件格式
    IVD:超过20/20微观数据维数或变量等级文件
    IVP:超过20/20的用户子集配置文件
    IVT:超过20/20表或集合数据文件
    IVX:超过20/20微数据目录文件
    IW:Idlewild屏幕保护程序
    IWC:Install Watch文档

    J
    J62:Ricoh照相机格式
    JAR:Java档案文件(一种用于applet和相关文件的压缩文件)
    JAVA:Java源文件
    JAVA:Java源文件
    JFF,JFIF,JIF:JPEG文件
    JPE,JPEG,JPG:JPEG图形文件
    JS:javascript源文件
    JSP:HTML网页,其中包含有对一个Java servlet的参考

    K
    KAR:卡拉OK MIDI文件(文本+MIDI)
    KEY:授权文件

    L
    LAB:Visual dBASE标签文件
    LBT,LBX:Microsoft FoxPro标签文件
    LDB:Microsoft Access加锁文件
    LHA:LZH更换文件后缀
    LIB:Windows系统中的库文件,分为两种,静态库与动态库
    LIC:License 用户许可证书文件
    LNK:快捷方式文件
    LOG:日志文件
    LPK:LPK文件是易语言的其中一种支持库安装包,包含".FNE"、".FNR"、相关例程和文档的全部或部分文件。用于在易语言中装载和提供对应的命令和方法
    LST:列表文件 /MASM Listing
    LUA:LUA脚本语言文件
    LZH:LH ARC压缩档案

    M
    M1V:MPEG相关文件(MIME"mpeg"类型)
    M3D:Corel Motion 3D动画文件
    M3U:MPEG URL(MIME声音文件)
    MAM:Microsoft Access宏
    MAQ:Microsoft Access查询文件
    MAR:Microsoft Access报表文件
    MBX:Microsoft Outlook保存email格式;Eudora邮箱
    MCW:Microsoft Word的Macintosh文档
    MDB:Microsoft Access数据库
    MDN:Microsoft Access空数据库模板
    MDW:Microsoft Access工作组文件
    MID:MIDI音乐
    MKV:视频文件
    MMM:Microsoft多媒体电影
    MOV:QuickTime for Windows视频文件
    MP2:第二层MPEG音频文件
    MP3:第三层MPEG音频文件
    MP4:视频或音频文件
    MPA:MPEG相关文件,MIME“mpeg类型”
    MPE,MPEG,MPG:MPEG动画文件
    MPP:Microsoft工程文件;CAD绘图文件格式
    MPR:Microsoft FoxPro菜单(已编译)
    MSI:Windows 安装器包
    MSN:Microsoft 网络文档;Descent Mission文件

    N
    NPK:NPK属于易语言COM包装支持库,该支持库是引用COM包装库生成的,例如WebBrowser、Windows媒体播放器。该扩展名格式支持库可用记事本打开。

    O
    OBD:Microsoft Office活页夹
    OBJ:对象文件
    OBZ:Microsoft Office活页夹向导
    OCX:Microsoft对象链接与嵌入定制控件
    ODS:Microsoft Outlook Express邮箱文件
    OFT:Microsoft Outlook模板
    OPX:OPL扩展DLL(动态链接库)
    OSS:Microsoft Office查找文件
    OST:Microsoft Exchange / Outlook 离线文件

    P
    PAL:压缩文件
    PART:Go!Zilla部分下载文件
    PAS:Pascal源代码
    PCS:PICS动画文件
    PDF:Adobe Acrobat
    可导出文档格式文件(可用Web浏览器显示);Microsoft系统管理服务器包定义文件;NetWare打印机定义文件
    PEM:OpenSSL 使用 PEM 文件格式存储证书和密钥。PEM 实质上是 Base64 编码的二进制内容,再加上开始和结束行BEGIN CERTIFICATE、ENDCERTIFICATE,在这些标记外面可以有额外的信息,如编码内容的文字表示。文件是 ASCII 的,可以用任何文本编辑程序打开
    PHP,PHP3:包含有PHP脚本的HTML网页
    PHTML:包含有PHP脚本的HTML网页;由Perl分析解释的HTML
    PM5:Pagemaker 5.0文件
    PM6:Pagemaker 6.0文件
    PNG:可移植图像文件
    PPS:Microsoft Powerpoint幻灯片放映
    PPT:Microsoft Powerpoint演示文稿
    PRF:Windows系统文件,Macromedia导演设置文件
    PSD:Adobe photoshop位图文件
    PSM:Protracker Studio模型格式;Epic游戏的源数据文件
    PST:Microsoft Outlook个人文件夹文件
    PWL:Windows 95口令列表文件

    Q
    QIF:QuickTime相关图像(MIME);Quicken导入文件
    QPYD:QQ拼音输入法词库文件
    QPYS:QQ拼音输入法皮肤文件
    QT,QTM:QuickTime电影
    QTI,QTIF:QuickTime相关图像
    QTP:QuickTime优先文件
    QTS:Mac PICT图像文件;QuickTime相关图像
    QTX:QuickTime相关图像

    R
    RA:RealAudio声音文件
    RAM:RealAudio元文件
    RAR:Windows RAR压缩文件
    RC:Resource Script开发环境使用的资源文件,若要修改资源需要修改3个文件,.aps文件.rc文件 Resource.h
    REC:录音机宏;RapidComm声音文件
    REG:注册表文件
    REP:Visual dBASE报表文件
    RES:Microsoft Visual Studio资源文件
    RM:RealAudio视频文件
    RMF:Rich Map格式(3D游戏编辑器使用它来保存图)
    ROM:基于盒式磁带的家庭游戏仿真器文件(来自Atari 2600、Colecovision、Sega、Nintendo等盒式磁带里的ROM完全拷贝,在两个仿真器之间不可互修改)
    RTF:Rich Text Format 富文本格式(也有称为多文本格式)
    Rxx:多卷档案上的RAR压缩文件(xx=1~99间的一个数字)

    S
    SAV:游戏保存文件
    SB:原始带符号字节(8位)数据
    SBK:Creative Labs的Soundfont 1.0 Bank文件;(Soundb laster)/EMU SonndFont v1.x Bank文件
    SBL:Shockwave Flash对象文件
    SCC:Microsoft SourceSafe Status 在VB6.0中是管理记录文件
    SCF:Windows Explorer命令文件
    SCH:Microsoft Schedule+1
    SCP:拨号网络脚本文件
    SCR:Windows屏幕保护;传真图像;脚本文件
    SFX:RAR自解压档案
    SHTML:含有服务器端包括(SSI)的HTML文件
    SKN:皮肤文件,QQ拼音输入法的皮肤源文件也是.skn
    SLN:Microsoft Visual Studio Solution VS开发环境的解决方案文件
    SPL:Shockwave Flash对象;DigiTrakker抽样
    SQL:Informix SQL查询;通常被数据库产品用于SQL查询(脚本、文本、二进制)的文件扩展名
    STF:Microsoft 安装文件
    STM:.shtml的短后缀形式,含有一个服务端包括(SSI)的HTML文件;Scream Tracker V2音乐模块(MOD)文件
    STR:屏幕保护文件
    SVG:一种用XML定义的语言,用来描述二维矢量及矢量/栅格图形
    SWA:在Macromedia导演文件(MP3文件)中的Shockwave声音文件
    SWF:Flash动画文件
    SYS:系统文件

    T
    T64:Commodore 64仿真器磁带映像文件
    TDF:Text Design File 是一个文字格式,或者是一个字幕文件格式
    THEME:Windows 95桌面主题文件
    TIF,TIFF:标签图像文件格式(TIFF)位图
    TLB:类似于.ocx,是一种ActiveX文件
    TMP:Windows临时文件
    TORRENT:BT种子文件
    TRM:终端文件
    TTF:TrueTypeFont是Apple公司和Microsoft公司共同推出的字体文件格式
    TXT:Windows文本文档
    TZ:老的压缩格式文件

    V
    VBA:VBase文件
    VBP:Microsoft Visual Basic工程文件
    VBW:Microsoft Visual Basic工作区文件
    VBX:Microsoft Visual Basic用户定制控件
    VCXPROJ:VC++ Project / C++ 工程文件
    VCXPROJ.FILTERS:VC++ Project Filters File / C++项目文件虚拟目录
    VCXPROJ.USER:Visual Studio Project User Options file / 项目用户配置
    VOB:DVD视频文件
    VQE,VQL:Yamaha Sound-VQ定位器文件
    VQF:Yamaha Sound-VQ文件(可能出现标准)
    VRF:Oracle 7配置文件
    VSL:下载列表文件(GetRight)

    W
    WAB:Microsoft Outlook文件
    WAD:包含有视频、玩家水平和其他信息的DOOM游戏的大文件
    WAL:Quake 2正文文件
    WAV:Windows波形声形
    WBK:Microsoft Word备份文件
    WFM:Visual dBASE Windows表单
    WFN:在CorelDRAW中使用的符号
    WIZ:Microsoft Word向导
    WOFF:Web Open Font Format Web开放字体格式,是一种网页所采用的字体格式标准
    WRL:虚拟现实模型
    WWL:Microsoft Word内插器文件

    X
    XLK:Microsoft Excel备份
    XLL:Microsoft Excel内插器文件
    XLM:Microsoft Excel宏
    XLS:Microsoft Excel 2003电子表格
    XLSB:Microsoft Excel 二进制电子表格
    XLSX:Microsoft Excel 2007电子表格
    XLT:Microsoft Excel模板
    XLV:Microsoft Excel VBA模块
    XLW:Microsoft Excel工作簿/工作区
    XML:可扩展标记语言

    Z
    ZAP:Windows软件安装配置文件
    zip:Windows RAR 压缩文件
    000-999:用于为老版本(或备份)文件编号(比如:被安装程序改变的CONFIG.SYS文件);又可用于为小范围的PC应用程序的多个用户相关数据文件编号
    12M:Lotus 1-2-3 97 SmartMaster文件
    123:Lotus 1-2-3 97文件
    2D:VersaCAD的2维绘画文件
    2GR,3GR:在Windows之下的VGA图形驱动程序/配置文件
    386:在386或更高级处理器上使用的文件
    3D:VersaCAD的3维绘画文件
    3DM:3D NURBS建模器,Rhino
    3DS:3D Studio(DOS下)格式文件
    4GE:Informix 4GL编译后代码
    4GL:Informix 4GL源代码

    展开全文
  • DocRipper 使用1命令从通用文档格式中获取文本。 DocRipper是一种非常轻巧的Ruby包装器,可用于解析常见文件格式(当前为.doc,.docx和.pdf,.sketch)中的文本内容,而无需像OCR库或OpenOffice / LibreOffice这样的...
  • 文本文件编码格式

    千次阅读 2022-02-08 10:34:01
    文本文件存储的内容是基于 字符编码 的文件,常见的编码 ASCII 编码,UNICODE 编码等 Python 2.x 默认使用 ASCII 编码格式,故Python不支持中文 Python 3.x 默认使用 UTF-8 编码格式 ASCII 编码 计算机中...

    文本文件存储的内容是基于 字符编码 的文件,常见的编码有 ASCII 编码,UNICODE 编码等

    Python 2.x 默认使用 ASCII 编码格式,故Python不支持中文
    Python 3.x 默认使用 UTF-8 编码格式

     

    ASCII 编码

    • 计算机中只有 256ASCII 字符
    • 一个 ASCII 在内存中占用 1 个字节 的空间
    • 80/1 的排列组合方式一共有 256 种,也就是 2 ** 8

    UTF-8 编码格式

    • 计算机中使用 1~6 个字节 来表示一个 UTF-8 字符,涵盖了 地球上几乎所有地区的文字
    • 大多数汉字会使用 3 个字节 表示
    • UTF-8UNICODE 编码的一种编码格式

     


     

    展开全文
  • 文章目录AndroidManifest.xmlAndroidManifest.xml 文件格式AXML 文件格式AXML 文件的修改 AndroidManifest.xml 其中存放了 APK 的大量配置信息:软件名称、图标、主题、包名、组件配置等 合理、安全地配置组件是...
  • 网上很多 shell script 读文本文件的例子,但是都没有讲出故事的全部,只说了一半。举个例子,比如从一个 testfile 文件中读取如下格式的文本行: 代码如下: $ vi testfile ls -a -l /bin | sort ls -a -l /...
  • 1) 文本:vnd.ms-excel.numberformat:@ 2) 日期:vnd.ms-excel.numberformat:yyyy/mm/dd 3) 数字:vnd.ms-excel.numberformat:#,##0.00 4) 货币:vnd.ms-excel.numberformat:¥#,##0.00 5) 百分比:vnd.ms-...
  • 基础篇如何正确的拆分常见的文本格式, 什么样的字符能做拆分符号,理论上所有的字符都可以作为拆分符号用来拼接多列数据, ...博客中说的本软件是指大数据 - 文本文件数据提取工具 随机生成的范例...

    基础篇如何正确的拆分常见的文本格式,

    什么样的字符能做拆分符号,理论上所有的字符都可以作为拆分符号用来拼接多列数据,

    在拆分列数据的时候,数据里面不能再有这个拆分符号一样的字符串,否则数据就无法分开了,下面是日常工作中

    我们常用的列拆分符号(可以是连续的多个同样字符作为1个拆分符号,相当于一个不常用的字符来做拆分符号)

    博客中说的本软件是指大数据 - 文本文件数据提取工具

    随机生成的范例数据说明如下:
    其中的文本它只有1列数据共16万行
    但可以按照英文冒号把1列数据拆分成2列数据
    每行数据的分割符号为英文输入法下的冒号
    (我自己拼接每行数据时用的是英文冒号,
    当然你自己如果能生成类似的数据用中文输入法
    下的中文冒号也是可以的,但不要中英文冒号混用,
    软件是能实现解析中英文冒号的,如果实现了这样的
    功能,处理大数据会严重影响数据的处理速度,
    故我放弃了中英文冒号混用的情形,你的文本分割符,
    要么用统一的中文冒号,要么用英文冒号,混用的话,
    本软件是不支持的)

    同样要注意的 还有中文逗号和英文逗号
    ------就是你的原始文件里所有行的列分割符号不能混用
    软件不能处理这样的数据,但你硬是出现了这样的情况,
    请联系我,我会单独写一个小工具帮你处理这样的混乱情况!

    如何从本文件里提取任何一列或者多列数据,会在其它篇幅里讲到
    (提取数据常用的的条件 有大于  大于等于  小于   小于等于  不等于 等于  前缀包含  后缀包含  中间靠前的部分包含或者中间靠后的部分包含简写成包含) 本篇只介绍常见的文本分隔符号。

     

    随机生成的范例数据说明如下:
    其中的文本它只有1列数据共16万行
    但可以按照英文双冒号把1列数据拆分成2列数据
    每行数据的分割符号为英文输入法下的冒号
    (我自己拼接每行数据时用的是英文双冒号,
    当然你自己如果能生成类似的数据用中文输入法
    下的中文双冒号也是可以的,但不要中英文冒号混用,
    软件是能实现解析中英文冒号的,如果实现了这样的
    功能,处理大数据会严重影响数据的处理速度,
    故我放弃了中英文冒号混用的情形,你的文本分割符,
    要么用统一的中文双冒号,要么用英文双冒号,混用的话,
    本软件是不支持的)

    同样要注意的 还有中文逗号和英文逗号
    ------就是你的原始文件里所有行的列分割符号不能混用
    软件不能处理这样的数据,但你硬是出现了这样的情况,
    请联系我,我会单独写一个小工具帮你处理这样的混乱的情况!

    随机生成的范例数据说明如下:
    其中的文本它只有1列数据共16万行
    但可以按照英文双冒号把1列数据拆分成3列数据
    每行数据的分割符号为英文输入法下的冒号
    (我自己拼接每行数据时用的是英文双冒号,
    当然你自己如果能生成类似的数据用中文输入法
    下的中文双冒号也是可以的,但不要中英文冒号混用,
    软件是能实现解析中英文冒号的,如果实现了这样的
    功能,处理大数据会严重影响数据的处理速度,
    故我放弃了中英文冒号混用的情形,你的文本分割符,
    要么用统一的中文双冒号,要么用英文双冒号,混用的话,
    本软件是不支持的)

    同样要注意的 还有中文逗号和英文逗号
    ------就是你的原始文件里所有行的列分割符号不能混用
    软件不能处理这样的数据,但你硬是出现了这样的情况,
    请联系我,我会单独写一个小工具帮你处理这样的混乱的情况!

     

    随机生成的范例数据说明如下:
    其中的文本它只有1列数据共16万行
    但可以按照英文双冒号把1列数据拆分成11列数据
    每行数据的分割符号为英文输入法下的冒号
    (我自己拼接每行数据时用的是英文双冒号,
    当然你自己如果能生成类似的数据用中文输入法
    下的中文双冒号也是可以的,但不要中英文冒号混用,
    软件是能实现解析中英文冒号的,如果实现了这样的
    功能,处理大数据会严重影响数据的处理速度,
    故我放弃了中英文冒号混用的情形,你的文本分割符,
    要么用统一的中文双冒号,要么用英文双冒号,混用的话,
    本软件是不支持的)

    同样要注意的 还有中文逗号和英文逗号
    ------就是你的原始文件里所有行的列分割符号不能混用
    软件不能处理这样的数据,但你硬是出现了这样的情况,
    请联系我,我会单独写一个小工具帮你处理这样的混乱的情况!

    以下截图与上面类似,只是分割符号不一样而已

     

     

     

     

     

     

     

     

     

    展开全文
  • 常见图形文件格式介绍

    千次阅读 2021-11-30 17:30:51
    常见图形文件格式介绍 文件格式(file format)是指电脑为了存储信息而使用的对信息的特殊编码方式,是用于识别内部储存的资料。比如的储存图片,的储存程序,的储存文字信息。每一类信息,都可以一种或...
  • 文本格式是什么意思

    千次阅读 2021-07-27 08:05:06
    文本格式是一种由若干行字符构成的计算机文件,文本格式有txt、doc、docx、wps。文本文件存在于计算机文件系统中,文本文件可以包含纯文本。一般来说,计算机可以分为文本文件和二进制文件两类。文本,是指书面语言...
  • "扩展名 "说明 "打开该类型文件的常用软件 " ".txt "纯文本文件 "记事本 " ".doc "Word文档 "Microsoft Word " ".wps " WPS文档 "金山WPS软件(中国人自己开发的软件) " ".html "超文本标记语言文档 "记事本、...
  • 常见文本格式

    2018-03-04 16:20:00
    .txt 记事本文本文件 .doc Word文件 .ppt PPT文件 .gif 动态图片 .pdf PDE文件 .mp4 / .avi 视频 .exe 可执行文件 .py pyt...
  • 电子书多少种格式,各什么优缺点? 常见电子书格式优缺点分析 格式 优点 缺点 ...文本文件容易打开 不支持复杂排版,纯文字 chm,exe 原为电脑端设计 目前已淡出视线 Djvu 高清扫描文件,适
  • 1、需要将下面的fasta文件进行一个整理,将序列单行输出 方法一 f1 = open('test1.fa','r').readlines()#需要整理的文件 f2 = open('2.fasta','w')#整理之后的文件 for i in f1: if i.startswith('>'): ...
  • 满意答案lyqstart推荐于 2017.11.29采纳率:46%等级:6已帮助:709人Hypertext Markup Language,中文也就是超文本链接标示语言。HTML(HyperTextMark-upLanguage)即超文本标记语言,是WWW的描述语言。设计HTML语言的...
  • 共享文本文档和数据注释的极简方法。 允许表示大量不同的注释。 项目文件包含:-用于保存/读取/写入数据并执行样本处理的简单代码。 -BioC格式的语料库-与BioC语料库配合使用的BioC工具BioC目标-简单-互操作性-广泛...
  • 常用文本数据格式

    千次阅读 2019-09-25 05:19:12
    JavaScript Object Notation, JavaScript对象表示,它是一种轻量级的数据交换格式,用于存储和传输数据,也可以用于配置文件文本格式 JSON中属性的值可以表示六种不同类型的数据: 1.数值,比如12...
  • 时候我们也需要将这些文本文件内容转化为其他的格式,比如常见将 Txt 文本文档转化为 Word 格式、PDF格式等等。那今天就跟大家一起来看一下怎么将 Txt 文本文档转换为 docx 格式的 Word 文档。Txt 文本文档...
  • java验证文件真实格式和编码格式工具类,验证文件文件格式文件的编码格式给出正确的文件类型以及编码格式,从此解决文件解析乱码问题的烦恼
  • 常见三维模型文件格式

    千次阅读 2021-07-23 16:58:36
    可参考:科普:三维文件格式
  • 文本文档是以TXT后缀名的文件,在windows页面重点及鼠标右键-〉新建-〉在下拉子菜单中有文本文档一项。txt文件是微软在操作系统上附带的一种文本格式,是最常见的一种文件格式。 二.改扩展名无反应的解决办法 1.先说...
  • GB2312 是我们常见文本文件的编码格式,但是时候我们希望我们的文本编码格式统一为 UTF8,那么没有一种简单的方法,能够批量的将 GB2312的记事本文本文件的编码格式统一的修改为 UTF8 的文件编码格式呢?...
  • Python基础 文本控制 文件编码格式 使用python读写文件 常用的文件打开方式,文件对象的常用方法,文件读写的原理,读取磁盘文件中的内容
  • 常见数据集格式

    2022-04-29 14:15:17
    VOC、COCO、ImageNet....
  • 文本文件的编码方式及内容类型是应用层测试中文本测试关注的重点,常见的文本编码方式为UTF -8、GBK2312、GBK、BIG5、GB18030等等,常见的文本内容类型为TXT、HTML、XML、Torrent、WML、XHTML等。 下面详细介绍下...
  • 文本文档代码写好了怎么运行

    千次阅读 2021-05-21 14:30:32
    学习网页设计。...html文件可以直接在txt...在文本编辑器中输入html代码后如何在浏览器中执行h在电脑桌面创建一个空白文本文件:单击文本编辑器的保存按钮,保存编辑好的html代码:回到桌面,找到编辑好的html代码文...
  • 前端常见配置文件格式及选择

    千次阅读 2020-03-10 16:22:52
    背景 自己撸一个脚手架的时候,需要为脚手架提供一个...前端最常见的配置文件格式有.json、.config.js、.xxxrc .yml等,其它的像java中使用比较多的.xml本文不做讨论。 常见配置文件格式 .json格式 JSON(JavaScri...
  • 一、文本文件 (1) 文本文件概述 文本文件也称为ASCII文件,存储的是常规字符串,字符串中每个字符对应一个字节。例如,数5678的存储形式为ASCII码:00110101 00110110 00110111 00111000。 (2)文本文件...
  • 大数据常用文件格式介绍

    千次阅读 2019-01-13 16:36:24
    最近在做hdfs小文件合并的项目,涉及了一些文件格式的读写,比如avro、orc、parquet等。期间阅读了一些资料,因此打算写篇文章做个记录。 这篇文章不会介绍如何对这些格式文件进行读写,只...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 274,854
精华内容 109,941
热门标签
关键字:

常见的文本文件格式有