精华内容
下载资源
问答
  • < DOCTYPE ... 最新版本word2007文件后缀名为.docxdocx文件是基于XML语言压缩文件格式,因为现在大家办公软件一般 为office2003...
    < DOCTYPE html PUBLIC -WCDTD XHTML TransitionalEN httpwwwworgTRxhtmlDTDxhtml-transitionaldtd>
           最新版本word2007文件后缀名为.docx,docx文件是基于XML语言的压缩文件格式,因为现在大家的办公软件一般 为office2003,所以碰到docx格式文件的时候就会打不开,打开的话也是乱码,那么如何才能在不安装Office2007的前提下打 开.docx后缀的文件呢?

            打开docx文件方法之一:微软官方网站上已经提供Office2003打开word2007版本.docx文件的补丁O2007Cnv.exe,大小为27.5M,链接地址为:http://download.microsoft.com/download/6/9/E/69EA942D-4636-4350-A526-0BFD9771A12A/O2007Cnv.exe,安装完并重启计算机后,便可以识别出docx、docm格式的Word2007文档,后缀名为pptx、pptm、potx、potm、ppsx、ppsm格式的PowerPoint2007文档,以及扩展名为xlsb、xlsx、xlsm、xltx、xltm格式的Excel2007文档。

            打开docx文件方法之二:Office基于XML的压缩文件格式取代了现在的办公软件默 认文件格式,在传统的文件名后缀名后面添加了字母x,就像.docx取代了doc文件、.xlsx取代了xls文件、.pptx取代了ppt格式 等,.docx事实上就是一个ZIP压缩文件,所以她占用的存储空间将会更小。如果你只想查看一个docx文件的内容,又不想安装office2007转 换补丁,可以先将.docx文件的扩展名改为.zip,然后用压缩软件解压此文件,将会产生名为“word&”的文件夹,里面会有一个 document.xml文件,用浏览器打开此文件,你便可以轻松查看这个用word2003无法正常打开的.docx文件了。



    本文转自 netcorner 博客园博客,原文链接: http://www.cnblogs.com/netcorner/archive/2010/03/11/2912028.html  ,如需转载请自行联系原作者
    展开全文
  • 微软在其Word2007中新增了一种文档格式docx,以下一段对docx的描述:docx Office2007使用用新基于XML压缩文件格式取代了其目前专有默认文件格式,在传统文件名扩展名后面添加了字母x(即.docx取代....

    微软在其Word2007中新增了一种文档格式docx,以下是一段对docx的描述:docx 是Office2007使用的,是用新的基于XML的压缩文件格式取代了其目前专有的默认文件格式,在传统的文件名扩展名后面添加了字母x(即.docx取代.doc、.xlsx取代.xls,等等).docx文件比.doc文件所占用空间更小。我现在要说的不是docx与doc之间的区别,而是很多情况下我们需要打开docx格式的文档但我们所使用的机器上并未安装Office 2007,而Office 2003又不能打开这种格式的文件,这个时候我们就需要一种快速打开这种文件的方法,有两种方法:第一种是最快速的,不用借助专门的软件,但有一个缺点就是不能保留原文档的格式,不过多数情况下我们只是需要浏览文档内容,对于格式不是很重要,具体做法是:将该docx文档的扩展名改为.zip,然后将其内容解压出来,找到document.xml这个文件用浏览器或文字编辑软件(比如记事本)打开就可以看到内容了。但这时看到的东西是一个XML文件的源代码,比较乱,你需要从里面提取需要的内容。第二种方法需要下载一个补丁文件FileFormatConverters,它可以将docx转换为doc格式的。这个补丁的下载地址为:FileFormatConverters.exe(27.6M)

    取消

    评论

    展开全文
  • 这两者都是微软的Word软件默认存储文件...以下是详细介绍: 1、docx是Word2007以上版本的文件格式,由于格式有差别,docx格式的Word文件低于2007版就打不开了。如果考虑2003前的版本,就保存成doc格式,这样的兼容...

      这两者都是微软的Word软件默认存储文件类型,docx是Word2007以上版本的文件格式,由于格式有差别,可能在一些老机器上无法使用。此外,doc和docx在文件体积、响应速度和兼容性上都有一些不同。以下是详细介绍:

    612d563c4e56735deab868e40532d843.png

      1、docx是Word2007以上版本的文件格式,由于格式有差别,docx格式的Word文件低于2007版就打不开了。如果考虑2003前的版本,就保存成doc格式,这样的兼容性比较好,即便是使用比较老的机器都能够正常打开,如果要在Office2003中打开docx文件,就必须得安装一个官方【office docx】补丁,以便让office2003支持docx格式文件;

      2、docx格式与doc格式都是Word文本格式,的区别显著的一点就是体积大小的不同。docx格式其实就是一个zip文件,我们可以拿winrar打开docx文件,得到一堆的文件。在docx文件里面可以找到各种配置文件,文本文件和媒体文件。其原理就是相当于用两个文本文档,一个用来放文本信息,另一个用来配置个里面的格式,比如字体,大小等。这样用两个文本文件就能实现doc格式类似的功能,所以很节省体积;

      3、docx与doc的另一个区别是响应速度。比如在docx文件里,很多特效之类的东西只要修改配置文件就可以了,而不用像doc那样反复修改大一一个大文件。现在docx已经开始逐步替代doc格式了;

      4、两者虽说是能够在现在的Office上通用使用,但docx在一些格式和效果上与doc会有一定的兼容问题,不能保证docx转存为doc之后所有内容被正确的识别和显示。此外doc格式是微软专用格式,并没有对外完全授权,其他office软件,比如常见的WPS、Open Office等虽然能打开doc格式,但是在极少地方会有兼容性导致的错误。

    展开全文
  • 现在人们经常要去下载或者接收一些文件。比如说同事传来的文档,自己建立的文件,想看的电影等等,那大家都会怎么处理这些文件呢?科研工作者、学生们可能...·图片类型文件:有png格式的,有jpg格式的,有gif格式...

    现在人们经常要去下载或者接收一些文件。

    比如说同事传来的文档,自己建立的文件,想看的电影等等,那大家都会怎么处理这些文件呢?

    科研工作者、学生们可能需要阅读大量的文献,我们也需要阅读很多的电子书等等,这些文件你又是如何处理的呢?

    是一一归类好,还是堆在一个文件夹里就算了?

    以前我会按照文件的类型进行分类,并定期处理,但这个过程会耗费我大量的时间。·图片类型文件:有png格式的,有jpg格式的,有gif格式的。

    ·文档文件:有pdf格式的,有知网上面caj格式的,还有有word文档,分别是doc格式的和docx格式。

    后来我在学python的过程中,就想到了这个小需求,能不能用python批量操作呢?这样会减少我们的整理时间,能够让工作和学习效率更高。

    经历了一番和python的斗争之后,我终于写出来了这样的一个小代码。

    既然要归类,首先要建立对应的文件夹,这里面选择使用python原生的os库进行操作,要进行一系列的系统操作,选择使用shutil库。import os

    import shutil

    我打算将我A文件夹下面的各个文件夹里面文件区分开,那首先要让程序确定你的东西是在哪里。

    要先写一个path,我是给这些文件夹放在了F盘a,那我设置的path就是它,如果是别的目录,就写对应的路径就好了。path = “F:/A”

    文档的路径图例子如下:

    此处划重点:我们在程序中输入的路径和电脑系统中直接复制出来的路径不同,如果直接用从电脑系统中复制出来的,会报错。

    有三种方法可以解决这个问题。01:上面介绍的方法,将\换成/即可;

    02:将\换成\\即可,因为\在python中是有特殊含义的,就是转义符号, 那这个实际上这个\\就是代表将转义符号转义成正常的\;

    03:在这一串字符串前面加r,变成r“F:\A”,这样的话,也可以正常使用。

    这三种方法,逗汁儿更喜欢第一种~喜欢哪种方法就用哪种吧,但是在各种系统中第一种写法都支持哦,强烈推荐第一种。

    接下来就要在建立两个文件夹,分别存储图片和文档文件:os.makedirs(path + ‘/tupian’)

    os.makedirs(path + ‘/wendang’)

    装文件的文件夹建好了,那我们就进行下一步,在移动文件之前需要确定要移动的文件有哪些,这个要根据什么判断呢?

    我们知道确定文件是什么类型的就是后缀名啦,那我们就让程序知道什么后缀的属于图片文件,什么后缀的属于文档文件就好了。img_list = [‘png’,’jpg’,’gif’]

    wendang_list = [‘doc’,’docx’,’caj’,’pdf’]

    ·建立好了两个列表之后,就要进行循环来移动文件。for p in wendang_list:

    ·首先要先要确定文档所在文件夹,建立路径wendang_path= path + '/' + p

    ·用os.listdir()来确定这个文件夹里面有什么东西(哪些是pdf,哪些是word文件)wendang_files= os.listdir(wendang_path)

    ·利用循环来进行文件移动for i in wendang_files: #真正的移动文件夹中的文件

    ·shuil.move的两个参数分别表示,原来文件所在地以及要移动的位置

    shutil.move(pdf_path + '/' + i, path + '/wendang')

    ·删除原文件夹

    os.removedirs(wendang_path)

    这一部分就讲文档类的文件都移动进来了,那下一步就是将图片类的文件移动进来。for i in img_list:

    img_path = path + ‘/’ + i

    img_files= os.listdir(img_path)

    for m in img:

    shutil.move(img_path+’/’ + m, path + ‘/tupian’)

    os.removedirs(img_path)

    执行完以上代码后文件夹如下图所示:

    (吐槽一下,这个xmind调了半天也没调出来在正中间,让我这个强迫症很难受)

    刚才在讲解的过程中代码相对比较乱,现在给一份完整版。

    import os

    import shutil

    #建立路径

    path = “F:/A”

    os.makedirs(path + ‘/tupian’)

    os.makedirs(path + ‘/wendang’)

    #建立后缀列表

    img_list = [‘png’,’jpg’,’gif’]

    wendang_list = [‘doc’,’docx’,’caj’,’pdf’]

    #移动文档文件

    for p in wendang_list:

    wendang_path = path + '/' + p

    wendang_files = os.listdir(wendang_path)

    for i in wendang_files:

    shutil.move(pdf_path + '/' + i, path +'/wendang')

    os.removedirs(wendang_path)

    #移动图片文件

    for i in img_list:

    img_path = path + ‘/’ + i

    img_files= os.listdir(img_path)

    for m in img:

    shutil.move(img_path+’/’ + m, path + ‘/tupian’)

    os.removedirs(img_path)

    更多精彩,请关注我们的公众号:DC 学习助手

    展开全文
  • 2019年为什么word文档打开乱码篇一:word文档变成乱码两种解决方法?word文档变成乱码两种解决方法?一、文档格式法?这种方法将损坏Word文档转换为另一种格式,然后再将其转换回Word文档格式。这最简单和...
  • 自己写一个docx格式的解析器

    千次阅读 2018-12-24 10:35:25
    首先,我们先做一个小小的实验,准备一个docx的文件,比如下面这个: 先用记事本打开,不出意外的话,应该是下面的结果: 但是,如果我们用另一种软件,比如7zip打开,会是什么情况呢?结果如下 很显然,.....
  • .docx文件什么打开

    2010-07-15 07:34:00
      如何打开.docx的文件呢?   实际上,只需要安装一个microsoft发布的补丁即可,名称为O2007Cnv.exe,链接为:...
  • docx Office2007使用的,用新的基于XML的压缩文件格式取代了其目前专有的默认文件格式,在传统的文件名扩展名后面添加了字母x(即.docx取代.doc、.xlsx取代.xls,等等)2003版本创建的文件扩展名doc,2007和...
  • 需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx。...docx是微软Word文件的扩展名,是微软Word2007之后版本使用的格式,其基于open XML的压缩...
  • PDF是什么格式PDF和Word.docx格式和PPT.ppt等都属于封装文件的一种格式,只不过PDF格式有自己独特特定,例如不易被修改,可以直接加密。并且在不同平台和不同应用中打开不会出现乱码和格...
  • 我的业务场景,对word格式的还原度要求很高,要完全一致无变化!一开始我想用poi把word转成htm,然后用jsoup解析一下,再用Itext转成pdf。但是当我看到生成的html效果,我就放弃了……格式只保留的基本的雏形,...
  • 需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx。...docx是微软Word文件的扩展名,是微软Word2007之后版本使用的格式,其基于open XML的压缩...
  • 我们可以把doc格式的word文件当成一个单独的xml文件,而docx当成一个zip压缩包。将一个docx文件的后缀名改成.zip,然后用压缩工具打开,显示的即为docx的目录结构。 2.为什么ftl能直接转成doc...
  • 需求:最近在研究word文档的抽取,发现python中docx库只能提取以docx结尾的文件,因此需要将doc文件转换为docx。...docx是微软Word文件的扩展名,是微软Word2007之后版本使用的格式,其基于open XML的压缩...
  • Aspose Java for Docx4j一个提供比较源代码示例的项目,该示例使用Aspose for Java API和Docx4j来执行相同的文件处理任务。 此外,该项目提供了Aspose提供的高级功能的源代码示例,而Docx4j中缺少这些功能。 ...
  • 于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通io流方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确编码格式读取了这个doc文件。在网上搜索过程中发现doc和...
  • java使用poi读取doc和docx文件

    万次阅读 多人点赞 2016-07-22 10:53:02
    这几天在学习java io流东西,有一个网友... 于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通io流方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确编码格式读取了这个doc文件
  • 于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通io流方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确编码格式读取了这个doc文件。在网上搜索过程中发现doc和...
  • DOCX,XLSX,PPTX等等后缀,连结中包含此类文件时,界面风格默认什么打不开的其实只要在IIS中的MIME的类型中添加对此格式的支持就可以了下面提供两种方法扩展功能,推荐使用第二种。   方法一:打开网站属性...
  • 怎么识别.docx 文件

    2011-05-20 15:06:27
    不根据后缀判断 谁知道 .docx 文件的文件格式是什么呀。。。。。。。。 <strong>问题补充</strong><br/><div class="quote_title">gtssgtss 写道</div><div class="quote_div">docx就是zip 嗯 ...
  • DOCX,XLSX,PPTX等等后缀,连结中包含此类文件时,界面风格默认什么打不开的其实只要在IIS中的MIME的类型中添加对此格式的支持就可以了下面提供两种方法扩展功能,推荐使用第二种。 方法一:打开网站属性,的...
  • 一、实现思路当接到任务时候,首先这个陌生领域,所以先度娘一下再搬砖。...但是当我看到生成html效果,我就放弃了……格式只保留基本雏形,什么分页符啊换行说丢就丢了,这很致命,因为我...

空空如也

空空如也

1 2 3 4 5 ... 7
收藏数 133
精华内容 53
关键字:

docx是什么格式的文件