精华内容
下载资源
问答
  • 1.Python写word文档要操作word文档首先需要安装python-docx库;pip install python-docx然后导入docx模块,或者从docx模块中导入Document类;from 然后使用Document()创建一个word文档,若指定路径则是打开文档;...

    1.Python写word文档

    • 要操作word文档首先需要安装python-docx库;
    pip install python-docx
    • 然后导入docx模块,或者从docx模块中导入Document类;
    from docx import Document
    • 然后使用Document()创建一个word文档,若指定路径则是打开文档;
    document = Document()
    • 接着就可以在文档中插入内容,比如插入标题可以使用add_heading()方法,其中参数level是标题等级,0表示一级标题,1表示二级标题,以此类推。
      插入段落可以使用add_paragraph()方法,参数style是样式,默认不应用样式。
      还有其他例如add_picture()方法用来插入图片,add_table()方法插入表格等。
      最后和操作Excel一样在文档中添加完内容之后需要使用save('文件名')方法保存文档;
      大家可以自己查看官网:https://python-docx.readthedocs.io/en/latest/
    from docx import Document
    
    document = Document()
    
    # 插入一级标题
    document.add_heading('古诗词', level=0)  #插入标题
    # 添加段落
    p = document.add_paragraph('''
            人生就是一场抵达,我们总以为来日方长,可来日并不方长,我们总是在向往明天,而忽略了一个个今天,我们总是在仰望天空,却忘记要走好脚下的路。
    ''',)
    # 插入二级标题
    document.add_heading('春夜喜雨', level=1, )
    
    # 插入段落
    document.add_paragraph('好雨知时节,当春乃发生。', style='ListNumber')
    document.add_paragraph('随风潜入夜,润物细无声。', style='ListNumber')
    document.add_paragraph('野径云俱黑,江船火独明。', style='ListNumber')
    document.add_paragraph('晓看红湿处,花重锦官城。', style='ListNumber')
    # 保存文档
    document.save('article.docx')

    2.Python读word文档

    • 要读取word文档需要在Document()中添加文档路径,用来打开文档;
    • 打开文档之后就可以根据需求读取文档,如paragraphs是读取文档段落,tables读取文档表格集等;
    • 在已有的文档中追加内容和写入文档一样,最后也要通过save()方法保存文档;
    from docx import Document
    
    document = Document('./article.docx')
    
    # 将word文档的内容一行一行的读取
    for paragraph in document.paragraphs:
        print(paragraph.text)
    document.add_paragraph('恭喜发财', style='ListNumber')
    
    #  保存文档
    document.save('new_artical.docx')

    参考:https://www.9xkd.com/user/plan-view.html?id=2265170280

    展开全文
  • 本文实例讲述了JS实现获取word文档内容并输出显示到html页面。分享给大家供大家参考,具体如下:Titlevar w = new ActiveXObject('Word.Application');var docText;var obj;if(w != null) {w.Visible = true;obj = w...

    本文实例讲述了JS实现获取word文档内容并输出显示到html页面。分享给大家供大家参考,具体如下:

    Title

    var w = new ActiveXObject('Word.Application');

    var docText;

    var obj;

    if(w != null) {

    w.Visible = true;

    obj = w.Documents.Open("D:\\word\\go.doc");

    docText = obj.Content;

    w.Selection.TypeText("Hello");

    w.Documents.Save();

    document.write(docText);//Print on webpage

    /*The Above Code Opens existing Document

    set w.Visible=false

    */

    /*Below code will create doc file and add data to it and will close*/

    w.Documents.Add();

    w.Selection.TypeText("Writing This Message ....");

    w.Documents.Save("D:\\word\\go.doc");

    w.Quit();

    /*Don't forget

    set w.Visible=false */

    }

    注意:这里使用了ActiveXObject组建,因此需要使用IE内核浏览器运行本代码。

    希望本文所述对大家JavaScript程序设计有所帮助。

    展开全文
  • JavaScript中使用FileReader读取word文件内容 转载于:https://blog.csdn.net/dj7858177/article/details/107106360 如有侵权,请联系我删除 <html> <head> <meta ...

    JavaScript中使用FileReader读取word文件内容
    转载于:https://blog.csdn.net/dj7858177/article/details/107106360 如有侵权,请联系我删除

    <html>
    <head>
    <meta http-equiv="content-type" content="text/JavaScript;charset=utf-8" />
    </head>
    <input type="file" id="files" name="file" />读取文件: 
    <span class="readButton">
      <button>显示</button>
    </span>
     <body>
    <script>
      function readBlob() {
     
        var files = document.getElementById('files').files;
        if (!files.length) {
          alert('Please select a file!');
          return;
        }
     
        var file = files[0];
        var start = 0;
        var stop = file.size - 1;
     
        var reader = new FileReader();
     
    
        reader.onloadend = function(evt) {
         if (evt.target.readyState == FileReader.DONE) { // DONE == 2
            var content = evt.target.result;
            alert(content);
          }
        };
        var blob = file.slice(start, stop + 1);
        reader.readAsText(blob,"utf-8");
      }
      
      document.querySelector('.readButton').addEventListener('click', function(evt) {
        if (evt.target.tagName.toLowerCase() == 'button') {
          readBlob();
        }
      }, false);
    </script>
    </script>
    
    </body>
    </html>
    
    
    展开全文
  • 简介今天试着用ptyhon做了一个抓取网页内容,并生成word文档的功能,功能很简单,做一下记录以备以后用到。生成word用到了第三方组件python-docx,所以先进行第三方组件的安装。由于windows下安装的python默认不带...

    简介

    今天试着用ptyhon做了一个抓取网页内容,并生成word文档的功能,功能很简单,做一下记录以备以后用到。

    生成word用到了第三方组件python-docx,所以先进行第三方组件的安装。由于windows下安装的python默认不带setuptools这个模块,所以要先安装setuptools这个模块。

    安装

    1、在python官网上找到 https://bootstrap.pypa.io/ez_setup.py  ,把代码保存到本地并执行:  python ez_setup.py

    2、下载python-docx  (https://pypi.python.org/pypi/python-docx/0.7.4),下载完成后解压并进入到  XXX\python-docx-0.7.4 安装python-docx : python setup.py install

    这样python-docx就安装成功了,可以用它来操作word文档了,word文档的生成参考的这里https://python-docx.readthedocs.org/en/latest/index.html

    html解析用到的是sgmllib里的SGMLParser  url内容的获取用到的是urllib、urllib2

    实现代码

    # -*- coding: cp936 -*-

    from sgmllib import SGMLParser

    import os

    import sys

    import urllib

    import urllib2

    from docx import Document

    from docx.shared import Inches

    import time

    ##获取要解析的url

    class GetUrl(SGMLParser):

    def __init__(self):

    SGMLParser.__init__(self)

    self.start=False

    self.urlArr=[]

    def start_div(self,attr):

    for name,value in attr:

    if value=="ChairmanCont Bureau":#页面js中的固定值

    self.start=True

    def end_div(self):

    self.start=False

    def start_a(self,attr):

    if self.start:

    for name,value in attr:

    self.urlArr.append(value)

    def getUrlArr(self):

    return self.urlArr

    ##解析上面获取的url,获取有用数据

    class getManInfo(SGMLParser):

    def __init__(self):

    SGMLParser.__init__(self)

    self.start=False

    self.p=False

    self.dl=False

    self.manInfo=[]

    self.subInfo=[]

    def start_div(self,attr):

    for name,value in attr:

    if value=="SpeakerInfo":#页面js中的固定值

    self.start=True

    def end_div(self):

    self.start=False

    def start_p(self,attr):

    if self.dl:

    self.p=True

    def end_p(self):

    self.p=False

    def start_img(self,attr):

    if self.dl:

    for name,value in attr:

    self.subInfo.append(value)

    def handle_data(self,data):

    if self.p:

    self.subInfo.append(data.decode('utf-8'))

    def start_dl(self,attr):

    if self.start:

    self.dl=True

    def end_dl(self):

    self.manInfo.append(self.subInfo)

    self.subInfo=[]

    self.dl=False

    def getManInfo(self):

    return self.manInfo

    urlSource="http://www.XXX"

    sourceData=urllib2.urlopen(urlSource).read()

    startTime=time.clock()

    ##get urls

    getUrl=GetUrl()

    getUrl.feed(sourceData)

    urlArr=getUrl.getUrlArr()

    getUrl.close()

    print "get url use:" + str((time.clock() - startTime))

    startTime=time.clock()

    ##get maninfos

    manInfos=getManInfo()

    for url in urlArr:#one url one person

    data=urllib2.urlopen(url).read()

    manInfos.feed(data)

    infos=manInfos.getManInfo()

    manInfos.close()

    print "get maninfos use:" + str((time.clock() - startTime))

    startTime=time.clock()

    #word

    saveFile=os.getcwd()+"\\xxx.docx"

    doc=Document()

    ##word title

    doc.add_heading("HEAD".decode('gbk'),0)

    p=doc.add_paragraph("HEADCONTENT:".decode('gbk'))

    ##write info

    for infoArr in infos:

    i=0

    for info in infoArr:

    if i==0:##img url

    arr1=info.split('.')

    suffix=arr1[len(arr1)-1]

    arr2=info.split('/')

    preffix=arr2[len(arr2)-2]

    imgFile=os.getcwd()+"\\imgs\\"+preffix+"."+suffix

    if not os.path.exists(os.getcwd()+"\\imgs"):

    os.mkdir(os.getcwd()+"\\imgs")

    imgData=urllib2.urlopen(info).read()

    try:

    f=open(imgFile,'wb')

    f.write(imgData)

    f.close()

    doc.add_picture(imgFile,width=Inches(1.25))

    os.remove(imgFile)

    except Exception as err:

    print (err)

    elif i==1:

    doc.add_heading(info+":",level=1)

    else:

    doc.add_paragraph(info,style='ListBullet')

    i=i+1

    doc.save(saveFile)

    print "word use:" + str((time.clock() - startTime))

    总结

    以上就是本文关于python解析html提取数据,并生成word文档实例解析的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

    展开全文
  • 使用node.jsWord文档读取数据 为什么要使用此模块? 有很多npm组件可以从Word .doc文件中提取文本,但是它们似乎都需要一些外部帮助程序,并且涉及生成进程或与持久性进程进行通信。 这增加了安装和部署负担...
  • Java读取Word文档

    2019-09-19 08:24:29
    1.下载pageoffice3.jar(http://zhuozhengsoft.com/PageOffice/) 2.add pageoffice3.jar to Library 3.创建POI对象 PoiParseWord poiParseWord=new PoiParseWord... 其他操作看文档API调用即可,此处只点出基本步骤
  • 对于docx文件,您可以使用mammoth,它将从.docx文件中提取文本。var mammoth = require("mammoth"); mammoth.extractRawText({path: "./routes/aaa.docx"}) .then(function(result){ var ...
  • wordreplacetopdf 读取Word文档的简单应用程序,允许替换文档中所需的单词,然后将其保存为PDF文档或Word文档 邮递员公共API文档
  • 代码如下:fileUpload然后,在写一个javascript OpenFile方法。代码如下:function OpenFile(){if (document.getElementById("flUpload").value.toUpperCase().indexOf(".XLS") != -1){var obj...
  • Java POI 读取word文件

    2018-05-08 10:22:54
    Apache POI是Apache软件基金会的开放源码函式库...1.读取word 2003及word 2007需要的jar包 读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi-3.5-beta6-20090622.jar 和 poi-scratchpad-3.5-beta6-2009...
  • 作者:李嘉乐 本次任务完成时间:2019年6月8日~2019年6月9日 开发工具与关键技术: VS2015、C# 首先需要获取到文档中书签的集合。 然后通过遍历这个书签...然后通过这个书签名,打开另一个word文档读取内容。 ...
  • &lt;...js读取word.aspx.cs" Inherits="js读取word" %&gt; &lt;!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/
  • Titlevar w = new ActiveXObject('Word.Application');var docText;var obj;if(w != null) {w.Visible = true;obj = w.Documents.Open("D:\\word\\go.doc");docText = obj.Content;w.Selection.TypeText("Hello");w....
  • //读取文件路径 OPCPackage opcPackage = null; String content = null; List<String> docxList = new ArrayList<String>(); try { opcPackage = POIXMLDocument.openPackage(request....
  • JS获取word文档内容到html页面

    万次阅读 2017-12-12 16:12:36
    <!DOCTYPE html> <title>Title var w = new ActiveXObject('Word.Application'); var docText; var obj;
  • 使用python新建一个word文档,操作就像文档里介绍的那样:from docx import Documentfrom docx.shared import Inchesdocument = Document()document.add_heading('Document Title', 0) #插入...
  • 网上得到如下代码可以实现js读取word、excel的内容。。我想得到word、Excel的页数怎么才能获得呢,求各位大侠鼎力相助。。。GetDataFromExcelPage .myCss { background-color: #c0ddff; text-align:center; vertical...
  • v25-2-103759795.pc_search_back_js&utm_term=python+docx%E8%AF%BB%E5%8F%96%E8%A1%A8%E6%A0%BC%E4%B8%AD%E7%9A%84%E8%A1%A8%E6%A0%BC
  • 两个简单的word文档, 各有一个表格:读取文档中的表格到列表(为演示只对单列表格操作):import docxdef 取表格(文件名):文件 = docx.Document(文件名)首个表 = 文件.tables[0]值 = []for 行 in 首个表.rows:for 格 in...
  • android读取word文档的三种方式:## 一,第三方应用打开 ##这种方式是最简单的方式,局限于你手机上必须提前已经安装过打开word的相关应用。 String path = Environment.getExternalStorageDirectory().getPath()....
  •  //需要关闭其他word文档,防止出现读取其他文档情况    /*  //逐个字符读取整个文档  var characters = vsWordApp.documents(1).characters  for(var i=1;i;i++)  {  alert(characters(i).text);  //...
  • 在Android读取Word文件时,在网上查看时可以用tm-extractors,但好像没有提到怎么读取Word文档中字体的颜色,字体,上下标等相关的属性。但由于需要,要把doc文档中的内容(字体,下划线,颜色等)读取应用到android...
  • 今天朋友说需要对100份 word 文件内容进行录入工作,问我是否有什么方便的方法。假如最少1份按2分钟的速度算,也需要200分钟才可以录入完成。我一直都不喜欢做重复又无意义的工作,就想着能否用程...
  • 本文实例讲述了js实现获取word文档内容并输出显示到html页面。分享给大家供大家参考,具体如下:titlevar w = new activexobject('word.application');var doctext;var obj;if(w != null) {w.visible = true;obj = w...
  • 本文实例讲述了JS实现获取word文档内容并输出显示到html页面。分享给大家供大家参考,具体如下: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Title<...
  • ();"/> 导入"/> ...//读取文件内容 reader.onload = function(){ console.log(this.result);//当读取完成之后会回调这个函数,然后此时文件内容存储到了result中。直接操作即可。 }; }
  • import os import docx from docx.document import Document from docx.oxml.table import CT_... # word_path = os.path.join(ROOT_DIR_P, "data/test_to_word2.docx") # pdf文件路径及文件名 read_word(word_path)
  • javascript语言怎么读取我的文档目录下的word文件并且自动汇总,判断后再显示出来?

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 21,136
精华内容 8,454
关键字:

js读取word文档内容