精华内容
下载资源
问答
  • 批量替换word文字

    2018-08-11 11:53:12
    此工具用于批量替换多个word中指定的相同文字,省时省力
  • 批量修改替换多个Word, 第二种方法, A,首先将需要批量替换的多个Word文档放在同一文件夹下面。  B,新建一空白Word文档,右击空白工具栏,单击“控件工具箱”,就可以看到屏幕上调出的控件工具箱。  C,在...
  • python替换word中的文字内容

    万次阅读 多人点赞 2018-07-05 14:32:46
    摘要:这篇文章介绍了如何使用python【3.6版本】把pdf文件转换为word文档并替换word文档中的文字内容,这里替换的规则是中英转换或者其它自定义规则pdf转换为wordpdf文件由于很难编辑,因而想要通过编程修改内容有些...

    摘要:这篇文章介绍了如何使用python【3.6版本】把pdf文件转换为word文档并替换word文档中的文字内容,这里替换的规则是中英转换或者其它自定义规则

    pdf转换为word

    pdf文件由于很难编辑,因而想要通过编程修改内容有些困难【不是不可能,只是代价比较大,特别是要保留原pdf格式的话】,故而这里介绍一个替换pdf文件文字内容的间接解决方案,即:把pdf文件转换为word然后再编程替换word的文字内容,当然替换完成后想把word转为pdf就简单的多了

    本文这里转换pdf文件介绍四种方法:

    • 使用第三方工具
    • 使用pdfminer3k 解析pdf然后再把内容写入到word中
    • 使用第三方SDK
    • 使用LibreOffice 开发者库

    这里简单说明下几种方法的优劣:

    使用第三方工具的话,有这样两种情况:
    • Online版本,大多可以免费使用,但是转换麻烦,不能编程操作,需要手动实现

    • 软件版本,大多可以批量转换,但是大多转换有限制,需付费才能无限制使用,且不能编程处理

      如果上面的情况符合你的实际需要,那再好不过!当然,不能符合的话,接着往下看

    使用pdfminer3k解析pdf文件

    使用Python抽取PDF文件内容,包括文本、图像、线条等对象

    使用第三方SDK

    这个是一个比较好的选择,然而,SDK大多收费!!!这些SDK一般提供完善的开发者API接口,你可以方便而又简单的调用,楼主这里介绍一个叫做easyConvertPDF,他们提供一个pdf2word.py 的API,使用十分简单,转换效果页令人满意,只是,License太贵了,买不起,当然你可以下载试用

    使用LibreOffice 开发者库

    这个是Micro Office 支持的 Office 开发者库,里面可以实现PDF转换为Word,只是楼主在使用时一致没测试成功,下面给出一段使用代码,你需要先安装LibreOffice 才行


    import os
    import subprocess
    
    for top, dirs, files in os.walk('/my/pdf/folder'):
        for filename in files:
            if filename.endswith('.pdf'):
                abspath = os.path.join(top, filename)
                subprocess.call('lowriter --invisible --convert-to doc "{}"'
                                .format(abspath), shell=True)

    从上面的四种方法中选择一种适合你的方法!

    替换word文字内容

    • 替换word使用的是win32com 的包,使用这个包你需要先安装pywin32

    pip install pywin32

    安装完成后可能会出现如下错误

    ImportError: DLL load failed: win32api, sys, os

    这时你可以通过如下方式解决

    C:\Users\yourname\Anaconda3\Lib\site-packages\pypiwin32_system32这个目录下的pythoncom36.dll 和pywintypes36.dll 拷贝到C:\Users\fanyu\Anaconda3\Lib\site-packages\win32 这个目录下

    正常后编写测试程序
    import os
    import win32com.client
    
    
    # 处理Word文档的类
    
    class RemoteWord:
      def __init__(self, filename=None):
          self.xlApp=win32com.client.DispatchEx('Word.Application')
          self.xlApp.Visible=0
          self.xlApp.DisplayAlerts=0    #后台运行,不显示,不警告
          if filename:
              self.filename=filename
              if os.path.exists(self.filename):
                  self.doc=self.xlApp.Documents.Open(filename)
              else:
                  self.doc = self.xlApp.Documents.Add()    #创建新的文档
                  self.doc.SaveAs(filename)
          else:
              self.doc=self.xlApp.Documents.Add()
              self.filename=''
    
      def add_doc_end(self, string):
          '''在文档末尾添加内容'''
          rangee = self.doc.Range()
          rangee.InsertAfter('\n'+string)
    
      def add_doc_start(self, string):
          '''在文档开头添加内容'''
          rangee = self.doc.Range(0, 0)
          rangee.InsertBefore(string+'\n')
    
      def insert_doc(self, insertPos, string):
          '''在文档insertPos位置添加内容'''
          rangee = self.doc.Range(0, insertPos)
          if (insertPos == 0):
              rangee.InsertAfter(string)
          else:
              rangee.InsertAfter('\n'+string)
    
      def replace_doc(self,string,new_string):
          '''替换文字'''
          self.xlApp.Selection.Find.ClearFormatting()
          self.xlApp.Selection.Find.Replacement.ClearFormatting()
          self.xlApp.Selection.Find.Execute(string, False, False, False, False, False, True, 1, True, new_string, 2)
    
      def save(self):
          '''保存文档'''
          self.doc.Save()
    
      def save_as(self, filename):
          '''文档另存为'''
          self.doc.SaveAs(filename)
    
      def close(self):
          '''保存文件、关闭文件'''
          self.save()
          self.xlApp.Documents.Close()
          self.xlApp.Quit()
    
    if __name__ == '__main__':
     doc = RemoteWord(docx)  # 初始化一个doc对象
     # 这里演示替换内容,其他功能自己按照上面类的功能按需使用
     doc.replace_doc('your string','new string')  # 替换文本内容
     doc.close()

    好了以上就完成了从pdf到word的完整内容,这里楼主附上一个实例:

    楼主需要把pdf文件报表的英文内容替换为中文,也就是等价于翻译,只是翻译是提前做好的,放置在一个match_rule.xlsx的文件中 ,这个文件内容就是两列:原文 译文,然后程序会读取内容并自动替换。

    下面楼主给出代码:

    # 该程序实现把PDF转换为word然后读取word文件中的文字内容并按照特定的规则替换文字
    
    
    
    # -*- encoding: utf8 -*-
    
    
    __author__ = 'yooongchun'
    
    
    # 引入所需要的基本包
    
    import os
    import re
    import xlrd
    import win32com.client
    import logging
    logging.basicConfig(level=logging.INFO)
    
    
    
    # 处理Word文档的类
    
    class RemoteWord:
      def __init__(self, filename=None):
          self.xlApp=win32com.client.DispatchEx('Word.Application')
          self.xlApp.Visible=0
          self.xlApp.DisplayAlerts=0    #后台运行,不显示,不警告
          if filename:
              self.filename=filename
              if os.path.exists(self.filename):
                  self.doc=self.xlApp.Documents.Open(filename)
              else:
                  self.doc = self.xlApp.Documents.Add()    #创建新的文档
                  self.doc.SaveAs(filename)
          else:
              self.doc=self.xlApp.Documents.Add()
              self.filename=''
    
      def add_doc_end(self, string):
          '''在文档末尾添加内容'''
          rangee = self.doc.Range()
          rangee.InsertAfter('\n'+string)
    
      def add_doc_start(self, string):
          '''在文档开头添加内容'''
          rangee = self.doc.Range(0, 0)
          rangee.InsertBefore(string+'\n')
    
      def insert_doc(self, insertPos, string):
          '''在文档insertPos位置添加内容'''
          rangee = self.doc.Range(0, insertPos)
          if (insertPos == 0):
              rangee.InsertAfter(string)
          else:
              rangee.InsertAfter('\n'+string)
    
      def replace_doc(self,string,new_string):
          '''替换文字'''
          self.xlApp.Selection.Find.ClearFormatting()
          self.xlApp.Selection.Find.Replacement.ClearFormatting()
          self.xlApp.Selection.Find.Execute(string, False, False, False, False, False, True, 1, True, new_string, 2)
    
      def save(self):
          '''保存文档'''
          self.doc.Save()
    
      def save_as(self, filename):
          '''文档另存为'''
          self.doc.SaveAs(filename)
    
      def close(self):
          '''保存文件、关闭文件'''
          self.save()
          self.xlApp.Documents.Close()
          self.xlApp.Quit()
    
    
    
    # 遍历找到word文件路径
    
    def find_docx(pdf_path):
      file_list=[]
      if os.path.isfile(pdf_path):
          file_list.append(pdf_path)
      else:
          for top, dirs, files in os.walk(pdf_path):
              for filename in files:
                  if filename.endswith('.docx')or filename.endswith('.doc'):
                      abspath = os.path.join(top, filename)
                      file_list.append(abspath)
      return file_list
    
    
    
    # 替换文本内容
    
    def replace_docx(rule,docx_list):
      len_doc=len(docx_list)
      i=0  # 计数
      for docx in docx_list:
          i+=1
          logging.info('开始替换第 %s/%s 个word文件内容:%s...'%(i,len_doc,os.path.basename(docx)))
          doc = RemoteWord(docx)  # 初始化一个doc对象
          for item in rule:  # 替换
              doc.replace_doc(item[0], item[1])
          doc.close()
    
      logging.info('完成!')
    
    
    
    # 对内容进行排序
    
    
    # 这里因为在进行文本替换的时候涉及到一个长句里面的部分可能被短句(相同内容)内容替换掉
    
    
    # 因而必须先把文本按照从长到短的顺序来进行替换
    
    def sort_rule(rule):
      result=[]
      for item, val in rule.items():
          le=len(item)
          flag = True
          if len(result)>0:
              for index, res in enumerate(result):
                  if len(item) >= len(res[0]):
                      flag=False
                      result.insert(index, (item, val))
                      break
              if flag:
                  result.append((item, val))
    
          else:
              result.append((item,val))
    
      return result
    
    
    
    # 加载Excel,把取得的内容返回,格式:dict{'原文':'译文'}
    
    def init_excel(excel_path):
      logging.info('加载文本匹配规则的Excel:%s' % os.path.basename(excel_path))
      rule={}  # 储存原文和翻译内容
      pdf_path=''
      try:
          book = xlrd.open_workbook(excel_path)  # 打开一个wordbook
          sheet = book.sheet_by_name('Translation')  # 切换sheet
          rows = sheet.nrows  # 行数
          for row in range(rows - 1):
              text_ori=sheet.cell(row, 0).value  # 取得数据:原文
              text_trans=sheet.cell(row,1).value  # 取得数据:译文
              if not re.match(r'^#.+',text_ori):  # 原文不以#开头
                  if text_ori == 'pdf文件(或文件夹)地址':   # 获得pdf文件路径
                      pdf_path=text_trans
                  else:
                      rule[text_ori]=text_trans  # 取得值加入text
      except IOError:
          raise IOError
      logging.info('加载Excel完成!')
    
      return pdf_path, rule
    
    if __name__ == '__main__':
    
      excel_path = './match_rule.xlsx'    # 替换规则的Excel文件地址
      logging.info('正在打开pdf转换软件,请手动转换你的pdf文件!')
      os.popen(r'"./PDF2Word/pdf2word.exe"')
      flag=input('你已经完成pdf文件转换了吗?(y/n):')
      while not flag == 'y':
          logging.info('请先转换pdf!')
          flag = input('你已经完成pdf文件转换了吗?(y/n):')
      pdf_path, rule = init_excel(excel_path)  # 加载Excel,取得内容
      sorted_rule=sort_rule(rule)  # 排序规则:按照由长到短
      docx_list=find_docx(pdf_path)  # 获取docx文件路径
      replace_docx(sorted_rule,docx_list)  # 替换内容
    
      logging.info('程序执行完成!')



    展开全文
  • 01、一键选择同样的内容编辑Word时,如果需要将相同样式的内容全选复制出去该怎么办呢?你是按住Ctrl键一个个的拖动鼠标选中吗?这样既耽误时间又麻烦!还有更快的方法哦!操作方法:鼠标对准文本,依次点击【开始】...

    假期最后一天,明天就要上班了,今天给大家分享20个Word实用技巧,希望你们能够喜欢。

    bcee19706e18037562128f62537132a3.png

    01、一键选择同样的内容

    编辑Word时,如果需要将相同样式的内容全选复制出去该怎么办呢?你是按住Ctrl键一个个的拖动鼠标选中吗?这样既耽误时间又麻烦!还有更快的方法哦!

    操作方法:鼠标对准文本,依次点击【开始】——【编辑】——【选择】——【选定所有各式类似的文本】即可。

    173fe7a14d7081ff7d8afb00b56ff38d.gif

    02、表格文字自适应

    我们在Word里面插入表格,然后输入的文字将表格撑大了怎么办?这时候只需将文本自适应即可!

    操作方法:选中文字,右击鼠标选中【表格属性】——【单元格】——【选项】——勾选自适应适应文字即可

    59a85462ab41a4d009d4fa1e7d606e5c.gif

    03、生僻字成拼音

    在编辑文档遇到不认识的字时候,你会想到用啥方法?查百度?其实只需要用Word自带的拼音功能就能轻松解决。

    操作方法:单击【开始】选项卡的【拼音指南】命令按钮,就可以查看文字的拼音了。

    e68b3f936149604c74cec4fdb727caa6.png

    04、设置自动保存时间

    相信90%的人都遇到过这种情况,辛辛苦苦编辑好的文档,没有保存,电脑就死机或者停电了,这种时候想死的心都有了吧?其实只需设置一下自动保存时间,就能有效防止文档丢失。

    操作方法:单击【文件】-【选项】-【保存】,把自动保存时间设置为1分钟即可,这样Word就会每隔一分钟保存一次。

    a0636b832405d0a6dcacb531bf975cd5.png

    05、一键拆分表格

    在Word里,当表格太长需要拆分时,很多人只能删除再新建一个表格。其实只需要按住快捷键就能立马拆分。

    操作方法:把光标置于表格要拆分的位置,按快捷键【Ctrl+Shift+Enter】就可以轻松搞定。

    78237104db9535b65299028e92b8cbdc.png

    06、竖向删除内容

    想要删除竖向内容,大多数人的做法是一行一行选中来删,这样也可以删除,但是真的太费劲了,其实可以一键删除哦!

    操作方法:按住【Alt键】,再按住鼠标左键来拖动,即可竖向选中文本。

    9d6136eaa3332934da65fa6c8ccf3f01.png

    07、批量修改图片大小

    文档图片大小不一,如何快速统一大小呢?其实只要简单2步就能搞定了。

    操作方法:① 选中一张图片,在【图片格式】中,设置你需要的高度、宽度。

    ②选中其他图片,单击键盘上【F4键】即可,如果你是笔记本,那就要按【FN+F4】哦!

    fe2c393ab3d372145d6ed1b8eaa7eeb6.png

    08、一页纸打印

    打印的时候,时常会碰到这种情况,明明想打印在一张纸上,结果打印出来,总有那么一两行被单独打印在一页纸上,浪费纸张不说,还不方便阅读。其实,只要设置一下“一页纸打印”即可。

    操作方法:在功能区的搜索文本框内直接输入【打印】二字,选择【预览和打印】→【打印预览编辑模式】。在打印预览编辑模式中,单击【减少一页】命令。

    4bb895df6e8b27cb0919e1bb96f96a01.png

    09、文本转表格

    在Word里,当数据、信息多的时候,用表格肯定比纯文字清楚。这时你就可以把纯文字一键转换成表格。

    操作方法:选中你需要转换的文本,单击【插入】→【表格】→【文本转换成表格】就搞定了。这里文本的分隔符号一定是英文符号。

    f2a88bbd6273096cf19d06d9f684dad5.gif

    10、表格转文本

    如果想把表格内容转成纯文字也很简单。

    操作方法:只需要选中表格,单击【表格】→【转换为文本】即可。

    0f0b7a599cd15d69d90dfc891eed8660.png

    11、图片批量居中

    Word中插入图片默认都是左对齐,怎么给文档里数十张图片批量居中呢?用下面这个方法吧!

    操作方法:①快捷键【Ctrl+H】,打开【替换】对话框。②在【查找内容】一栏中输入【^g】这里^g代表图片,^可以按shift+6输入,或者单击【更多】→【特殊格式】→【图形】

    e9bdd12c480ad7907cc554c69f174274.png

    ③在【替换为】一栏中,单击【格式】→【段落】→【对齐方式】,选中【居中】,然后点【全部替换】即可。

    148b33c424a789fc0daf548ba4d59d9d.png

    12、合并两栏信息对齐

    在拟定合同的时候,甲乙双方的信息,通常需要两栏对齐,用手敲空格键确实可以暂时对齐,但一旦输入文本,文字就会跟着跑偏,其实只要插入表格就能换解决对不齐的问题。

    操作方法:插入【表格】,填写信息,将表格的的框线设置为【无框线】,这样就对齐了。

    57927bbcb033d7d7addab3864bb393ac.gif

    13、快速将Word文件转换成PPT文件

    有时候需要将Word文件转换成PPT,有没有什么快捷高效的方法呢?

    操作方法:打开迅捷PDF转换器——PDF转换——文件转换PPT——点击或拖拽文件添加,立马搞定!

    a4b30139633feb38d4c67c25fe4749a2.png

    14快速录入商标符号

    有时我们在编辑文章,需要用到商标,怎样快速录入了?当然是用快捷键啦,有它一键搞定!

    操作方法:

    录入TM商标:【Alt+Ctrl+T】

    录入R商标:【Alt+Ctrl+R】

    录入版权符号:【Alt+Ctrl+C】

    8257459e5785bca50d317ba24e12b41e.png

    15、Word自动排序

    在Word文本中,如果我们需要将文本进行排序,你还在一个个的编辑吗?如果是这样那就太麻烦了,其实我们可以这样做:

    操作方法:全选需要编辑的文本,然后点击【开始】-【段落】-【定义新编号格式】-【编辑样式】中选择自己需要的格式-【确定】即可。

    21d28ec033e49d479a990544e271019f.gif

    16、首字母下沉设置

    有时候为了使word文档更加生动美观,会让首字母下沉。首字母下沉常用于文档或章节的开头,在新闻稿等特殊文档中经常使用,可以起到增强视觉效果的作用。

    操作方法:【选中文字】-【插入】-【数字下沉】—【首字母下沉】

    f3cdf13f6e357872cb3df4126da5da24.gif

    17、更改首字母下沉效果

    假如对原先的首字母下沉效果并不满意,那么我们又该如何修改呢?

    操作方法:在【首字下沉】下拉框中,选择【首字下沉选项】打开相应的对话框,之后在根据自己的实际情况来选择相应的字体、下沉行数等。

    2751fd561fc7de0ec07e12c0c2254ff7.gif

    18、A4纸上打超大字

    在调整字体大小时,尤其是设计海报,很多小伙伴会遇到这种情况:需要将字体调到200磅,但文档最大的字只有72磅,这时怎么调整?

    操作方法:在Word中,字体的大小可以直接手动输入的,只要在字号中输入你想要的,按回车键即可。

    27e69da5b59c0c3ecf07f8684c1a68bf.png

    19、给段落加线框

    有时候在排版中,需要给段落文字加上边框,不熟悉的人,第一时间就找不到在哪儿添加。

    操作方法:选中需要添加的文本段落,之后在【段落】组中选择【边框和底纹】,然后在相应的对话框中选择边框,最后在运用的范围中选择【段落】即可。小贴士:如果想要更改框线的颜色,可以在颜色中选择适合即可。

    7f3c1110144d953b8c5c95771dadd042.gif

    20、简历中插入头像

    简历中看似简单的插入头像,但还是有很多人没掌握到窍门哦~

    操作方法:点击开始-插入-形状-文本框-最后将图片插入文本框就可以了。

    7de1b78ba85bb09865a3b795b0eae5f3.gif


    好了,今天的内容就是这样,记不住的小伙伴建议收藏,觉得有帮助,还请点个【分享】,我们下期见啦~

    展开全文
  • 有时候我们参考别人格式写文章的时候,明明是保留格式直接复制过来的,结果和原来是word的页数不一样,这是因为我们,定义保留了网络文档。 那怎么解决呢 只要复制过来把这个钩去掉即可 当然你要是想修改,直接...

    有时候我们参考别人格式写文章的时候,明明是保留格式直接复制过来的,结果和原来是word的页数不一样,这是因为我们,定义保留了网络文档。

     那怎么解决呢

    只要复制过来把这个钩去掉即可

    当然你要是想修改,直接在页面布局-页面设置-文档网格中进行修改,不过有些是不好修改的

     

    展开全文
  • 10、伪造、更改号牌和证件:对于使用伪造、擅自更改的机动车号牌、行驶证、驾驶证、校车标牌,或者使用其他机动车号牌、行驶证等行为将会一次性扣除12分。 11、驾驶机动车在高速公路上倒车、逆行、穿越中央分隔带...

    参考链接:https://blog.csdn.net/weixin_43145361/article/details/103798581

    参考链接:https://zhidao.baidu.com/question/326711580304676805.html

    参考链接:https://blog.csdn.net/weixin_43245453/article/details/108335331

    参考链接:https://python-docx.readthedocs.io/en/latest/index.html

    参考链接:https://blog.csdn.net/weixin_42378365/article/details/85017115

    一、使用python-docx库

    https://python-docx.readthedocs.io/en/latest/index.html

    二、对比规则

    对比的基本思想是按小句进行比较,所以拆分以是标点,即,。?!等进行拆分。拆分完成以后,可以有很多的小段。本文中为了便于定位,先根据原始段落进行拆分,然后再将每段根据标点拆分成若干小句,即一个word文档 = [[段落1], [段落2], [段落3], ...,[段落n]],而每个段落= [[小句1],[小句2],[小句3],...,[小句m],]

    循环对比输出,根据段落,两两进行对比,遇到匹配输出结果。

    三、源码

    # coding=utf-8
    
    from docx import Document
    import re, sys, datetime
    
    
    def getText(wordname):
        d = Document(wordname)
        texts = []
        for para in d.paragraphs:
            texts.append(para.text)
        return texts
    
    def is_Chinese(word):
        for ch in word:
            if '\u4e00' <= ch <= '\u9fff':
                return True
        return False
    
    def msplit(s, seperators = ',|\.|\?|,|。|?|!'):
        return re.split(seperators, s)
    
    def readDocx(docfile):
        print('*' * 80)
        print('文件', docfile, '加载中……')
        t1 = datetime.datetime.now()
        paras = getText(docfile)
        segs = []
        for p in paras:
            temp = []
            for s in msplit(p):
                if len(s) > 2:
                    temp.append(s.replace(' ', ""))
            if len(temp) > 0:
                segs.append(temp)
        t2 = datetime.datetime.now()
        print('加载完成,用时: ', t2 - t1)
        showInfo(segs, docfile)
        return segs
        
    def showInfo(doc, filename = 'filename'):
        chars = 0
        segs = 0
        for p in doc:
            for s in p:
                segs = segs + 1
                chars = chars + len(s)
        print('段落数: {0:>8d} 个。'.format(len(doc)))
        print('短句数: {0:>8d} 句。'.format(segs))
        print('字符数: {0:>8d} 个。'.format(chars))
              
    def compareParagraph(doc1, i, doc2, j, min_segment = 5): 
        """
        功能为比较两个段落的相似度,返回结果为两个段落中相同字符的长度与较短段落长度的比值。
        :param p1: 行
        :param p2: 列
        :param min_segment = 5: 最小段的长度
        """
        p1 = doc1[i]
        p2 = doc2[j]
        len1 = sum([len(s) for s in p1])
        len2 = sum([len(s) for s in p2])
        #print(len1)
        #print(len2)
        if len1 < 10 or len2 < 10:
            return []
        
        list = []
        for s1 in p1:
            if len(s1) < min_segment:
                continue;
            for s2 in p2:
                if len(s2) < min_segment:
                    continue;
                if s2 in s1:
                    list.append(s2)
                elif s1 in s2:
                    list.append(s1)
                    
        # 取两个字符串的最短的一个进行比值计算
        count = sum([len(s) for s in list])
        ratio = float(count) /  min(len1, len2)
        if count > 10 and ratio > 0.1:
            print(' 发现相同内容 '.center(80, '*'))
            print('文件1第{0:0>4d}段内容:{1}'.format(i + 1, p1))
            print('文件2第{0:0>4d}段内容:{1}'.format(j + 1, p2))
            print('相同内容:', list)
            print('相同字符比:{1:.2f}%\n相同字符数: {0}\n'.format(count, ratio * 100))
        return list
     
    #if len(sys.argv) < 3:
    #    print("参数小于2.")
    
    
    #doc1 = readDocx(sys.argv[1])
    #print(doc1)
    #doc2 = readDocx(sys.argv[2])
    #print(doc2)
    
    doc1 = readDocx('./document/doc1.docx')
    doc2 = readDocx('./document/doc2.docx')
    
    print('开始比对...'.center(80, '*'))
    t1 = datetime.datetime.now()
    for i in range(len(doc1)):
        if i % 100 == 0:
            print('处理进行中,已处理段落 {0:>4d} (总数 {1:0>4d} ) '.format(i, len(doc1)))
        for j in range(len(doc2)):
            compareParagraph(doc1, i, doc2, j)
     
    t2 = datetime.datetime.now() 
    print('\n比对完成,总用时: ', t2 - t1)   

    其中,doc1.docx中内容为

    新交规扣12分的违章行为
      1、驾驶营运客车超载20%以上,其中除了出租车、长途客运车辆等常规营运车辆外(不含公交车),在新规则中还首次加入了校车。
      2、严重超速:驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路上行驶超过规定时速20%以上或者在高速公路、城市快速路以外的道路上行驶超过规定时速50%以上,以及驾驶其他机动车行驶超过规定时速50%以上。
      3、故意遮挡号牌:从1月1日起,上道路行驶的机动车未悬挂机动车号牌的,或者故意遮挡、污损、不按规定安装机动车号牌一律会被一次性扣除12分。另外,对于牌照架也更新了规定,对于使用不符合规定的牌照架会受到200元并扣6分的处罚。
      4、驾驶营运客车在高速公路车道内停车:如果营运客车在高速公路上擅自停车(没有事故、车辆故障等原因)将受到一次性扣除12分的处罚。
      5、连续驾驶中型以上载客汽车、危险物品运输车辆超过4小时未停车休息或者停车休息时间少于20分钟。
      6、未取得校车驾驶资格驾驶校车(新增)
      校车准驾驾驶资格:驾龄3年以上,年龄不超过60周岁;最近连续3个分周期内没有满分记录;无致人死亡或者重伤的交通责任事故;无饮酒或者醉酒后驾驶记录,最近1年内无驾驶客运车辆超员、超速等严重交通违法行为;无犯罪记录,无因违反治安管理行为受到拘留处罚的记录;身体健康,无酗酒、吸毒行为记录,无传染性疾病,无癫痫、精神病等可能危及行车安全的病史。
      7、饮酒后驾驶机动车:酒后驾车除了扣除12分之外,还将扣押驾照6个月,并给予不超过2000元的现金处罚。对于醉酒驾车则是吊销驾驶证的处罚,除此之外还有刑事责任的处罚,且5年内不得重新考取驾照。
      8、驾驶与准驾车型不符:该行为实际上讲越级驾驶可以视为无照驾驶。另外除了扣除12分之外,交警还有权利给予200-2000元和扣车等处罚。
      9、造成交通事故后逃逸:交通事故肇事逃逸,尚不构成犯罪者将会受到12分的处罚。致人重伤、死亡或者使公私财产遭受重大损失的,处三年以下有期徒刑或者拘役;交通运输肇事后逃逸或者有其他特别恶劣情节的,处三年以上七年以下有期徒刑;因逃逸致人死亡的,处七年以上有期徒刑。
      10、伪造、更改号牌和证件:对于使用伪造、擅自更改的机动车号牌、行驶证、驾驶证、校车标牌,或者使用其他机动车号牌、行驶证等行为将会一次性扣除12分。
      11、驾驶机动车在高速公路上倒车、逆行、穿越中央分隔带掉头等严重影响交通安全的,都会受到12分的处罚。
      新交规扣6分的违章行为
      1、驾驶机动车违反道路交通信号灯通行:由于侥幸心理导致的闯红灯行为,过去是扣除3分,从2017年开始升级为扣除6分。
      2、货车超载:超过额定载重量30%以上的车辆,或违反规定载客的车辆将受到扣除6分的处罚。
      3、营运车辆超载未超过20%:驾驶营运客车(不包括公共汽车)、校车载人超过核定人数未达20%的,或者驾驶其他载客汽车载人超过核定人数20%以上将受到扣除6分的处罚。
      4、高速公路超速未达到20%(新增):驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路上行驶超过规定时速未达20%的车辆将受到扣除6分的处罚。
      5、普通公路超速20%以上(新增):驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路以外的道路上行驶或者驾驶其他机动车行驶超过规定时速20%以上未达到50%将受到此处罚。
      6、驾驶机动车不按照规定避让校车(新增),扣6分;
      7、低能见度气象条件下驾驶机动车在高速公路上不按规定行驶(新增),在恶劣天气中,应该做到:
      能见度小于200米时,开启雾灯、近光灯、示廓灯和前后雾灯,车速不得超过每小时60公里,与同车道前车保持100米以上的距离;
      能见度小于100米时,开启雾灯、近光灯、示廓灯、前后雾灯和危险报警闪光灯,车速不得超过每小时40公里,与同车道前车保持50米以上的距离;
      能见度小于50米时,开启雾灯、近光灯、示廓灯、前后雾灯和危险报警闪光灯,车速不得超过每小时20公里,并从最近的出口尽快驶离高速公路。
      8、机动车驾驶证被暂扣期间驾驶机动车,在被暂扣期间属于无照驾驶。
      9、驾驶营运客车以外的机动车在高速公路车道内停车;
    

     doc2.docx中内容为

    核心提示:最新交通法规扣分细则规定,扣三分的行为有十二种,表现在驾驶货车载物超过核定载质量未达30%的;驾驶禁止驶入高速公路的机动车驶入高速公路的;驾驶机动车违反禁令标志、禁止 标线指示等方面。法律快车编辑在下文为您详细整理相关内容,仅供参考。
      最新交通法规扣分细则规定,机动车驾驶人有下列违法行为之一,一次记3分:
      (一)驾驶营运客车(不包括公共汽车)、校车以外的载客汽车载人超过核定人数未达20%的;
      (二)驾驶中型以上载客载货汽车、危险物品运输车辆在高速公路、城市快速路以外的道路上行驶或者驾驶其他机动车行驶超过规定时速未达20%的;
      (三)驾驶货车载物超过核定载质量未达30%的;
      (四)驾驶机动车在高速公路上行驶低于规定最低时速的;
      (五)驾驶禁止驶入高速公路的机动车驶入高速公路的;
      (六)驾驶机动车在高速公路或者城市快速路上不按规定车道行驶的;
      (七)驾驶机动车行经人行横道,不按规定减速、停车、避让行人的;
      (八)驾驶机动车违反禁令标志、禁止 标线指示的;
      (九)驾驶机动车不按规定超车、让行的,或者逆向行驶的;
      (十)驾驶机动车违反规定牵引挂车的;
      (十一)在道路上车辆发生故障、事故停车后,不按规定使用灯光和设置警告标志的;
      (十二)上道路行驶的机动车未按规定定期进行安全技术检验的。
      以上是现场处罚,下面法律快车为您介绍非现场处罚扣掉3分的行为:
      从2012年7月起,7种摄录违法(非现场处罚)罚款+记分:(是摄录罚款)1、闯红灯,罚款200元。2、不按导向车道行驶,罚款200元。3、违反禁止标线行驶,罚款100元。4、超速行车,罚款200元。5、机动车走非机动车车道,罚款100元。6、逆行,罚款200元。7、违停车,罚款200元。
      下述非现场处罚交通违法记3分
    2、严重超速:驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路上行驶超过规定时速20%以上或者在高速公路、城市快速路以外的道路上行驶超过规定时速50%以上,以及驾驶其他机动车行驶超过规定时速50%以上。
    

    最终的结果为

    ********************************************************************************
    文件 ./document/doc1.docx 加载中……
    加载完成,用时:  0:00:00.004986
    段落数:       26 个。
    短句数:       70 句。
    字符数:     1684 个。
    ********************************************************************************
    文件 ./document/doc2.docx 加载中……
    加载完成,用时:  0:00:00.003001
    段落数:       18 个。
    短句数:       43 句。
    字符数:      835 个。
    ************************************开始比对...*************************************
    处理进行中,已处理段落    0 (总数 0026 ) 
    ************************************ 发现相同内容 ************************************
    文件1第0003段内容:['\u3000\u30002、严重超速:驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路上行驶超过规定时速20%以上或者在高速公路、城市快速路以外的道路上行驶超过规定时速50%以上', '以及驾驶其他机动车行驶超过规定时速50%以上']
    文件2第0018段内容:['2、严重超速:驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路上行驶超过规定时速20%以上或者在高速公路、城市快速路以外的道路上行驶超过规定时速50%以上', '以及驾驶其他机动车行驶超过规定时速50%以上']
    相同内容: ['2、严重超速:驾驶中型以上载客载货汽车、校车、危险物品运输车辆在高速公路、城市快速路上行驶超过规定时速20%以上或者在高速公路、城市快速路以外的道路上行驶超过规定时速50%以上', '以及驾驶其他机动车行驶超过规定时速50%以上']
    相同字符比:100.00%
    相同字符数: 110
    
    
    比对完成,总用时:  0:00:00.001989
    [Finished in 0.2s]

     

    四、出现问题

    解决方法

    pip install python-docx

    出现问题2 

    解决方法 

    展开全文
  • word中如何替换内容 WORD中如何替换文字 材料/工具:word2010 1、打开相应的word文档,比如我们要将文档中的“华为”全部改为“HUAWEI”。 2、点击“编辑”菜单,选择“查找”。 3、出现“查找和替换”...
  • 如何在Word2010中查找指定文字

    千次阅读 2017-11-13 09:31:08
    在编辑Word文档过程中,由于某种特殊需求,我们可能需要更改文档中一些相同的字符,这个时候我们就可以利用查找功能先将文档中指定的所有文字搜索出来。 方法一、利用“查找” 1.打开Word文档,选择“开始”...
  • Word中如何使公式与文字对齐

    千次阅读 2017-07-17 11:20:10
    写论文时,经常需要在Word文档里输入公式,但是输入的公式与文字不能很好得对齐问题,上下有偏差,很丑,让人很不爽;还有很多人发现使用MathType公式编辑器编辑的公式直接粘贴到Word里面,与Word原生的公式格式不...
  • 文字上面好像被削了一样 缩小字体,段落——行距——固定值 调整一下就ok,这个就是段落的问题,调整一下行距就好了。 插入表格——在“自动调整”操作中——点上根据内容调整表格就可以了! 附图: -------------...
  • Word文档批量替换工具

    万次阅读 2019-07-01 11:25:01
    日常工作中可能会碰到这样的情况,就是需要批量替换一些文件的内容,如合同、产品说明、ISO认证标准化文档(质量手册、程序文件、管理手册)、项目推广方案等,先做批量替换,再进行修改,可以节省大量时间。...
  • 如何Word修改Normal样式模板

    千次阅读 2019-04-14 18:39:14
    样式的最大作用是帮助我们管理一篇文档中有相同格式的文字或段落,是自动生成文档目录的第一步。 可能在写几页word文档还体现不出它的优势,一旦涉及很多页的word文档,那么不同的页的格式绝对是令人头痛的一个问题...
  • Word VBA教程:查找并替换文字或格式

    万次阅读 2018-08-18 10:48:54
    通过Find 和Replacement对象可实现查找和替换功能。...如果从 Selection对象访问 Find对象,当找到搜索条件时,就会更改所选内容。下列示例选定下一个出现的“Hello”。如果到达文档结尾时仍未找到“Hello”,则...
  • 3、第二次对相同路径进行检查更新时,只更新最近修改、新增、删除的文件 第二步:通过区域② 输入关键字,对检索路径下的文件进行文件名或内容检索,检索结果会显示在区域③。 第三步:点击区域③,可在区域④中...
  • 群里(Word学习交流群:180627193)一位朋友问到,如何一次性批量替换多个word文档中的同一内容。其实,实现多个Word文档的字符进行批量替换的方法有多种。(www.itblw.com)  第一种方法,可以利用第三方软件:...
  • Word有着强大的文本编辑功能,我们可以轻松的在Word中输入文本内容,更改文字字体,设置文字大小、颜色,方便的对文本内容排版。在前面的实例中已经详细介绍了怎样使用C#创建Word文档,本实例将会使用C#方便的向指定...
  • POI word 修改字体颜色

    万次阅读 2016-07-22 13:29:36
    //一个XWPFRun代表具有相同属性的一个区域。 XWPFRun run = para.createRun(); run.setBold(true); //加粗 run.setText("加粗的内容"); run = para.createRun(); run.setColor("FF0000"); run.setText...
  • PhpStorm选中相同文字高亮2017年11月13日 10:05:12阅读数:397setting-》plugins-》Browse Repositories 输入BrowseWordAtCaret 搜索,安装,然后重启;Settings -》 Editor -》 General -》 Appearance -》 Browse ...
  • word修改正文样式影响标题样式

    千次阅读 2016-10-11 16:47:35
    很多其他的样式都是在“正文”样式的基础上经过格式改变而设置出来的,因此“正文”样式是Word中的最基础的样式,不要轻易修改它,一旦它被改变,将会影响所有基于“正文”样式的其他样式的格式。 所以其实正文的...
  • word中如何只修改英文的颜色

    千次阅读 2019-03-14 09:53:00
    替换->更多->使用通配符,查找[a-zA-Z],替换为^&,字体选红色 转载于:https://www.cnblogs.com/61355ing/p/10528349.html
  • 1,可批量替换word中的指定内容 ,亲测,实用。 ps:目录的深度超过3级后,有时替换不了。
  • ![图片说明](https://img-ask.csdn.net/upload/201904/12/1555036254_517539.png) 更换其中的SJD-NJ-12345-20180716为excel表中的其他字符
  • 使用java poi 替换word模板里面的内容

    千次阅读 2019-11-29 14:04:03
    使用java poi 替换word模板里面的内容需求背景功能实现对模板进一步加工,方便我们程序处理java代码验证 需求背景 业务提供了一个word的签名模板,要求根据订单内容替换模板中的关键信息,需要替换的内容已明确。 ...
  • 术语 开始前,我们先定义一对术语: 通配符指的是您可以用来代表一个或多个字符的键盘字符。...通配符指的是目标字符串中可能各不相同的文本。 试一试! 本节中的步骤介绍了如何使用正则表达式转...
  • 目录 问题描述 解决方案与操作步骤 ... 第二步、① 右击表格​ 按钮,弹出右键菜单,选择“表格属性” 或 ②将光标置于表格内,选择“布局”-“表”-“属性” ...WORD中,怎么缩小表格边框与字...word表格怎么改边框与...
  • Word 2016使用技巧

    千次阅读 2017-11-19 13:08:03
    在版本历史记录中可找到每次修改的记录,并可与当前文档进行对比。智能查找可让您在无需离开Word窗口的情况下,利用互联网查找文档中的词语。 技巧一:简单共享(新) Word 2016利用新的“共享”按钮,快速便捷地...
  • 解决问题的办法似乎很简单,将选中文字的背景颜色修改一下就OK了。但是找来找去,半天时间,在Notepad++设置楞是没找到在哪里可以改变选中文字背景色,“设置”–>“语言格式设置”的选项太简单了,和Notepad++...
  • 软件介绍:此软件通过分析百度的文档接口数据,将数据对应到同目录下的word文档中,相对于图片识别转换,所有的对齐不会丢失,文字的大小,位置,图片等都完全按照百度开放接口内容返回。 原百度文档 转换后word文档...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 37,577
精华内容 15,030
关键字:

word更改相同文字