精华内容
下载资源
问答
  • word 页码技巧

    2011-04-02 11:54:04
    word页码技巧 word页码技巧 word页码技巧 word页码技巧
  • Word页码设定

    2012-10-29 09:16:28
    Word页码设定
  • Word 页码操作

    2014-04-24 20:46:04
    Word 页码操作,在做毕业设计的时候老是碰到前面是罗马页码,后面要变成阿拉伯数字页码。例如你的word的共有20页,前三页为一部分,页码希望设置成“第-I-页 共III页”的形式,剩下的页码设置成“第-1-页 共17页”的...
  • 编辑word页码

    2020-07-24 16:16:59
    如何编辑word页码 本篇内容可以解决三个问题 解决的内容 从某一页开始 奇偶页设置不同 在数字前面加上一些特定格式 从某一页开始 加上分隔符,然后从想要的那一页开始设置 在分隔符下面选择下一页这个选项 奇偶页...

    如何编辑word页码

    本篇内容可以解决三个问题

    解决的内容

    1. 从某一页开始
    2. 奇偶页设置不同
    3. 在数字前面加上一些特定格式

    从某一页开始

    加上分隔符,然后从想要的那一页开始设置
    分在这里插入图片描述
    在分隔符下面选择下一页这个选项

    奇偶页设置不同

    在这里插入图片描述
    首先选择这个奇偶页的设置,
    在这里插入图片描述
    然后选择页码,假设想要的效果是奇数页在右,偶数页在左,则选中第一页奇数篇,页码下拉框里选择普通数字3,选中第一篇偶数页,页码下拉框选普通数字1

    在数字前面加上一些特定格式

    在这里插入图片描述
    在某一页直接改就行

    展开全文
  • word 页码文件

    2018-10-10 12:06:14
    word页码文件
  • python判断word页码

    千次阅读 2019-02-12 17:10:00
    title: python实现word判断索引页码 date: 2019-02-12 15:09:39 ...​ word的源码格式类似于xml,目前无法直接解析word页码 ​ 整体思路是 先将word转成pdf, 通过对PDF每一页进行文字提取,判断页码。 2...

    title: python实现word判断索引页码
    date: 2019-02-12 15:09:39
    tags:

    • pdf
    • word
    • python
      categories:
    • python
    • 自动化

    python判断word页码

    1、整体思路

    ​ word的源码格式类似于xml,目前无法直接解析word页码

    ​ 整体思路是 先将word转成pdf, 通过对PDF每一页进行文字提取,判断页码。

    2、使用到的python库

    ​ 主要是 pdfminer库进行word转换成PDF,windows去下载pdfminer3k ,该库的准确率很高,不用担心正确率的问题

    ​ python处理PDF有两个比较常见的库,另一个是pypdf2,该库在我的项目中表现比较差,提取PDF中的文字时准确率比较低,所以放弃了。

    3、windows下安装pdfminer3k

    pip install pdfminer3k
    

    4、环境

    ​ python3.6

    ​ windows

    5、代码

    import os
    import sys
    import importlib
    importlib.reload(sys)
    import re
    from pdfminer.pdfparser import PDFParser, PDFDocument
    from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
    from pdfminer.converter import PDFPageAggregator
    from pdfminer.layout import LTTextBoxHorizontal, LAParams
    from pdfminer.pdfinterp import PDFTextExtractionNotAllowed
    from win32com.client import Dispatch, constants, gencache
    
    
    rootDir = os.getcwd() + r"\root"
    projectDir = os.getcwd()
    logPath = os.path.join(projectDir, r'log.txt')
    colorLogPath = os.path.join(projectDir, r'colorLog.txt')
    
    
    def log(*args):
        """
        输出灰印日志
        :param data:
        """
        data = "#".join(list(args))
        # print(data)
        with open(logPath, 'a') as f:
            f.write(data + "\n")
    
    
    def colorLog(*args):
        """
        输出彩印日志
        :param data:
        """
        data = "#".join(list(args))
        with open(colorLogPath, 'a', encoding='utf-8') as f:
            f.write(data + "\n")
    
    
    def readPartItems(partItemsPath):
        """
        读取信息
        :param partItemsPath:
        :return:
        """
        with open(partItemsPath, 'r', encoding='utf-8') as f:
            return f.read()
    
    
    def pdfParse(path, kws):
        """
         解析pdf 文本,返回关键检索信息
        :param path: pdf路径
        :param kws: 匹配的关键字列表
        :return: 元祖(blackPrint, corlorPrint,capNames)  ([灰色页] ,[彩色页])
        """
        colorPrint = []  # 彩色打印页码
        blackPrint = []  # 黑白打印页码
        cpaNames = []    #注册师
        fp = open(path, 'rb')  # 以二进制读模式打开
        # 用文件对象来创建一个pdf文档分析器
        praser = PDFParser(fp)
        # 创建一个PDF文档
        doc = PDFDocument()
        # 连接分析器 与文档对象
        praser.set_document(doc)
        doc.set_parser(praser)
    
        # 提供初始化密码
        # 如果没有密码 就创建一个空的字符串
        doc.initialize()
    
        # 检测文档是否提供txt转换,不提供就忽略
        if not doc.is_extractable:
            raise PDFTextExtractionNotAllowed
        else:
            # 创建PDf 资源管理器 来管理共享资源
            rsrcmgr = PDFResourceManager()
            # 创建一个PDF设备对象
            laparams = LAParams()
            device = PDFPageAggregator(rsrcmgr, laparams=laparams)
            # 创建一个PDF解释器对象
            interpreter = PDFPageInterpreter(rsrcmgr, device)
            count = 0  # 记录页数
            # 循环遍历列表,每次处理一个page的内容
            for page in doc.get_pages():  # doc.get_pages() 获取page列表
                count += 1
                interpreter.process_page(page)
                # 接受该页面的LTPage对象
                layout = device.get_result()
                # 这里layout是一个LTPage对象 里面存放着 这个page解析出的各种对象 一般包括LTTextBox, LTFigure, LTImage, LTTextBoxHorizontal 等等 想要获取文本就获得对象的text属性,
                results = ''
                for x in layout:
                    if (isinstance(x, LTTextBoxHorizontal)):
                        results += x.get_text()
    
                # 正则匹配是否彩印
                pattern = '|'.join(kws)
                data = re.findall(pattern, results, re.S)
    
                # 正则匹配注册会计师的姓名
                pattern = '中国注册会计师:\s*(.*?)\n'
                nameList = re.findall(pattern, results, re.S)
    
                for i in nameList:
                    cpaNames.append("".join(re.split(r'\s+', i)))
    
                # 区分彩灰打印页
                if data:
                    colorPrint.append(str(count))
                else:
                    blackPrint.append(str(count))
            return blackPrint, colorPrint, cpaNames
    
    
    def createPdf(wordPath, pdfPath):
        """
        word转pdf
        :param wordPath: word文件路径
        :param pdfPath:  生成pdf文件路径
        """
        word = gencache.EnsureDispatch('Word.Application')
        doc = word.Documents.Open(wordPath, ReadOnly=1)
        doc.ExportAsFixedFormat(pdfPath,
                                constants.wdExportFormatPDF,
                                Item=constants.wdExportDocumentWithMarkup,
                                CreateBookmarks=constants.wdExportCreateHeadingBookmarks)
        word.Quit(constants.wdDoNotSaveChanges)
    
    
    def printCredential(cpaNames):
        # print("打印证书:", cpaNames)
        pass
    
    
    
    def createData(path):
        data = readPartItems(path + "\project_part_items.txt")
        item = data.split("\n")
        if not os.path.exists(r'%s\pdfCachDir' % projectDir):
            os.mkdir(r'%s\pdfCachDir' % projectDir)
        pdfCachDir = r'%s\pdfCachDir' % projectDir  # pdf存放目录
        fileNameList = os.listdir(path)
        cpaNames = []  #需要打印证书的名字
        for file in fileNameList:
            pages = "Default"
            copies = "1"
    
            (fileName, extension) = os.path.splitext(file)
            fileAbsPath = os.path.join(path, file)
            #word
            if "封面" in fileName and extension in ['.docx', '.doc']:
                log(extension, fileAbsPath, pages, copies)
            #word
            elif "正文" in fileName and extension in ['.docx', '.doc']:
                pdfAbsPath = os.path.join(pdfCachDir, fileName + '.pdf')  # pdf 路径
                if not os.path.exists(pdfAbsPath):  # pdf是否存在
    
                    createPdf(fileAbsPath, pdfAbsPath)
    
    
                    kws = ["中国注册会计师", "中国·北京"]
    
                    # 解析pdf 该返回二维列表 [[灰白印页], [彩印页], [cpanames]
                    blackPrint, colorPrint, cpaNames = pdfParse(pdfAbsPath, kws)
                    # 灰白打印记入文件
                    log(extension,fileAbsPath, ",".join(blackPrint), copies)
    
    
                    # 彩色打印记入文件
                    colorPages = str(','.join(colorPrint[1]))
    
                    pattern = "正文.docx:(.*?)\n"
                    dataId = re.findall(pattern, data)[0]
                    colorLog(item[0].split(":")[-1], item[1].split(":")[-1], copies, "%s$%s" % (dataId, colorPages))
    
                    # 删除pdf缓存文件
                    os.remove(pdfAbsPath)
                    pass
            # ecxl文件操作
            elif "报表" in fileName and extension in ['.xls', '.xlsx']:
                # print('正在写入灰白打印记录', fileAbsPath)
                log(extension, fileAbsPath, pages, copies)
                pass
            # word
            elif '附注' in fileName and extension in ['.docx', '.doc']:
                # print('正在写入灰白打印记录', fileAbsPath)
                log(extension, fileAbsPath, pages, copies)
                pass
        # 最终处理打印证书
        printCredential(cpaNames)
    
    
    def main(rootDir):
        fileDirs = os.listdir(rootDir)
        for fileDir in fileDirs:
            fileDirPath = os.path.join(rootDir, fileDir)
            createData(fileDirPath)
    
    def err():
        if os.path.exists(logPath):
            os.remove(logPath)
        if os.path.exists(colorLogPath):
            os.remove(colorLogPath)
        if os.path.exists(r'%s\pdfCachDir' % projectDir):
            pdfCachDir = r'%s\pdfCachDir' % projectDir  # pdf存放目录
            for pdf in os.listdir(pdfCachDir):
                pdfPath = os.path.join(pdfCachDir, pdf)
                os.remove(pdfPath)
            os.rmdir(pdfCachDir)
    
    
    if __name__ == '__main__':
        try:
            main(rootDir)
        except:
            err()
    

    最近查看vba文档发现 调用vba可以很简单实现

    Autoit 实现word拆分页解析 (python同理)

    背景

    之前一直在做相关工作,由于没有找到解决最佳解决方案,老办法思路是 python先将word 转成pdf,按照页码 提取文字,从而实现word的页索引工作。

    最近研究了一下vba,终于找到了最佳解决方案!!!

    AutoIt

    我用AutoIt测试的,AutoIt调用vba

    #include <MsgBoxConstants.au3>
    #include <Word.au3>
    
    ; 创建应用对象
    Local $oWord = _Word_Create()
    If @error Then Exit MsgBox($MB_SYSTEMMODAL, "Word UDF: _Word_DocOpen 示例", _
            "创建新 Word 应用对象时发生错误." & @CRLF & "@error = " & @error & ", @extended = " & @extended)
    
    ; *****************************************************************************
    ; 只读打开文档
    ; *****************************************************************************
    Local $sDocument = 'D:\Desktop\tzcpa\BJ自动打印\新建文件夹\AutoPrinter\log\backupFile\2019-04-03 08h39m03s140\天职业字[2019]11884号\2.单体审计报告2018-标准无保留意见.docx'
    Local $doc = _Word_DocOpen($oWord, $sDocument, Default, Default, True)
    If @error Then Exit MsgBox($MB_SYSTEMMODAL, "Word UDF: _Word_DocOpen 示例 1", "打开文档 '.\Extras\Test.doc' 发生错误." & _
            @CRLF & "@error = " & @error & ", @extended = " & @extended)
    
    ;关键部分!!!! 
    ; $doc 是当前活动文档,Pages是页码索引,Item是矩形框索引 改成请自行更改测试,因为一页可能有多个矩形框 
    ;返回值时 活动文档某一页的 矩形框中的文本
    
    Local $objPage = $doc.ActiveWindow _
     .Panes(1).Pages(2).Rectangles.Item(2).Range.Text
    MsgBox(1,1,$objPage)
    
    
    MsgBox($MB_SYSTEMMODAL, "Word UDF: _Word_DocOpen 示例 1", "文档 '" & $sDocument & "' 已成功打开.")
    
    

    思路

    整体思路是调用vba,由于目前python没有发现 有库可以对 页对象进行操作,所以采用了调用底层vba来操作

    在vba中 页对象有一个是 Rectangles属性,解释如下

    下面的示例返回活动文档中第一页的矩形集合。

    Dim objRectangles As Rectangles 
     
    Set objRectangles = ActiveDocument.ActiveWindow _ 
     .Panes(1).Pages(1).Rectangles
    

    然后顺藤摸瓜找到了Rectangles对象可以操作Range ,这样就可以获得某一页的某一矩形 内的 text,之后对于大多数页对象的操作也就解决了。

    python同理,使win32库调用 vba就好了

    展开全文
  • java准确读取word页码

    2017-10-04 01:39:53
    java准确读取word页码,正确率100%,请结合本文查看http://blog.csdn.net/tiandixuanwuliang/article/details/71298406
  • 修改word页码参考步骤

    2014-12-10 17:19:17
    修改word页码参考步骤
  • Word页码随意定

    2011-09-10 12:50:24
    Word页码随意定,给大家Word页码随意定的方法,百试不爽啊~
  • Word页码随意设置

    2010-05-26 14:58:21
    我们在使用Word时,经常要根据实际情况来编排页码,那么只要掌握了下面列出的几种常见页码的编排方法,就可以做到word页码随意定
  • 解决word页码混乱并使页码从指定页开始 1.解决word页码混乱  页码混乱是由于误加了分节符导致的结果,导致页码不按照物理顺序排序。因此,我们在大纲模式下删除所有分节符,重排页码。        2.从...

    解决word页码混乱并使页码从指定页开始

    1.解决word页码混乱

          页码混乱是由于误加了分节符导致的结果,导致页码不按照物理顺序排序。因此,我们在大纲模式下删除所有分节符,重排页码。

     

     

     

     2.从指定页重排页码

    在指定页页眉位置点击布局,选择分隔符,下一页

     

    之后点击插入页码,设置页码格式,从起始页开始设置为1

     

     

    点击插入页码,设置页面底端。此时发现当前页为第1页,前面还有页码。

    点击连接到前一条页眉,

     

     

    然后反到上一页,直接delete页码,完成。

    展开全文
  • 许多应届毕业生在排版...所以,在这里易老师就来教下大家Word页码如何从第三页开始,或者说页码如何从正文页初始。教大家的是方法,无论是第三页或是第四页或是后面第几页开始,大家务必要灵活运用。 页码从第...

    许多应届毕业生在排版毕业论文时候,都会按要求设置页码,第一页是封面,第二页是目录,那么正文内容就要从第三页正式开始了。按照正规设置方式,那么页码此时应该是第三页。但是按照论文格式规定,页码应该是从正文页初始的。

    所以,在这里易老师就来教下大家Word页码如何从第三页开始,或者说页码如何从正文页初始。教大家的是方法,无论是第三页或是第四页或是后面第几页开始,大家务必要灵活运用。

    毕业论文必备技巧:Word页码从第三页开始设置方法
     

    页码从第三页开始

    1、首先,我们「插入」-「页码」-「页面底端」,为了让大家能够看得更加清楚,这里我就将内容放大一下。

    毕业论文必备技巧:Word页码从第三页开始设置方法

    2、这里,我演示的是将页码从第三页开始,所以,需要将光标定位到第二页最后一行末尾处,「布局」-「分隔符」-「下一页」;然后双击第三页页码处,将「页眉和页脚工具」-「设计」-「导航」中「链接到前一条页眉」取消选择。

    毕业论文必备技巧:Word页码从第三页开始设置方法

    3、进入在第三页页码处,「插入」-「页码」-「设置页码格式」,选择「起始页码」设为「1」,确定即可完成。

    毕业论文必备技巧:Word页码从第三页开始设置方法

    说明:以上操作即可完成页码从第三页开始,当然,前面的1、2页页码,你可以删除,也可以保留,也可以再次进入「设置页码格式」中设为其他类型的页码,与后面的页码不会有任何影响变化。

    参考:http://www.wordlm.com/html/6643.html

    展开全文
  • word页码设置

    2014-07-12 16:32:31
    word页码插入语与删除,是我们经常用的,但是有时不会操作,希望这篇文章可以解决一些问题
  • Word页码小技巧(转)

    2019-05-26 11:45:05
    Word页码小技巧(转) 在用Word打印日常文件时,少不了要给文档添加页码。可不要小看这页码,其中也大有学问哟。  1、直接插入页码 启动Word2002(其它版本请仿照操作),打开需要添加页码的文档,执行“插入...
  • 今天,小编就和大家说一下设置Word页码从任意页开始的方法。设置方法如下:1、打开一个word文档,在要开始设置页码的那一页前面设置光标,将光标设置到那一页的最前面,如图所示,小编从第二页开始...
  • 适合写毕业论文的同学,设置2007word页码的万能法,可以设置前几页是1,2,3……..,后面的页数可以是a,b,c……,以此类推
  • Word页码的设定(转)

    2019-07-21 11:23:09
    我们在使用Word时,经常要根据实际情况来编排页码,那么只要掌握了下面列出的几种常见页码的编排方法,就可以做到word页码随意定:一、页码从第二页开始1、选择“插入-页码”,打开“页码”对话框。2、取消“首页...
  • Word 页码设置

    2021-05-19 16:59:30
    具体步骤如下: 准备工作 首页设置 注意:首页不存在页眉、页脚、编码,设置时需要注意,应进行“布局-分隔符-下一页”操作。...鼠标移动第1页目录,点击“插入-页码-...设置页码格式后,点击“插入-页码-页
  • WORD页码编辑

    2019-10-05 02:14:36
    1、封面 目录 正文显示不同页码 Word文档里页眉页脚和页码的问题,比如怎样做才能在封面不出现页眉页脚?怎样让各章节的页眉页脚各不相同?怎样让目录和正文有各自不同的页码?其实只需插入分节符,将文档分成几节,...
  • Word页码踩坑

    2021-03-25 00:58:06
    如果想控制某几页单独进行页码编写,需要完成两步: 使用分节符与前后内容隔开,注意是使用分节符,不是分页符。 取消页脚的“链接到前一节”,即取消“与上一节相同”。
  • word页码设置大全

    2011-04-05 10:29:46
    用于设置word页面,word 插入页码方法,页码装饰,一页显示多个页码word文档双面打印放置页码 任意页面设置页码
  • word页码技巧

    2013-01-17 20:53:13
    页码插入学习分如下三步就来完成: 第一步:将文档分为3节 光标定位在第一个页面的最后,插入 → 分隔符 → 分节符类型:下一页 → 按Delete键删除空白页(行)将光标定位在第三个页面的最后,插入 → 分隔符 → 分...
  • 例如在Word文档中设置了分栏后,尽管一页中有两栏或者多栏文字,但使用“插入页码”命令,却只能在该页中插入同一个页码。如果需要在系每栏都添加页码,或者需要自定义开始添加页码的页面,又该如何操作呢。  这里...
  • Word页码,从某一页开始,word2010版本如何制作页码,如何从某一页开始页码
  • Word页码随意定

    2009-07-08 10:49:00
    Word页码随意定 一、页码从第二页开始 1、选择“插入-页码”,打开“页码”对话框。 2、取消“首页显示页码”复选框中的对钩,然后单击“格式”按钮,打开“页码格式”对话框。 3、“起始页码”后的框中键入数字“0...
  • WORD页码相同问题

    2019-09-03 23:20:46
    页码相同是由于自己手动输入了页码 双击页脚,删去自己输入的数字,点击左上角的页码选项,出现的下拉菜单中选择当前位置插入

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,831
精华内容 732
关键字:

word页码