精华内容
下载资源
问答
  • 说明:python用得不,比较笨的办法。 1, 需要安装pdfminer:pip install pdfminer; 2, 把文件复制并保存为rename.py 3, pdf放在rename.py同级目录下的pdf文件夹,文件夹复制一份为pdf1. 4,运行python rename....

    说明:python用得不多,比较笨的办法。

    1, 需要安装pdfminer:pip install pdfminer;  

    2, 把文件复制并保存为rename.py

    3, pdf放在rename.py同级目录下的pdf文件夹,文件夹复制一份为pdf1.

    4,运行python rename.py

    
    # rename.py
    
    # 导入库
    # -*- coding: utf-8 -*-   
    from pdfminer.pdfparser import PDFParser
    from pdfminer.pdfdocument import PDFDocument
    from pdfminer.pdfpage import PDFPage
    from pdfminer.pdfpage import PDFTextExtractionNotAllowed
    from pdfminer.pdfinterp import PDFResourceManager
    from pdfminer.pdfinterp import PDFPageInterpreter
    from pdfminer.pdfdevice import PDFDevice
    from pdfminer.layout import *
    from pdfminer.converter import PDFPageAggregator
    
    import re
    import os
    
    
    # 设置文档密码
    password = ''
    #设定文件路径
    path='.\\pdf'
    #path1='.\\pdf1'
    i=1
    #filename='PostgresChina2...1545186754.pdf'
    #allname='Postgresql 高可用 平安云    汪洋.pdf'
    #设置新文件名
    #new_name=filename.replace(filename,allname)
    #重命名
    #os.rename(os.path.join(path1,filename),os.path.join(path1,new_name))    
    #对目录下的文件进行遍历
    
    #return 
    for filename in os.listdir(path):
    
    #判断是否是文件
        allname=''
        if os.path.isfile(os.path.join(path,filename))==True:
            print (filename)
            
            #打开pdf文件
            fp = open(path+"\\"+filename,'rb')
    
            #从文件句柄创建一个pdf解析对象
            parser = PDFParser(fp)
    
            #创建pdf文档对象,存储文档结构
            document = PDFDocument(parser,password)
    
            if not document.is_extractable:
                raise PDFTextExtractionNotAllowed
            #创建一个pdf资源管理对象,存储共享资源
            rsrcmgr = PDFResourceManager()
    
            #创建一个PDF设备对象
            laparams = LAParams()
            device = PDFPageAggregator(rsrcmgr,laparams=laparams)
            #创建一个PDF解释其对象
            interpreter = PDFPageInterpreter(rsrcmgr,device)
                    
            #处理包含在文档中的每一页
            j=1
    
            subname=''
            y=1
            j+=1
            for page in PDFPage.create_pages(document):
                interpreter.process_page(page)
                layout = device.get_result()
               
                for x in layout:
                    # 获取文本对象
                    
                    if isinstance(x, LTTextBox):#LTTextBoxHorizontal
                        #print(x.get_text().strip())
                        subname = x.get_text().strip()                    
                        #print (subname)                    
                        if( y == 2 or y == 3):
                            allname+=subname+"-"
                        if( y == 4 ):
                            allname+=subname+".pdf"
                         
                        
                        print (allname)
                    # 获取图片对象
                    if isinstance(x,LTImage):
                        print('这里获取到一张图片')
                    # 获取 figure 对象
                    if isinstance(x,LTFigure):
                        print('这里获取到一个 figure 对象')
                    #Print 4 element
                    if ( y == 4):
                        break      
                    y+=1
                #Print 1 page
                if ( j == 2):
                    break
            
        #handle abnormal char
        #allname = allname.decode("utf8")
        allname = re.sub("[\s+\.\!\/_,$%^*(+\"\')]+|[+——()?【】“”!,。?、~@#¥%……&*()]+", "",allname)
        print (allname)
        #设置新文件名
        #new_name=filename.replace(filename,allname)
        #重命名
        #os.rename(os.path.join(path,filename),os.path.join(path,new_name))    
        
        #i+=1
        #if ( i == 2 ):
        #    break
        
        
    #结束
    print ("End")


                

    展开全文
  • pdf,西门子之为什么重命名计算机名后,用户无法打开项目中的单项目?项目使用Windows的 UNC(通用命名规则)路径来访问项目中的单项目。Windows的计算机名同样包括在UNC路径中。 也就是说,为了能够访问项目...
  • 1、将插件dll放入endnote的plugins文件夹,启动endnote,会看到tools菜单下会出两endnoterenamer的菜单项。进入config,设定命名规则,命名规则是全文pdf的文件名部分(不包括扩展名),文件夹名自动设置为文件名...
  • <p>I need to allow users to upload multiple files ...<p>Here's the code for uploading and renaming a single file (it uses .jpg files but will be changed to .pdf files in due course) ... <p></p> ...
  • 计算机视觉领域会议近年来论文接收数量暴增,论文得看不过来。偶尔想起来,会兴致勃勃去下载几篇看看。但每次看都要去官网下载,挺麻烦的。为何不直接把论文全部爬下来,有空时直接翻出来看?这篇博客要干的就是...

    转自:https://blog.csdn.net/lcz200/article/details/80813988

    动机

        计算机视觉领域会议近年来论文接收数量暴增,论文多得看不过来。偶尔想起来,会兴致勃勃去下载个几篇看看。但每次看都要去官网下载,挺麻烦的。为何不直接把论文全部爬下来,有空时直接翻出来看?这篇博客要干的就是这个事情。

    说明

        以防万一有同学看到最后发现该博客解决不了自己问题,这里先说明一下,以下的所有操作都是在ubuntu下进行的,windows下不能直接用,但是可以参考一下。

    具体操作

        1. 写脚本,爬论文。

    说到写爬论文脚本,有些同学可能会觉得有点麻烦。其实爬某个网页下的指定格式的文件并不麻烦。比如cvpr 2018年的论文所在网站为http://openaccess.thecvf.com/CVPR2018.py,这个爬论文的脚本只需一行代码:

    wget --level=1 --recursive --no-parent --accept pdf,PDF http://openaccess.thecvf.com/CVPR2018.py

     直接将这行代码贴在终端中运行或者将这行代码写在一个.sh脚本中运行都可以。运行完后会在当前目录下生成一个目录"openaccess.thecvf.com",cd进去看会发现所有的论文都在“openaccess.thecvf.com/content_cvpr_2018/papers ”目录中了,相关的补充材料也会被一并爬下来,保存在“openaccess.thecvf.com/content_cvpr_2018/Supplemental ”目录下。执行ls命令会看到所有的论文都下载好了。
     

     但是有个问题很烦人,就是pdf文件的名字并不是我们想要的论文标题。难道我们每次想看论文时都得打开一个pdf来看这篇文章是干嘛的吗?更好的方式当然是直接从pdf文件名就能看出论文大概讲的是什么东西(比如做detection的文章大多题目都会有detection这个字眼),这样我们可以随心所欲地选择自己想看的主题相关的论文。
     

    2. 提取论文标题,用它重命名pdf文件

        由于要获取pdf标题,这边需要先装一下叫PyPDF2的东西,安装方法很简单:

    sudo pip install PyPDF2

     

    安装完后,将下面的代码负责到rename_pdf_using_title.py文件中,运行即可: 

      import os
      from PyPDF2 import PdfFileWriter, PdfFileReader
      from shutil import copy2
       
      src_dir = '/home/XXX/download/cvpr2018_papers/openaccess.thecvf.com/content_cvpr_2018/papers'
      des_dir = '/home/XXX/download/cvpr2018_papers/openaccess.thecvf.com/content_cvpr_2018/papers_new'
       
      if not os.path.exists(des_dir):
          os.makedirs(des_dir)
      
      if os.path.exists(src_dir):
          dirs = os.listdir(src_dir)
          for dirc in dirs:
              pdf_reader = PdfFileReader(open(os.path.join(src_dir, dirc), 'rb'))
              titlec = pdf_reader.getDocumentInfo().title
              if titlec.find('/')!=-1: #文件名中的斜杠'/'会和目录标识符冲突,因此将其转为'-'
                  print(titlec)
                  titlec2 = titlec.replace('/','-')
                  print(titlec2)
                  titlec = titlec2
              copy2(os.path.join(src_dir, dirc), os.path.join(des_dir, titlec) + '.pdf')
      else:
          print("Dir does not exist!")
    

    运行完后到des_dir下ls一下,可以看到所有的pdf文件都命名好了:

     

      希望对喜欢屯paper的同学有点帮助。 

     

    展开全文
  • 一、工具 adobe pdf acrobat Dc 二、步骤 2.1 截取 先添加页码,方面对照查看后面对不对 ... 选择裁剪 画框选择需要裁剪的页面 双击画好的裁剪页面,打开设置界面 ...将重命名的文件重新合并为一个pdf就可以了。 ...

    一、工具

    adobe pdf acrobat Dc

    二、步骤

    2.1 截取

    1. 先添加页码,方面对照查看后面对不对
    2. 点击编辑pdf
    3. 选择裁剪
    4. 画框选择需要裁剪的页面
    5. 双击画好的裁剪页面,打开设置界面
    6. 设置好后点击确定生成该部分文件。注意一定要选择另存为,直接保存会覆盖源文件
    7. 重新打开源文件,编辑另一部分。

    2.2 拆分

    1. 分别打开截取的部分文件
    2. 分别拆分它们,并用代码重命名,重命名代码

    三、合并文件

    将重命名的文件重新合并为一个pdf就可以了。

    展开全文
  • 最近从某网站下载了一批文档,但是文件是用数字串命名的文档(很图书馆都这样吧),现在我也下载完了这些文件,也有这些文件的列表,就是不能一的把文件给重命名吧所以从网上找了这几脚本。 一、使用bat...
  • ren "导出页面自 01.pdf" "51_01010_ZY.pdf" ren "导出页面自 02.pdf" "51_01010_ZY.pdf" 将bat文件和"导出页面自 01.pdf" "导出页面自 02.pdf" 放一个文件夹中,运行无...因为有很多个文件,只简单列举上述两行。
  • 不好看就要整容 —— MySQL 基于规则的优化(内含关于子查询优化二三事儿).md 两表的亲密接触 —— 连接的原理.md 乱码的前世今生 —— 字符集和比较规则.md 从一条记录说起—— InnoDB 记录结构.md 从猫爷被杀...
  • 从相机或图库中的多个图像创建PDF 查看您转换的PDF 打开,重命名,删除,打印,共享文件 根据多个选项对文件顺序进行排序 查看文件详细信息(路径,大小,创建日期...) 加密PDF 解密PDF 旋转页面 不同的主题 ...
  • 比较两个PDF文件之间的文本差异 通过短信创建PDF文件 将水印添加到PDF文件 将文本层添加到PDF文件,以使它们可与文本一起搜索 从PDF文件提取图像和文本 将PDF文件转换为图像 将手写笔记图像美化为PDF文件 将网页和...
  • 通过在浏览器中打开多个Workload Deployer控制台时自动分配唯一的选项卡名称,可以更有效地使用IBM®Workload Deployer。 David Leigh共享了一个脚本,Firefox和Chrome用户可以运行该脚本来区分名称相同的标签。 ...

    存档日期:2019年5月17日 | 首次发布:2013年4月16日

    通过在浏览器中打开多个Workload Deployer控制台时自动分配唯一的选项卡名称,可以更有效地使用IBM®Workload Deployer。 David Leigh共享了一个脚本,Firefox和Chrome用户可以运行该脚本来区分名称相同的标签。

    此内容不再被更新或维护。 全文以PDF格式“按原样”提供。 随着技术的飞速发展,某些内容,步骤或插图可能已更改。

    翻译自: https://www.ibm.com/developerworks/cloud/library/cl-workloaddeployer-uniquetabnames/index.html

    展开全文
  • C#拆分PDF(iText)

    2019-10-15 10:01:38
    按照exce制定的规则,将一个PDF拆分成多个并进行重命名
  • staplr:PDF工具包-源码

    2021-02-05 20:54:22
    多个PDF文件合并为一个:Staple_pdf() 从文件中删除选定的页面:remove_pages() 重命名目录中的多个文件:rename_files() 旋转整个pdf文档:rotate_pdf() 旋转pdf文件的选定页面:rotate_pages() ...
  • PDF Expert 2 Mac版是一款备受称赞的PDF工具,PDF Expert 2界面简洁、PDF打开和浏览速度都很不错,要比自带的预览好用了,并将带有强大的编辑功能,让你处理PDF文件得心应手,极大的提供了工作效率,工作中需要...
  • PDF Expert 2 Mac版是一款备受称赞的PDF工具,PDF Expert 2界面简洁、PDF打开和浏览速度都很不错,要比自带的预览好用了,并将带有强大的编辑功能,让你处理PDF文件得心应手,极大的提供了工作效率,工作中需要...
  • 我文件夹下有600张图片,生产PDF。全选放word里,竟然是倒序,不知道怎么排序,也许可以修改一下文件名。 现写一小工具好了。 第一步,图片重命名。 要转的图片准备好,命名为‘1.jpg’数字格式。如果不在乎...
  • R中可以对PDF做很操作,如关键词提取、页数统计、多PDF拆分与合并等。这里精选相关R包,以便于后续取用。 CRAN - Package pdfsearch:可以找到关键字在PDF文件中的所在行,以及上下的行的文本。如果要对PDF文件做...
  • 先将PDF页面停留在需要添加书签的位置后,点击书签工具面板上的“+”添加一个新的书签,并双击重命名书签名称,多次操作可添加多个平级(第一级)书签。 在已添加的书签列表中,将其中一个书签选中并拖到到另一个...
  • 批量获取文件夹下pdf标题并重命名

    千次阅读 2020-07-01 11:31:35
    下载篇论文的时候,总是一堆标号,每打开重命名很烦,安装一PyPDF2的包即可。 pip install PyPDF2 代码如下: import os from PyPDF2 import PdfFileReader from shutil import copy2 import re def rename_...
  • 一旦你掌握了编程的基本知识,你就会创建一个Python程序,它可以毫不费力地实现有用和令人印象深刻的自动化壮举:-在一个文件中或多个文件中搜索文本-创建、更新、移动和重命名文件和文件夹-搜索Web并下载在线内容-...
  • PDF Expert 2 Mac版是一款备受称赞的PDF工具,PDF Expert 2界面简洁、PDF打开和浏览速度都很不错,要比自带的预览好用了,并将带有强大的编辑功能,让你处理PDF文件得心应手,极大的提供了工作效率,工作中需要...
  • dos命令大全.pdf

    2020-08-14 20:30:37
    FIND 在一个或多个文件中搜索一个文本字符串。 FINDSTR 在多个文件中搜索字符串。 FOR 为一组文件中的每个文件运行一个指定的命令。 FORMAT 格式化磁盘,以便用于 Windows。 FSUTIL 显示或配置文件系统属性。 FTYPE ...
  • FreeRTOS 可以在很不同编译器中编译,其中的一些编译器比同类有更高级特性。因为这原 因,FreeRTOS 不使用任何非 C 语言标准的特性或语法。一例外情况是头文件 stdint.h。在文件夹 FreeRTOS/Source/include 下...
  • 直接从文件管理器轻松处理多个文件和文件夹 在编辑文档之前,请在默认的PDF查看器和文件管理器中预览文档 根据元数据重命名文件 PDFMtEd检查器 概述 PDFMtEd Inspector是通用的元数据查看器和清理器。 除了可以...
  • PDF页面的标题重命名为论文的标题。 添加一按钮以导航回到“摘要”页面。 以文件标题为文件名下载PDF。 可与“本机选项卡搜索”和其他插件配合使用! (有关更详细信息,请参见“部分) 详细记录了所有...
  • 本文将讲述Windows 2000/XP/Server 2003上的一被很软件使用的功能:延迟删除/重命名,文中还将教你如何使用这功能来维护你的系统。文章将配合PendMove-延迟删除/重命名工具做具体的实例讲解。
  • visio教程PDF

    热门讨论 2010-05-17 23:56:22
    15.2.3 在多个模板中放置一个主图形 15.3 设置模板文件属性 15.4 使用文档模板 15.5 编辑模板文件 15.5.1 编辑主图形 15.5.2 编辑图标 15.5.3 重命名模板文件 15.6 调整模板窗口 15.6.1 浏览...
  • 并且在抓取元素之前都将pdf重命名为 基于迁移学习的多源遥感影像建筑垃圾识别.pdf</code> 这种只含题目的名字。 能否提供一下更的提取规则设定方式(当前只能找到<code>{%g}</code>,<code>{%t}...

空空如也

空空如也

1 2 3 4 5 ... 10
收藏数 188
精华内容 75
关键字:

多个pdf重命名