精华内容
下载资源
问答
  • PDF 图片 python3

    2019-01-23 17:24:46
    以原pdf名为文件夹名来存放该pdf转换后的图片 参数:pdf为存放原pdf的文件目录(绝对路径) img为存放所有转换好的图片文件夹的文件夹 """ def __init_...
    from pdf2image import convert_from_path                                                                                                                                                                 
    import tempfile
    import multiprocessing
    import os
    
    
    class PdfToImage():
    	"""
    	将pdf转换为图片
    	以原pdf名为文件夹名来存放该pdf转换后的图片
    	参数:pdf为存放原pdf的文件目录(绝对路径)
    	     img为存放所有转换好的图片文件夹的文件夹
    	"""
    
    
        def __init__(self, pdf, img):
        	"""
        	初始化pdf文件路径和存放图片路径
        	"""
            self.pdf = pdf
            self.img = img
    
    
        def convers(self, fileName, outputDir):
        	"""
        	pdf转图片核心,自行学习pdf2image库
        	"""
            with tempfile.TemporaryDirectory() as path:
                images = convert_from_path(fileName, dpi=100, output_folder=outputDir, fmt='jpeg')
                # pdf转换完成后,将该pdf文件删除
                os.unlink(self.fileName)
    
    
        def main(self):
        	"""主调度流程"""
    
        	# 创建进程池
            pool = multiprocessing.Pool(processes = 4)
    
            # 循环读取pdf文件夹内pdf文件
            for fileName in os.listdir(self.pdf):
                # 获取文件名
                dirName = fileName[:-4]
                # 将文件名拼接到要保存图片目录路径下
                dirPath = os.path.join(self.img,dirName)
                # 判断该文件目录是否已经存在,如果存在,将其删除
                if os.path.exists(dirPath):
                    os.removedirs(dirPath)
                # 在存放图片目录路径下新建以pdf名为名的文件夹,用来存放对应pdf转换得到的图片
                os.mkdir(dirPath)
                # 指定pdf转换后输出文件夹目录路径
                outputDir = dirPath
               	# 要转换的pdf文件路径
               	fileName = self.pdf + '/' + fileName
                # 调用进程池进行转换
                pool.apply_async(self.convers, args=(fileName, outputDir))
            # 关闭进程池,回收进程
            pool.close()
            pool.join()
    
    
    
    
    # 存放pdf文件的目录(绝对路径)
    # pdf = "/home/ubantu/Desktop/PDF"
    # 要存放转换好的图片目录(绝对路径)
    # img = "/home/ubantu/Desktop/IMAGES"
    
    # pdftoimg = PdfToImage(pdf, img)
    # pdftoimg.main()
    
    展开全文
  • python PDF 图片

    2020-04-26 18:05:35
    python PDF 图片 代码 import fitz import time import re import os def pdf2image(pdf_path):       '''     # 从pdf中提取图片     :param path: ...

    python PDF 转 图片 fitz库

    代码

    import fitz
    import time
    import re
    import os
    def pdf2image(pdf_path):   
        '''
        # 从pdf中提取图片
        :param path: pdf的路径
        :param pic_path: 图片保存的路径
        :return:
        '''
        # 生成图片初始时间
        t0 = time.clock()
        # 使用正则表达式来查找图片
        checkXO = r"/Type(?= */XObject)" 
        checkIM = r"/Subtype(?= */Image)"  
        # 打开pdf
        doc = fitz.open(pdf_path)
        # 图片计数
        imgcount = 0
        lenXREF = doc._getXrefLength()
        # 打印PDF的信息
        print("pdf路径:{}, 页数: {}, 对象: {}".format(pdf_path, len(doc), lenXREF - 1))
        # 遍历每一个对象
        for i in range(1, lenXREF):
            # 定义对象字符串
            text = doc._getXrefString(i)
            isXObject = re.search(checkXO, text)
            # 使用正则表达式查看是否是图片
            isImage = re.search(checkIM, text)
            # 如果不是对象也不是图片,则continue
            if not isXObject or not isImage:
                continue
            imgcount += 1
            # 根据索引生成图像
            pix = fitz.Pixmap(doc, i)
            # 根据pdf的路径生成图片的名称
        #     new_name = path.replace('\\', '-') + "_img{}.png".format(imgcount)
            png_path = pdf_path.replace("pdf","png")
            print("图片路径:",png_path)
            # 如果pix.n<5,可以直接存为PNG
            if pix.n < 5:
                pix.writePNG(png_path)
            # 否则先转换CMYK
            else:
                pix0 = fitz.Pixmap(fitz.csRGB, pix)
                pix0.writePNG(png_path)
                pix0 = None
            # 释放资源
            pix = None
            t1 = time.clock()
            print("运行时间:{}s".format(t1 - t0))
            print("提取了{}张图片".format(imgcount))
            return png_path
        if __name__ == '__main__':
        # pdf_path:pdf文件路径
        pdf_path = r"C:\Users\xiahuadong\Desktop\PDF文字矫正代码\20200310c国发\20200310c国发0007.pdf"
        pdf2image(pdf_path)    
    
    展开全文
  • Python3 PDF转图片

    千次阅读 2019-10-28 16:23:11
    最近要把PDF转换为png图片,用到了Pythonpdf2image模块。 pdf2image是对pdftoppm和pdftocairo的封装,可以转换PDF到PIL图片对象。 安装 pip install pdf2image windows下还需要下载poppler,并且把bin/目录加到...

    简介

    最近要把PDF转换为png图片,用到了Python的pdf2image模块。
    pdf2image是对pdftoppm和pdftocairo的封装,可以转换PDF到PIL图片对象。

    安装

    pip install pdf2image
    

    windows下还需要下载poppler,并且把bin/目录加到PATH里。
    Mac下需要安装Mac版poppler.
    Linux下需要安装conda-forgepoppler

    conda install -c conda-forge poppler
    

    用法

    from pdf2image import convert_from_path, convert_from_bytes
    from pdf2image.exceptions import (
        PDFInfoNotInstalledError,
        PDFPageCountError,
        PDFSyntaxError
    )
    
    # 直接从文件目录读取
    images = convert_from_path('/home/belval/example.pdf')
    
    # bytes方式
    images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())
    
    ### 更好的方式
    import tempfile
    
    with tempfile.TemporaryDirectory() as path:
        images_from_path = convert_from_path('/home/belval/example.pdf', output_folder=path)
        # Do something here
    

    参考

    https://github.com/Belval/pdf2image

    展开全文
  • Python PDF转图片

    千次阅读 2019-10-10 17:32:21
    Python PDF转图片安装PyMuPDF运行代码 安装PyMuPDF pip install PyMuPDF 如果要能力就可以使用别的库,但是我试了几个库感觉还是这个库简单,也不需要修改系统环境变量。 运行代码 import fitz rotate = int(0) ...

    Python PDF转图片

    安装PyMuPDF

    pip install PyMuPDF
    

    如果要能力就可以使用别的库,但是我试了几个库感觉还是这个库简单,也不需要修改系统环境变量。

    运行代码

    import fitz
    rotate = int(0)
    zoom_x = 1.0
    zoom_y = 1.0
    trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)
    open_file_path =...’
    save_file_path = '...'
    
    pdf = fitz.open(open_file_path )
    for i in range(pdf.pageCount):
        pm = pdf[i].getPixmap(matrix=trans, alpha=False)
        pm.writePNG(save_file_path + '/%s.png' % i)
    
    展开全文
  • Python pdf转图片

    2021-06-10 18:00:22
    包 pip install PyMuPDF import datetime import os import fitz # fitz就是pip install PyMuPDF ...def pyMuPDF_fitz(pdfPath, imagePath): startTime_pdf2img = datetime.datetime.... pdfDoc = fitz.open(pdfPa.
  • 【PyMuPDF和pdf2image】PythonPDF转图片

    万次阅读 多人点赞 2019-08-03 16:19:46
    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将...下面首先分享一下Python将PDF转换成图片,Java+PDFBox将PDF转图片 需求:我需要先将PDF转换成为PNG图片,并截取图片的一部分存储,然后...
  • pdf文件成文本 pdf文件按页图片 windows 这是个很小众的东西,网上很多都不能用,很折腾人。
  • 首先是库的导入: import os import sys import fitz from reportlab.lib.pagesizes import portrait from reportlab.pdfgen import canvas from PIL import Image 先进行 PDF 转图片的操作,使用 fitz 打开后缩放...
  • PDF转图片 from wand.image import Image,Color with Image(filename=file_path + '.pdf', resolution=300,background=Color('White')) as img: img.format = 'png' img.save(filename...
  • python3 pdf转图片

    千次阅读 2018-08-08 09:51:01
    开始的环境是 win10+python3环境。 试过用库imagemagick,其实没用上,因为imagemagick库我根本就没有装上。 之后又用到wand的库,编译成功了,但是运行时总是报错,无法识别pdf; 查找原因Wand是一个基于ctypes...
  • 今天为大家介绍一下如何使用利用python图片PDF转文字版PDF,这里我们需要用到python3.6,pypdf2,ghostscript,PythonMagick,百度文字识别服务和pdfkit
  • pdf 转换成图片在合并在一起。 把下载的poppler解压缩到指定目录 使用pip安装扩展库pdf2image:pip install pdf2image 本地安装:pip3 install ReportLab 网上安装:pip install rlextra -i ...
  • 下面小编就为大家分享一篇Pythonpdf转图片的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • pythonPDF转png图片

    2019-12-17 16:41:03
    pythonPDF转png图片: 调用第三方文件 :mutool 官方文档:https://mupdf.com/docs/manual-mutool-draw.html def convert_pdf_to_png(request_id, pdf_data,image_saving_path): # pdf_data pdf文件流。image_...
  • Pythonpdf转图片

    万次阅读 2017-09-29 17:23:15
    本篇文章记录如何使用pythonpdf文件切分成一张一张图片,包括环境配置、版本兼容问题。 环境配置(mac)安装ImageMagickbrew install imagemagick 这里有个坑,brew安装都是7.x版本,使用wand时会出错,需要你...
  • python图片转PDF

    2020-04-01 12:36:45
    发现网上的图片批处理和转pdf都要收费,自己用python就写了两段代码用。 图片旋转,调整大小,并保持灰度图 需要安装numpy 和 scikit-image from skimage import io, transform, color import numpy as np def ...
  • def pdf_to_img(): print("请输入pdf文件路径") # 需要转换的pdf文件路径 pdfPath = tkinter.filedialog.askopenfilename() father_path = os.path.abspath(os.path.dirname(pdfPath) + os.path.sep + ".") doc...
  • python版本的pdf转图片

    2019-09-20 14:18:36
    import os import numpy as np ...from pdf2image import convert_from_path def mkdir(path): # 去除首位空格 path = path.strip() # 去除尾部 \ 符号 path = path.rstrip("\\") # 判断路径是否存在...
  • Python2.7实现PDF转图片需求

    千次阅读 2018-10-25 14:44:41
    PDF转IMG需要两个Python模块:PyPDF2(1.26.0)和Wand(0.4.4),其中Wand安装前需要先安装软件ImageMagick,由于7.xx版本的接口改变,必须安装6.xx版本,以及GhostScript。PyPDF2和Wand可以直接使用pip安装,主要两个...
  • PDF转图片Python简单处理 from win32com import client import os path = r"C:\Users\user_Guest\Desktop\ky2020" #pdf文件所在目录 word = client.Dispatch('Word.Application') for pdf in os.listdir(path):...
  • PythonPDF转PNG图片

    2020-06-29 22:19:52
    下面的代码为PDF转成PNG图片的代码,upload_house_image()函数 def upload_house_image(request): from datetime import datetime import fitz url_list = [] # 因为PDF是多页图片,所以要用list类型将这些图片...
  • 实际上这个是pdf转图片的软件,wand只是对这个封装 反正也不用管太多,我们工作就是为了办事,管它是为什么呢。 https://imagemagick.org/script/download.php 第二步:安装ghostscript 不要pip安...
  • pythonpdf转png图片

    2021-02-25 10:40:01
    pdf按照图片保存。 代码 pdf_dir = [] chdir(Address) # 填文件地址 # 找pdf文件 docunames =listdir() # 读取该地址下的文件 if docunames == False: print("无文件") for docuname in docunames: # 遍历文件,...
  • Python 图片转pdf

    2019-01-30 18:23:00
    之前同事找图片转pdf的软件,想着之前做过一个命令行的,于是想写成一个界面工具。 之前代码写的用的是img2pdf。本来想着也用这个库,实际测试下来发现很多问题。弃用。google了下,发现有人用Pillow完成这个功能,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 471
精华内容 188
关键字:

pdf转图片python

python 订阅