精华内容
下载资源
问答
  • PDF转换器

    2018-10-03 12:50:51
    PDF转换器PDF转换器(Pdfconverter. exe)
  • pdf转换器

    2011-07-04 15:24:37
    pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器
  • PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器PDF转换器...
  • 全速txt转换成pdf转换器是一款功能齐全的pdf转换器,全速txt转换成pdf转换器同时也支持将PDF转换成Word、Excel、PPT、图片、文本等多种格式的转换,欢迎下载。全速TXT转换成PDF转换器是一键
  • 万能jpg转换成pdf转换器是一款界面简洁,操作方便的JPG转PDF转换工具。JPG转PDF转换器可方便的将各种流行的图片文件格式如 JPG,BMP,TIF,PNG,GIF等转换成PDF文件。万能jpg转换成pdf转换器
  • 全速PPT转pdf转换器是一款功能强大好用的PPT转PDF工具软件,能轻易的批量转换PowerPoint到PDF。全速PPT转PDF转换器是PowerPoint(PPT, PPTX, RTF, TXT, JPG)文档转换成PDF较佳解决方案。PPT转PDF转换器
  • 全速word转换成pdf转换器是一款功能强大好用的word转pdf软件工具,界面简单,功能稳定,全速word转换成pdf转换器支持批量转换,操作起来非常方便,支持多种流行文档格式之间转换。全速
  • 全速Excel转换成pdf转换器是一款功能强大好用的Excel转PDF软件工具,全速Excel转换成PDF转换器能让你转换各种Excel版本到PDF。它支持Excel 2010、Excel 2007、Excel 2003、Excel 2000和Excel 97的文件格
  • 全速JPG转pdf转换器是一款界面简洁,操作方便的JPG转PDF转换工具。全速JPG转PDF转换器可方便的将各种流行的图片文件格式如 JPG,BMP,TIF,PNG,GIF等转换成pdf文件。只需要将您的JPG或其他
  • 全能pdf转换器是一款非常给力的pdf转换器软件,支持把pdf文档转换为doc、xls、ppt、图片、txt文本文档、epub电子书等多种格式的文档,你只要把pdf文档拖动到软件的主窗口,然后再单击
  • 迅捷txt转换成pdf转换器txt转换成pdf转换器使您能够以电子邮件文件变化保护客户的较佳解决方案模式,复制打印店的介绍材料,缺少的字体或破损的布局没有任何麻烦。另外,从TXT到
  • 【kimol君的无聊小发明】—用python写PDF转换器

    万次阅读 多人点赞 2020-10-24 23:23:57
    【kimol君的无聊小发明】—用python写PDF转换器前言一、思路分析二、我的代码写在最后 前言 某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~ 当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码。我...

    【kimol君的无聊小发明】—用python写PDF转换器

    前言

    某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~
    当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码。我拍腿正坐,一个想法油然而生:“生活已然很无聊,不如再无聊些叭”。
    于是,我决定开一个专题,便称之为kimol君的无聊小发明
    妙…啊~~~

    想必小伙伴都经历过,当你想要把PDF转为WORD时,自己打字赫赫甩在你眼前:
    在这里插入图片描述
    不充钱就想白嫖?? 想得美~
    然而,kimol君是不会退缩的,毕竟迎难而上是传统美德。于是,今天的主题出来了:用python写一个PDF转WORD的小工具(基于某网站接口)。

    一、思路分析

    网上一搜,你可以发现很多PDF转换的工具,其中不乏在线转换的网站,比如这样的:
    在这里插入图片描述
    那么,通过网站提供的测试接口,我们便可以通过爬虫模拟的方式实现转换。
    没有错了~思路就是如此的简单明了,今天的主角便是:

    https://app.xunjiepdf.com
    

    通过抓包分析,知道这是一个POST请求,接下来用requests库模拟即可。
    需要注意的是,这个接口仅用于测试,所以可供转换的页面等都有所限制,如需更完整的功能还请支持原版。

    二、我的代码

    正所谓一万个coders,就有一万种codes,以下为我的代码,仅供参考。
    导入相关库:

    import time
    import requests
    

    定义PDF2Word类:

    class PDF2Word():
        def __init__(self):
            self.machineid = 'ccc052ee5200088b92342303c4ea9399'
            self.token = ''
            self.guid = ''
            self.keytag = ''
        
        def produceToken(self):
            url = 'https://app.xunjiepdf.com/api/producetoken'
            headers = {
                    'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0',
                    'Accept': 'application/json, text/javascript, */*; q=0.01',
                    'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
                    'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
                    'X-Requested-With': 'XMLHttpRequest',
                    'Origin': 'https://app.xunjiepdf.com',
                    'Connection': 'keep-alive',
                    'Referer': 'https://app.xunjiepdf.com/pdf2word/',}
            data = {'machineid':self.machineid}
            res = requests.post(url,headers=headers,data=data)
            res_json = res.json()
            if res_json['code'] == 10000:
                self.token = res_json['token']
                self.guid = res_json['guid']
                print('成功获取token')
                return True
            else:
                return False
        
        def uploadPDF(self,filepath):
            filename = filepath.split('/')[-1]
            files = {'file': open(filepath,'rb')}
            url = 'https://app.xunjiepdf.com/api/Upload'
            headers = {
                    'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0',
                    'Accept': '*/*',
                    'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
                    'Content-Type': 'application/pdf',
                    'Origin': 'https://app.xunjiepdf.com',
                    'Connection': 'keep-alive',
                    'Referer': 'https://app.xunjiepdf.com/pdf2word/',}
            params = (
                    ('tasktype', 'pdf2word'),
                    ('phonenumber', ''),
                    ('loginkey', ''),
                    ('machineid', self.machineid),
                    ('token', self.token),
                    ('limitsize', '2048'),
                    ('pdfname', filename),
                    ('queuekey', self.guid),
                    ('uploadtime', ''),
                    ('filecount', '1'),
                    ('fileindex', '1'),
                    ('pagerange', 'all'),
                    ('picturequality', ''),
                    ('outputfileextension', 'docx'),
                    ('picturerotate', '0,undefined'),
                    ('filesequence', '0,undefined'),
                    ('filepwd', ''),
                    ('iconsize', ''),
                    ('picturetoonepdf', ''),
                    ('isshare', '0'),
                    ('softname', 'pdfonlineconverter'),
                    ('softversion', 'V5.0'),
                    ('validpagescount', '20'),
                    ('limituse', '1'),
                    ('filespwdlist', ''),
                    ('fileCountwater', '1'),
                    ('languagefrom', ''),
                    ('languageto', ''),
                    ('cadverchose', ''),
                    ('pictureforecolor', ''),
                    ('picturebackcolor', ''),
                    ('id', 'WU_FILE_1'),
                    ('name', filename),
                    ('type', 'application/pdf'),
                    ('lastModifiedDate', ''),
                    ('size', ''),)
            res= requests.post(url,headers=headers,params=params,files=files)
            res_json = res.json()
            if res_json['message'] == '上传成功':
                self.keytag = res_json['keytag']
                print('成功上传PDF')
                return True
            else:
                return False
            
        def progress(self):
            url = 'https://app.xunjiepdf.com/api/Progress'
            headers = {
                    'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0',
                    'Accept': 'text/plain, */*; q=0.01',
                    'Accept-Language': 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
                    'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
                    'X-Requested-With': 'XMLHttpRequest',
                    'Origin': 'https://app.xunjiepdf.com',
                    'Connection': 'keep-alive',
                    'Referer': 'https://app.xunjiepdf.com/pdf2word/',}
            data = {
                  'tasktag': self.keytag,
                  'phonenumber': '',
                  'loginkey': '',
                  'limituse': '1'}
            res= requests.post(url,headers=headers,data=data)
            res_json = res.json()
            if res_json['message'] == '处理成功':
                print('PDF处理完成')
                return True
            else:
                print('PDF处理中')
                return False
            
        def downloadWord(self,output):
            url = 'https://app.xunjiepdf.com/download/fileid/%s'%self.keytag
            res = requests.get(url)
            with open(output,'wb') as f:
                f.write(res.content)
                print('PDF下载成功("%s")'%output)
                
        def convertPDF(self,filepath,outpath):
            filename = filepath.split('/')[-1]
            filename = filename.split('.')[0]+'.docx'
            self.produceToken()
            self.uploadPDF(filepath)
            while True:
                res = self.progress()
                if res == True:
                    break
                time.sleep(1)
            self.downloadWord(outpath+filename)
    

    执行主函数:

    if __name__=='__main__':    
        pdf2word = PDF2Word()
        pdf2word.convertPDF('001.pdf','')
    

    注意:convertPDF函数有两个参数,第一个为需要转换的PDF,第二个参数为转换后的目录。
    run一下,一键入魂,".docx"文件已经躺在了我的目录中,舒服了~
    在这里插入图片描述

    写在最后

    最后,感谢各位大大的耐心阅读,咋们下次再会~

    创作不易,大侠请留步… 动起可爱的双手,来个赞再走呗 (๑◕ܫ←๑)

    展开全文
  • 迅捷excel转换成pdf转换器是一款将各种Excel版本转换到PDF格式的软件,该软件操作简单易用,支持将多格式Excel转换到PDF ,支持Excel 2010、Excel 2007、Excel 2003、Excel 2000和Excel 97的excel文件转
  • 星如pdf转换器软件是一款界面简洁,操作方便的PDF格式转换工具。只需要将你的其他格式文件添加到PDF转换器窗口中,点击开始转换按钮,转换立刻就开始,您只需喝一杯咖啡,所有转
  • PPT转PDF转换器批量支持转换PowerPoint到PDF格式之间的转换。它是PowerPoint(PPT, PPTX, RTF, TXT, JPG)文档转换成PDF较佳解决方案。PPT转PDF转换器能让你转换各种PowerPoint格式到PDF。它支持PowerPoint格
  • pdf转换器1

    2018-01-04 22:21:10
    pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器pdf转换器
  • PDF转换器是一款pdf转换器PDF转换器让您的工作效率和质量得到更好的提升与便捷!方便您的下载与使用,转换识别率高,复杂的PDF文件一瞬间保持原样快速转换,让您更高效丶更有效
  • PDF转换器PDF转换器

    2010-04-11 21:58:21
    很好用的破地方转换器,大家可以试试,PDF转换器
  • pdf转换器软件的转换效果非常出众,其采用的深度解析技术,对于复杂的pdf文件内容也可以做到有效转换。迅捷PDF转换器基于深度PDF转换技术的转换核心,采用了先进的超线程技术,融
  • pdf转换器图片转换

    2019-02-02 12:00:51
    pdf转换器图片转换WORD等文档,或将WORD等文档转换成PDF
  • 1XG批量WORD转PDF转换器是一款Windows平台下的Word转PDF转换工具,它可以方便快捷地快速性将多个Word文件转换成PDF格式文件。由于软件抛弃了传统虚拟打印生成PDF的方法,而采用直接分析
  • 转换宝word转换成pdf转换器,可将word格式、excel格式、jpg图片格式、批量转换成pdf格式、特点:速度快质量好。
  • word转PDF转换器

    2018-05-29 14:17:39
    word转PDF转换器word转PDF转换器word转PDF转换器word转PDF转换器word转PDF转换器word转PDF转换器word转PDF转换器word转PDF转换器
  • 功能比较全的PDF转换器,支持多页转换,没有付费
  • 迅捷pdf编辑器,迅捷pdf转换器二合一 迅捷数据恢复 迅捷PDF虚拟打印机 迅捷视频格式转换工具 word转pdf,excel转pdf 迅捷PDF转换器加 自测正常使用方便简单 迅捷全能包
  • 靖源ppt2gif/ppt2pdf转换器,一款专业的批量处理Microsoft Office PowerPoint的ppt/pptx文件到bmp/jpg/png/gif/tif/pdf的转换软件,支持生成gif动画,支持生成多页tif/pdf.需要Microsoft Office PowerPoint的支持。
  • pdf转word软件 pdf to word工具 pdf转换器 简单实用 终身免费!这是一款pdf转doc工具。使用它你可以快速的将PDF转换为Word的DOC文档格式的电子文档!是一款不可多得的pdf转doc软件呢!还在为PDF转换为WORD苦恼么?还...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 10,841
精华内容 4,336
关键字:

pdf转换器