doc linux 转pdf_linux doc转 pdf - CSDN
  • [root@manage-host ~]# wgethttp://mirrors.ustc.edu.cn/tdf/libreoffice/stable/6.3.0/rpm/x86_64/LibreOffice_6.3.0_Linux_x86-64_rpm.tar.gz 2、解压 [root@manage-host ~]# tar xzvf LibreOffice_6.3.0...

    1、下载两个包

    [root@manage-host ~]# wget http://mirrors.ustc.edu.cn/tdf/libreoffice/stable/6.3.0/rpm/x86_64/LibreOffice_6.3.0_Linux_x86-64_rpm.tar.gz

    2、解压

    [root@manage-host ~]# tar xzvf LibreOffice_6.3.0_Linux_x86-64_rpm.tar.gz

    3、安装

    [root@manage-host ~]#  yum -y install cairo cups (安装依赖包)

    [root@manage-host ~]# cd /root/LibreOffice_6.3.0.4_Linux_x86-64_rpm/RPMS

    [root@manage-host RPMS]# yum -y install *.rpm

    4、配置命令

    [root@localhost ~]# ll /usr/bin/libreoffice6.3 
    lrwxrwxrwx 1 root root 35 Aug 14 09:46 /usr/bin/libreoffice6.3 -> /opt/libreoffice6.3/program/soffice
    [root@localhost ~]# ln -s /opt/libreoffice6.3/program/soffice /usr/bin/libreoffice

    5、此时我们就可以执行切换命令

    [root@manage-host ~]# libreoffice --invisible --convert-to pdf --outdir 输出目录/pdf 运营数据周汇报2019-04-01-2019-04-10.doc

    此时出现乱码问题

    解决办法:

    yum groupinstall "fonts"

    vim /etc/locale.conf (把内容改为以下内容)

    LANG="zh_CN.UTF-8"

    然后重启服务器,最终乱码问题解决

     

    展开全文
  • @linux下docx转pdf下docx转pdf #linux下docx转pdf下docx转pdf 这是本人的第一篇博客,之前做docx转pdf的时候痛苦了很多,跟我们的项目经理讨教,才得出一个方案就是利用Liunx下的libreoffice去。 import os os....

    @linux下docx转pdf下docx转pdf

    #linux下docx转pdf下docx转pdf

    这是本人的第一篇博客,之前做docx转pdf的时候痛苦了很多,跟我们的项目经理讨教,才得出一个方案就是利用Liunx下的libreoffice去转。
    

    import os
    os.system(“libreoffice --invisible --convert-to pdf --outdir /home/wanxing/Desktop/ /home/wanxing/Desktop/demo.docx”)

    使用命令转换时候需要保证libreoffice没有被打开
    通过命令行调用liberoffer 注意中文不显示,中文乱码,需要添加相应的中文字体呦

    分享一篇帮助本人解决中文字体的博客https://blog.csdn.net/zapperstab/article/details/18602969
    一行代码解决了我所有的问题

    展开全文
  • 1.问题:项目在线浏览使用的是flexpaper,但是浏览doc(包含doc转成的pdf)在linux(openoffice,也曾换过 LibreOffice)下部署时候是不正常的,项目window部署正常。。仅仅是doc格式 2.可以确认的是 doc-->pdf-->swf ...
  • 今天在工作中遇到利用aspose doc转pdflinux下汉字出现小方框问题,现在讲解下解决办法。 在实例化doc时需要加上红色代码。问题解决 

        今天在工作中遇到利用aspose doc转成pdf在linux下汉字出现小方框问题,现在讲解下解决办法。

    首先在服务器上把生成的pdf下载下来,分析pdf编码:



    然后在linux安装该字体


    这些都试了之后发现还不是不行,就去找了下aspose源码,发现代码中还缺失了一行


     FontSettings.setFontsFolder(ClassPathUtil.getClassesPath() + "font" + File.separator, true);

      在实例化doc时需要以上代码,问题成功解决。(注:Linux上还需要安装字体,不然也会出现方框)

     

    展开全文
  • word转换pdf的技术方案,供参考。【doc/docx/ppt/pptx/xls/xlsx均支持转换】 本方案是Java结合shell命令完成,不同于以往的仅依赖java组件转换或打印pdf的方案,需要目标服务器安装office套件,可选方案有...
    word转换pdf的技术方案,供参考。【doc/docx/ppt/pptx/xls/xlsx均支持转换】
     
            本方案是Java结合shell命令完成,不同于以往的仅依赖java组件转换或打印pdf的方案,需要目标服务器安装office套件,可选方案有OpenOffice和LibreOffice[二者源是一家产品],安装完office套件后,使用office提供的脚本完成转换。安装LibreOffice时,为避免复杂的依赖关系,建议采用yum方式安装:yum install libreoffice
     
            脚本内容:soffice --headless --invisible --convert-to pdf 源office文档路径 --outdir 目录存储目录

     
    需要将以上脚本编写成sh脚本的形式,其中源路径需要配置成参数,由Java程序调用sh脚本时传入,转换结束后,到指定的目录可取到同名的pdf文档,再进行与业务相关的逻辑处理。注:临时目录需要定期清理,防止存储过多临时文档,导致磁盘占满。

    Java调用代码:

     

    Java代码  收藏代码
    1.   try {  
    2.             String shpath = "/tmp/topdf.sh";//脚本路径,脚本中需要将源doc路径配置成变量,由下行程序调用时入参  
    3. String cmd = "param";//xshell脚本入参  
    4.             Process ps = Runtime.getRuntime().exec(shpath,cmd);//  
    5.             ps.waitFor();//等待转换结果  
    6.   
    7.             BufferedReader br = new BufferedReader(new InputStreamReader(ps.getInputStream()));  
    8.             StringBuffer sb = new StringBuffer();  
    9.             String line;  
    10.             while ((line = br.readLine()) != null) {  
    11.                 sb.append(line).append("\n");  
    12.             }  
    13.             String result = sb.toString();  
    14.             System.out.println(result);  
    15.         } catch (Exception e) {  
    16.             e.printStackTrace();  
    17.         }  
     

     

    Shell脚本代码  收藏代码
    1. #!/bin/sh    
    2.     
    3. source=$1  
    4. echo ${source}   
    5. soffice --headless --invisible --convert-to pdf ${source} --outdir /tmp/  
     

     

    但发现运行一段时间命令不再响应,没有文档结果。经检查服务器,libreoffice运行良好,但soffice --convert-to 命令就是无响应无输出。查看活跃线程如下:

     


     

    有两个相关的活跃实例在运行。

     

    经翻阅资料,这是LO在2011年产生的一个bug,相关bug list 参考:

    https://bugs.documentfoundation.org/show_bug.cgi?id=37531 

     

    https://bugs.documentfoundation.org/show_bug.cgi?id=45026     


     

    大体意思是LO GUI实例一旦运行过一个,再运行一个实例的话,就会出现无响应的问题。解决思路有两个:

    1、杀掉所有的libreoffice实例,即将上面的两个实例杀掉

    2、执行命令时增加一行参数,经测试下面两条命令均可以执行【必须保证命令的执行要有权限】:

    soffice --headless --convert-to pdf ${source-file} --outdir ${target-path}  "-env:UserInstallation=file:///tmp/LibreOffice_Conversion_${USER}"

    soffice --headless --convert-to pdf ${source-file} --outdir ${target-path}  -env:UserInstallation=file:///home/user/.libreoffice-alt     

    欢迎加入我的星球

    程序员,除了编码,生活还应该有沉淀!

    展开全文
  • 先安装libreoffice,然后使用命令 soffice --headless --invisible --convert-to pdf /tmp/abc.docx --outdir /tmp/ ...root@panda-dev:~/bin $ soffice --headless --convert-to txt:text blah.doc /us

    先安装libreoffice,然后使用命令

    soffice --headless --invisible --convert-to pdf /tmp/abc.docx --outdir /tmp/

    转换成PDF,几乎所有人都遇到


    root@panda-dev:~/bin $ soffice --headless --convert-to txt:text blah.doc
    /usr/lib64/libreoffice/program/soffice.bin X11 error: Can't open display:
       Set DISPLAY environment variable, use -display option
       or check permissions of your X-Server
       (See "man X" resp. "man xhost" for details)

    类似的问题,网上的帮助都是说要求启用:


    /usr/bin/soffice --headless --accept="socket,host=127.0.0.1,port=8100;urp;" --nofirststartwizard &


    然后 export DISPLAY=:0.0,就可以解决问题,但试了N次也完全不行。


    其实只需要 yum install libreoffice-headless,即可。


    展开全文
  • Linux读取pdf,pdf转txt

    2019-11-22 14:24:56
    说明 在linux上快速读取pdf,打印pdf内容,将pdf转换为txt 工具:pdftotext 安装 ...将pdf转成txt pdftotext -enc UTF-8 XXX.pdf XXX.txt 将pdf内容打印出来 pdftotext -enc UTF-8 XXX.pdf - ...
  • python Word文件转换为pdf文件(doc/docx文件转化为pdf文件)# -*- encoding: utf-8 -*- import os from win32com import client #pip instatll win32com def doc2pdf(doc_name, pdf_name): """ :...
  • 本文章实现不同环境,word文档转pdf文档 文章目录一、linux环境1、环境安装2、测试安装是否成功:问题汇总:1、linux系统缺少中文字体导致2、禁用libreoffice屏幕显示(不一定管用)二、windows环境1、环境安装三、...
  • 在做项目时遇到了要在linux环境下将word文件转换为pdf进行文件预览,这个文件不仅能将word文件转换,还能将TXT、xlsx文件转换,而且linux与Windows支持的都挺好。
  • Linux下word转pdf中文乱码问题 最近在做在线预览office文档功能,遇到的问题在这里记录一下。 在用unoconv做文档转换时,发现中文转换乱码。 找到最多的办法就是把 windows 下的字体全部拷贝到Linux字体库中并使之...
  • doc是一种常见的文档编辑格式,但是网页不能直接doc文档,同时为了保持视觉效果,便考虑自动转换docpdf并用js控件显示出来。 此任务分3步 1:将文档上传并辨识文档结构 2:将文档转换为pdf并记录保存地址 3:...
  • 我这里使用的包是aspose-words-15.8.0-jdk16.jar和文件license.xml(用于去水印,放在项目的resources下) license.xml <Product>Aspose.Total for Java <Product>
  • linux pdftotxt工具介绍 1、centos安装pdftotxt工具 @shell yum install poppler-utils 2、Debian / Ubuntu安装pdftotxt工具 sudo apt-get install poppler-utils 3、pdftotext 使用语法 pdftotext {PDF-file} {...
  • 1.当文档中含有中文字符时,不管是使用Spire.Pdf或Aspose-Words实现Word转换Pdf,代码的执行都需要调用操作系统的本地字体库支持,否则所有中文字符都将乱码 该段代码如果想要在Linux服务器上完美运行,需要给Linux...
  • 摘要:工作中需要将word 模板的合同,替换内容,转为pdf 文件,用于查看与打印,并寄送给... 后面发现不管怎么调编码都没有用,后面怀疑是 字体问题,(就是在转pdf时,需要用到相应的字体来显示原生word中的字体设置效
  • 1、安装unoconv 命令:sudo apt-get install unoconv 2、安装imagemagick 命令:sudo apt-get install imagemagick 3、检测imagemagick是否安装成功 ...(1)将odt文件pdf文件,命令:unocon...
  • LinuxPDF操作与转换

    2019-01-08 10:28:14
    如果说PDF是电子纸张,那么pdftk就是电子起钉器、打孔机、粘合剂、解密指环和 X光镜片。Pdftk是一个简单的工具,可以对PDF文档进行各种日常操作。Pdftk可以让你简单而自由地操作PDF。它不需要Acrobat,并且可 以运行...
  • python源码实现doc转化pdf #-*- coding:utf-8 -*- # doc2pdf.py: python script to convert doc to pdf with bookmarks! # Requires Office 2007 SP2 # Requires python for win32 extension import sys, os ...
  • 项目中基于Spire.Doc封装工具类实现实现Word转换Pdf? 一、Spire.Doc是什么? 1.Spire.Doc是成都冰蓝科技有限公司开发的一款简单易用、功能强大的Word文档编辑工具,有免费版本和收费版本,以下演示基于免费版本 2.相...
1 2 3 4 5 ... 20
收藏数 18,642
精华内容 7,456
关键字:

doc linux 转pdf