精华内容
下载资源
问答
  • word下图片格式批量设置

    千次阅读 2019-05-30 13:58:15
    2.打开word“文件”-中的“选项”卡,选择“自定义功能”,设置为“所有命令”,选择“选择多个对象”,自定义功能区在“开始”面板“新建组”,将“选择多个对象”添加至此。 3.在“开始”选项卡,...

    本文介绍三种方法。

    一、利用软件,如BatchDoc,可以快速批量的设置图片格式。

    二、word自带功能

    1.将word格式另存为97-2003的格式,即后缀名为doc,非docx。

    2.打开word“文件”-中的“选项”卡,选择“自定义功能”,设置为“所有命令”,选择“选择多个对象”,自定义功能区在“开始”面板下“新建组”,将“选择多个对象”添加至此。

    3.在“开始”选项卡下,点击刚刚添加的“选择多个对象”功能,在弹出的对话框中选择“全选”,点击“确定”。在一大摞图片上右键点击鼠标,选择“设置自选图形/图片格式“,在弹出的对话框中更改“大小”等样式,所有的图片都会发生改变。
    *注: 在设置所有的图片的“大小”时一定要记得打开“锁定纵横比”。因为你插入的多张图片的长宽比可能不同,如果不锁定纵横比,会导致部分图片被拉长或压扁,影响图片质量。

     

    三、使用VBA宏命令。

    1.首先将所有的图片格式转为嵌入式,这样才能设置如居中等格式。参考下列代码。

    Sub 图片版式转换()
        Dim oShape As Variant, shapeType As WdWrapType
        On Error Resume Next
        If MsgBox("Y将图片由嵌入式转为浮动式,N将图片由浮动式转为嵌入式", 68) = 6 Then
            shapeType = Val(InputBox(Prompt:="请输入图片版式:0=四周型,1=紧密型, " & vbLf & _
                                             "3=衬于文字下方,4=浮于文字上方", Default:=0))
            For Each oShape In ActiveDocument.InlineShapes
                Set oShape = oShape.ConvertToShape
                With oShape
                    Select Case shapeType
                    Case 0, 1
                        .WrapFormat.Type = shapeType
                    Case 3
                        .WrapFormat.Type = 3
                        .ZOrder 5
                    Case 4
                        .WrapFormat.Type = 3
                        .ZOrder 4
                    Case Else
                        Exit Sub
                    End Select
                    .WrapFormat.AllowOverlap = False    '不允许重叠
                End With
            Next
        Else
            For Each oShape In ActiveDocument.Shapes
                oShape.ConvertToInlineShape
            Next
        End If
    End Sub

    2.批量设置图片格式

    Sub 图片居中()
    Dim iSha As InlineShape
    For i = 1 To ActiveDocument.Paragraphs.Count
        If ActiveDocument.Paragraphs(i).Range.InlineShapes.Count > 0 Then
            With ActiveDocument.Paragraphs(i).Format '在这里可以设置图片的格式
                .CharacterUnitFirstLineIndent = 0
                
                .FirstLineIndent = 0
                .LeftIndent = 0
                .Alignment = wdAlignParagraphCenter
             End With
            End If
    Next i
    End Sub

    注意,对于不需要进行批量设置的图片,比如文本行中像素较小和文字混在一块的图片,可根据实际情况设置过滤条件,比如图片的高度

    展开全文
  • Word下修改默认新建样式模板方法

    万次阅读 2018-07-12 08:29:35
    在使用word过程中,发现新建的word文档默认正文、标题1、标题2等默认样式表字体、行间距等设置都不是很符合我平时的文档需求,每次新建一个文档之后都需要修改一遍这些样式表属性,因此本文主要目的是修改在新建word...

    在使用word过程中,发现新建的word文档默认正文、标题1、标题2等默认样式表字体、行间距等设置都不是很符合我平时的文档需求,每次新建一个文档之后都需要修改一遍这些样式表属性,因此本文主要目的是修改在新建word文档时默认载入的模板文件,从而实现自定义字体样式的效果。

    环境说明

    操作系统:Windows10
    Office版本:Office2016

    修改流程

    方法一:在现有Word默认模板文件上修改

    1、找到新建word时默认载入的模板文件
    文件名: Normal.dotm
    文件路径: C:\Users\< user_name >\AppData\Roaming\Microsoft\Templates
    其中< user_name >根据你自己电脑的用户名修改;
    2、备份一份Normal.dotm文件在原路径,并拷贝一份Normal.dotm文件至桌面,双击打开;
    3、修改打开后的Normal.dotm文档,按照修改常见的word文档一样的方法,修改正文、标题等的样式表为常用的格式;
    4、按下Ctrl+S键,会自动弹出另存为对话框,选择保存类型为“启用宏的Word模板(*.dotm)”,文件名为默认的Doc1.dotm注意此时不能直接改为Normal.dotm,可能会导致修改失败

    5、用新修改后的Doc1.dotm模板文件改名替换原来的Normal.dotm文件,完成默认模板修改
    6、此时再新建Word文档时,会自动载入修改后的Normal.dotm模板文件,此时的字体样式都是修改后的样式了!
    注意: 在修改和替换Normal.dotm文件时要关闭其他Word文档。

    方法二:直接修改.doc文件

    除了在现有Word默认模板文件Normal.dotm上修改,也可以直接修改一个.doc即Word文档。

    比如拿到别人的一个Word文档,觉得该文档字体样式都设置的挺好,符合自己平时的需求,就可以直接对该文件的字体样式进行修改,然后另存为一个**启用宏的Word模板(*.dotm)**文件,命名为Normal.dotm,然后替换掉原来的Word默认模板文件即可。

    其实在文档编辑过程中,主要的字体样式就那么几种,包括:正文样式、一级标题、二级标题、三级标题、图表题注样式、公式样式以及无间隔样式(在正文样式中设置了1.5倍行距插入图片显示不全时有用)等。所以我已经制作好了一个模板文件,按照一般毕业论文的字体样式要求定义了上述各种字体样式。
    在这里插入图片描述
    该模板文件资源下载链接:Word模板下载

    展开全文
  • Word 取消高亮度显示

    千次阅读 2012-06-22 14:34:00
    以下VBA代码会高亮度显示“Microsoft Word” Sub HighLight() Dim rang As Range Dim fnd As Find Set rang = ActiveDocument.Range Set fnd = rang.Find fnd.Text = "Microsoft Word" fnd.MatchWholeWord = True ...

    以下VBA代码会高亮度显示“Microsoft Word”

    Sub HighLight()
    Dim rang As Range
    Dim fnd As Find
    
    Set rang = ActiveDocument.Range
    Set fnd = rang.Find
    fnd.Text = "Microsoft Word"
    fnd.MatchWholeWord = True
    fnd.HitHighlight ("Microsoft Word")
    
    Set fnd = Nothing
    Set rang = Nothing
    End Sub

    如果要取消对“Word”的高亮度显示你可能会这样写:

    Sub CleanHighLight1()
    Dim rang As Range
    Dim fnd As Find
    
    Set rang = ActiveDocument.Range
    Set fnd = rang.Find
    fnd.Text = "Word"
    fnd.MatchWholeWord = True
    fnd.HitHighlight ("Word")
    fnd.ClearHitHighlight
    
    Set fnd = Nothing
    Set rang = Nothing
    End Sub

    结果你会发现你所有的高亮度显示都会不见了。这是因为第二个程序中的Find和第一个程序中的Find作用范围是一样的。所以当你取消高亮的时候所有的高亮显示都回被取消。真确的写法应该是这样的:

    Sub CleanHighLight2()
    Dim rang As Range
    Dim fnd As Find
    Dim subr As Range
    
    Set rang = ActiveDocument.Range
    Set fnd = rang.Find
    While fnd.Execute("Word")
    rang.Select
    With rang.Find
    .Text = "Word"
    .ClearHitHighlight
    End With
    Wend
    
    Set fnd = Nothing
    Set rang = Nothing
    End Sub



    展开全文
  • Word Embedding与Word2Vec

    万次阅读 多人点赞 2017-09-05 02:39:43
    随着深度学习的兴起,研究人员开始设计基于神经网络的词嵌入方法,其中最为重要,也是当前最流行的Word Embedding方法就是Tomas Mikolov在谷歌工作时发明的Word2Vec方法,同时谷歌还开源了Word2Vec这个工具箱的源码...

    一、数学上的“嵌入”(Embedding)


    Embed这个词,英文的释义为, fix (an object) firmly and deeply in a surrounding mass, 也就是“嵌入”之意。例如:One of the bullets passed through Andrea's chest before embedding itself in a wall.


    另外,这个词(的分词形式)在数学上也是一个专有名词,Embedding,它广泛存在于包括代数、拓扑与几何等诸多数学领域。它主要表征某个数学结构中的一个实例被包含在另外一个实例中,例如一个group它同时又是一个subgroup。


    当我们说某个对象 X 被嵌入到另外一个对象 Y 中, 那么 embedding 就由一个单射的、结构保持的(structure-preserving)映射 f : XY 来给定的。此处的结构保持的具体含义要依赖于XY 是哪种数学结构的实例而定。


    举个例子:我们可以把整数“嵌入”进有理数之中。显然,整数是一个group,同时它又是有理数的一个subgroup。整数集合中的每个整数,在有理数集合中都能找到一个唯一的对应(其实就是它本身)。同时,整数集合中的每个整数所具有的性质,在有理数中同样得到了保持。同理,我们也可以把有理数“嵌入”到实数中去。


    二、词嵌入(Word Embedding)


    前面我们之所以要讨论Embedding在数学上的意思,就是因为这名称其实特别具有一种误导性,尤其是在翻译成中文的时候会令汉语思维下的我们更加难于把握住它的本质。

    Word Embedding并不是要把单词像贴瓷砖那样镶嵌进什么地方。更重要的是,我们在把单词嵌入进另外一个空间时,要做到单射和structure-preserving,或者说我们更专注的是映射关系,而最终得到每个单词在另外一个空间中的表达也仅仅是之前设计好的映射关系的很自然的表达。

    Word embedding 是NLP中一组语言模型(language modeling)和特征学习技术(feature learning techniques)的总称,这些技术会把词汇表中的单词或者短语(words or phrases)映射成由实数构成的向量上。

    最简单的一种Word Embedding方法,就是基于词袋(BOW)的One-Hot表示。这种方法,把词汇表中的词排成一列,对于某个单词 A,如果它出现在上述词汇序列中的位置为 k,那么它的向量表示就是“第 k 位为1,其他位置都为0 ”的一个向量。

    例如,有语料库如下:

    John likes to watch movies. Mary likes movies too.

    John also likes to watch football games.

    把上述语料中的词汇表整理出来并排序(具体的排序原则可以有很多,例如可以根据字母表顺序,也可以根据出现在语料库中的先后顺序)

    假设我们的词汇表排序结果如下:

    {"John": 1, "likes": 2, "to": 3, "watch": 4, "movies": 5, "also":6, "football": 7, "games": 8, "Mary": 9, "too": 10}

    那么则有如下word的向量表示:
    John: [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    likes: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
    ……
    此时,你也可以进一步地把文档也表示成向量。方法就是直接将各词的词向量表示加和,于是则有原来的两句话的向量表示如下:

    [1, 2, 1, 1, 2, 0, 0, 0, 1, 1]

    [1, 1, 1, 1, 0, 1, 1, 1, 0, 0]


    One-hot方法很简单,但是它的问题也很明显:

    1)它没有考虑单词之间相对位置的关系;

    2)词向量可能非常非常长!

    针对第一个问题,你可能会想到n-gram方法,这确实是一个策略,但是它可能会导致计算量的急剧增长。因为n-gram已经在之前的文章中解释过了,下面我们来看另外一个方法:共现矩阵 (Cocurrence matrix)。


    一个非常重要的思想是,我们认为某个词的意思跟它临近的单词是紧密相关的。这是我们可以设定一个窗口(大小一般是5~10),如下窗口大小是2,那么在这个窗口内,与rests 共同出现的单词就有life、he、in、peace。然后我们就利用这种共现关系来生成词向量。


    例如,现在我们的语料库包括下面三份文档资料:

    I like deep learning.

    I like NLP.

    I enjoy flying.

    作为示例,我们设定的窗口大小为1,也就是只看某个单词周围紧邻着的那个单词。此时,将得到一个对称矩阵——共现矩阵。因为在我们的语料库中,I 和 like做为邻居同时出现在窗口中的次数是2,所以下表中I 和like相交的位置其值就是2。这样我们也实现了将word变成向量的设想,在共现矩阵每一行(或每一列)都是对应单词的一个向量表示。

    虽然Cocurrence matrix一定程度上解决了单词间相对位置也应予以重视这个问题。但是它仍然面对维度灾难。也即是说一个word的向量表示长度太长了。这时,很自然地会想到SVD或者PCA等一些常用的降维方法。当然,这也会带来其他的一些问题,例如,我们的词汇表中有新词加入,那么就很难为他分配一个新的向量。但这并非本文要讨论的重点,我们不再赘述。


    三、Word2Vec

    我们已经见识了两种词嵌入的方式。而现在最常用、最流行的方法,就是Word2Vec。这是Tomas Mikolov在谷歌工作时发明的一类方法,也是由谷歌开源的一个工具包的名称。具体来说,Word2Vec中涉及到了两种算法,一个是CBOW一个是Skip-Gram。这也是因为深度学习流行起来之后,基于神经网络来完成的Word Embedding方法。

    Word2Vec之所以现在这么流行,不同于之前的一些Word Embedding方法,它能够自动实现:1)单词语义相似性的度量;2)词汇的语义的类比。此处,语义的类比,反应的是类似下面这种关系:
    • “国王” – “王后” ≈ “男” – “女”
    • “英国” “伦敦” ≈ “法国” “巴黎” “首都”
    如果用图形来表示,即如下图所示:

    对于Skip-Gram模型来说,它是要Generates each word in context given centre word。如下图所示:

    所以总概率定义为:

    其中下标denotes position in running text. 对于每个单词而言,则有


    对于CBOW模型来说,Condition on context, and generate centre word。如下图所示:

    要细抠Skip-GramCBOW的话,恐怕还需要很长篇幅和太多细节上的讨论,这一点留待后续文章中再来另行讨论。下面我们将在Python中实际使用一下Word2Vec,这就要简单许多了,因为我们可以直接使用gensim [1]。注意我们用来训练模型的语料库是NLTK中的Brown语料库。实际中要获得更高质量的模型,往往意味着需要更大的语料库,当然这也意味着更多的训练时间。
    import gensim, logging, os
    logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
    
    import nltk
    corpus = nltk.corpus.brown.sents()
    
    fname = 'brown_skipgram.model'
    if os.path.exists(fname):
        # load the file if it has already been trained, to save repeating the slow training step below
        model = gensim.models.Word2Vec.load(fname)
    else:
        # can take a few minutes, grab a cuppa
        model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50) 
        model.save(fname)
    
    
    现在已经得到模型了,接下来我们来评估一下这个模型的质量。我们要评估一下下面这几个词之间的相近(或伴随)程度。
    words = "woman women man girl boy green blue did".split()
    for w1 in words:
        for w2 in words:
            print(w1, w2, model.similarity(w1, w2))
    输出的结果如下:
    woman woman 1.0
    woman women 0.3451595268
    woman man 0.607956254336
    woman girl 0.761190251497
    woman boy 0.558522930154
    woman green 0.24118403927
    woman blue 0.178044251325
    woman did 0.0751838683173
    women woman 0.3451595268
    women women 1.0
    women man 0.126646555737
    women girl 0.292825346454
    women boy 0.298552943639
    women green 0.104096393379
    women blue 0.0930137564485
    women did 0.152766770859
    注意:输出内容较长,这里不全部列出,读者可以执行尝试并观察输出结果... ...
    
    当然,你也可能希望有一个更直观的表示,所以不妨试试图形化的结果显示:
    import numpy as np
    import matplotlib.pyplot as plt
    %matplotlib inline
    
    M = np.zeros((len(words), len(words)))
    for i, w1 in enumerate(words):
        for j, w2 in enumerate(words):
            M[i,j] = model.similarity(w1, w2)
            
    plt.imshow(M, interpolation='nearest')
    plt.colorbar()
    
    ax = plt.gca()
    ax.set_xticklabels([''] + words, rotation=45)
    ax.set_yticklabels([''] + words)
    所绘制的结果如下:

    你也可以从词汇表中提取出跟某个单词(例如woman)最相关的k个词:
    model.most_similar(positive=['woman'], topn=10)
    输出之结果如下:
    [('girl', 0.7611901760101318),
     ('man', 0.6079562902450562),
     ('lady', 0.6069421768188477),
     ('boy', 0.5585228800773621),
     ('child', 0.5556907653808594),
     ('person', 0.5444432497024536),
     ('young', 0.5219132900238037),
     ('pair', 0.5211296081542969),
     ('she', 0.5175711512565613),
     ('fellow', 0.5115353465080261)]

    现在你也可以试着来玩一下Word2Vec啦!


    参考:
    [1]   https://radimrehurek.com/gensim/


    (本文完)

    展开全文
  • 在项目需求中,需要对于一个word模板文档生成相对应的word文件,而此word模板是多页的并且需要在最终文件中生成相应的目录,由于项目环境是Linux,所以舍弃了jacob(windows环境)。然后主要是研究了Apache poi 进行...
  • POI读取 word 2003 和 word 2007 的例子

    千次下载 热门讨论 2009-07-26 16:18:31
    这是一个POI读取word 2003 和 word 2007的例子,是一个Eclipse工程,下载后直接导入工程,运行 src 目录的 Test.java 类即可, 这个 rar 包中包含着 POI 读取word 2003 和 word 2007 所需要的 jar 包,也有需要...
  • Word 中查找一处快捷键

    千次阅读 2013-11-30 15:14:27
    WORD 中查找一处 快捷键:Shift +F4
  • java环境导出word含图表

    千次阅读 2015-06-24 19:17:58
    有单需求是要求导出图文并茂的word文件。   也就是说里面要包含根据数据生成的文字、表格、图表。 文字与表格替换相对简单网上就有很多demo。 ...问题出现在了图表这里。...我们都知道,word中的图标...在网上找了资料
  • 如何在不安装Word的情况生成Word文档
  • Linux环境Python操作word

    千次阅读 2016-12-27 15:42:12
    python操作word的流程和注意事项
  • word插入向上向取整符号

    千次阅读 2014-10-11 09:36:22
    Word->插入->符号,在字体中选择Lucida Sans Unicode 子集选择数学运算符 就能找到向上 、向取整符号
  • Mac下Word如何插入LaTeX公式

    千次阅读 2020-02-02 13:00:04
    Mac插入公式的方法: 插入 – 公式:快捷键为(control + = + .) 在3中粘贴LaTeX公式,回车,即可转变为显示为正常的公式。 2. 将Word中的公式转变为LaTeX公式 双击文中的公式,在菜单栏中选择公式,然后选择LaTe....
  • word2013表格文字上下居中

    千次阅读 2017-11-07 21:06:54
  • phpword 利用phpword将信息导出成word文档进行下载

    千次阅读 热门讨论 2018-06-07 10:18:31
    也希望能帮助更多的人~首先下载phpword https://download.csdn.net/download/qq_34285103/10461489放到一个文件进行引用(vendor)然后选择文件:替换内容:保存word:保存成word其实就是把提前设计好的word中的...
  • python word2vec 学习笔记

    万次阅读 2016-10-29 22:43:48
    1.ubuntu安装gensimrefer to: ubuntu 14.04 安装gensim为了保证安装成功,首先升级一下easy_install工具。sudo easy_install -U setuptools之后使用easy_install进行安装,使用apt-get安装会遇到编码出错,不知为...
  • Linux导出Word、Pdf时中文乱码问题

    千次阅读 2020-05-11 17:30:05
    1. 导出Word文档时,JFreeChart图表上的中文乱码,Windows系统没问题。 2. 导出Pdf文档时,正文的中文和JFreeChart图表的中文乱码,Windows系统没问题。 系统环境 CentOS 6 问题解决 1. JFreeChart
  •  我们一般控制换行所用到的CSS属性一共有三个:word-wrap; word-break; white-space。这三个属性可以说是专为了文字断行而创造出来的。首先我们得知道这三个属性到底是做什么用地: word-wrap语法:  word-wrap:...
  • 我使用的是word2016版本,在写毕业论文的时候,页眉上方总是出现这个横线导致格式不对,从网上查了很多资料也没有能用的,这个也是自己慢慢摸索出来滴~ 正文: 应该有很多同学用word写文档添加空页眉以后都会...
  • Laravel生成Word文档 - phpword

    千次阅读 2018-01-27 21:54:15
    在项目实际开发或学习中,会遇到把数据导出生成word文档的需求。这里就用优雅、流行的laravel框架,来简单的教大家实现。 phpword,它可以很方便的实现word文档的生成,同时可以在word中添加表格、目录、图片、...
  • POI 读取word (word2003 和 word2007)

    千次阅读 2017-05-18 20:20:18
    读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi-3.5-beta6-20090622.jar 和 poi-scratchpad-3.5-beta6-20090622.jar 两个 jar 包即可, 而 2007 版本(.docx)就麻烦多,我说的这个麻烦不是我们写代码的...
  • python下word2vec词向量训练与加载方法

    万次阅读 2018-01-03 15:14:15
    项目中要对短文本进行相似度估计,word2vec是一个很火的工具。本文就word2vec的训练以及加载进行了总结。word2vec的原理就不描述了,...word2vec的训练方法有2种,一种是通过word2vec的官方手段,在linux环境编...
  • 解决java中html转word文档,转成功后的word文档在断网情况无法显示图片问题
  • word2vec——高效word特征求取

    万次阅读 2015-06-07 16:07:36
    继上次分享了经典统计语言模型,最近公众号中有很多做NLP朋友问到了关于word2vec的相关内容, 本文就在这里整理一下做以分享。 本文分为 概括word2vec 相关工作 模型结构 Count-based方法 vs. Directly predict 几...
  • CentOS安装word2vec的linux教程

    千次阅读 2014-07-08 12:07:25
    关于google的word2vec项目,这里就不用介绍了,接下来需要很干货的分享给大伙,在CentOS安装word2vec的linux教程。关于如何在各个linux操作系统上安装word2vec,google的word2vec项目首页并未过多讲,或是详细的...
  • 1:antiword实现 php读取word内容    PHP没有自带读取word文件的类,或者是库,这里我们使用antiword(http://www.winfield.demon.nl/)这个包来读取doc文件. ... 首先介绍一下如何在windows...
  • Mac OS X 一些之前能在 Windows 正常工作的宏却无法使用。 但是网上相关的资料非常少,而且 Mac OS X 版本的 Word 宏录制功能并不能很好的使用。 所以只能勉强通过 google 记录了一些。 下面是简单的几行VBA...
  • 毕业论文 Word 排版技巧

    千次阅读 多人点赞 2019-12-11 12:59:58
    本文使用的office是Word 2016,对于word 2010、word 2013以及word 365使用方式基本相似,就不再专门操作了。 Office和WPS是我们经常会使用到的办公软件,对于Office和WPS的背景我们就不做评价了,但是对于经常做...
  • java操作word,自动填写word表格

    千次阅读 2018-09-26 06:51:25
    工作中常要填写各种word表格,其中内容有很多是重复的。于是想做一个工具,输入word文件所对应的xml格式文件,自动填写表格。 word其实可以转化成xml来处理,这一步可以手工用word把.doc格式文件另存为.xml格式。...
  • linux安装openoffice将word转成PDF

    千次阅读 2016-06-13 14:55:55
    最近在弄linux服务器,项目中需要把word转成PDF,在网上找了好多教材,东拼西凑终于搞定,所以决定记录下来给需要的人一个借鉴的机会。 1.首先需要确定你的Linux是支持 RPM包还是DEB包。 rpm --version ...
  • 词嵌入来龙去脉 word embedding、word2vec

    万次阅读 多人点赞 2017-08-14 21:57:45
    0词嵌入来龙去脉 NLP的核心关键语言表示Representation NLP词的表示方法类型 1词的独热表示one-hot representation 2词的分布式表示distributed representation NLP语言模型 ...词嵌入 word embedding

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 556,923
精华内容 222,769
关键字:

word的下