精华内容
下载资源
问答
  • worldcloud库的使用

    2018-07-04 22:44:00
    worldcloud库的使用 worldcloud是一个优秀的第三方词云展示库,用来实现比较有逼格的数据可视化效果。更加直观与艺术的展示单词。 worldcloud对象的创建 worldcloud.WordCloud()  代表一个文本构建的词云,...

    worldcloud库的使用

    worldcloud是一个优秀的第三方词云展示库,用来实现比较有逼格的数据可视化效果。更加直观与艺术的展示单词。

    worldcloud对象的创建

    • worldcloud.WordCloud()

      代表一个文本构建的词云,可以通过构造方法中的各种参数来控制词云状态。

    worldcloud构造方法的参数控制

    • width

      指定生成词云图片的宽度,默认值为400px

    • height

      指定生成词云图片的高度,默认值为200px

    • min_font_size

      指定词云中最小单词的大小,默认值为4号。

    • max_font_size

      指定词云中最大单词的大小,默认根据词云的高度自动调节。

    • font_step

      指定词云中单词大小的步进间隔,默认值为1

    • font_path

      指定字体文件的路径,默认为None.

    • max_words

      指定词云显示的最大单词数.。默认值为200.

    • stop_words

      指定一个单词列表,用于在词云中不显示某些单词,默认值为空列表。

    • mask

      指定词云的形状,默认为长方形。若想使用其他图像必须使用imread()函数

      

    from scipy.misc import imread
    mk=imread("pic.png")
    w=wordcloud.WordCloud(mask=mk)
    • background_color

      指定词云的背景颜色,默认为黑色。

    worldcloud对象的常用方法

    •  w.generate(txt)

      向wordcloud对象中加载txt文档。

    • w.to_file(filename)

      将词云输出为一个图像文件,.png或.jpg格式。

    wordcloud库的使用实例

    #GovRptWordCloud.py
    import jieba
    import wordcloud
    f=open("新时代中国特色社会主义.txt",'r',encoding='utf-8')
    t=f.read()
    f.close()
    ls=jieba.lcut(t)
    
    txt="".join(ls)
    w=wordcloud.WordCloud(\
        width=1000,height=700,\
        background_color='white',\
        font_path='msyh.ttc'
        )
    w.generate(txt)
    w.to_file("grwordcloud.png")

    输出效果如下

     

     

    转载于:https://www.cnblogs.com/zhaifeng/p/9265812.html

    展开全文
  • worldcloud库的基本使用 worldcloud库把词云当成一个wordcloud对象 wordcloud.WordCloud()代表一个文本对应的词云 可以根据文本中词语出现的频率等参数绘制词云 绘制词云的形状,尺寸颜色都可以设定 worldcloud库的...

    worldcloud库的基本使用

    worldcloud库把词云当成一个wordcloud对象
    wordcloud.WordCloud()代表一个文本对应的词云
    可以根据文本中词语出现的频率等参数绘制词云
    绘制词云的形状,尺寸颜色都可以设定

    worldcloud库的常规方法
    w=world.WordCloud()
    以WordCloud对象为基础 配置参数 加载文本 输出文件
    方法1 w.generate(txt) 向WordCloud对象w中加载文本txt,>>>w.generate("python and wordCloud ")
    方法2 w.to_file(filename)将词云输出为图像文件,.png或者.jpg格式 ,>>>w.to_file(“outfile.png”)

    生成词云的步骤
    1 配置对象参数
    2 加载词云文件
    3 输出词云文件

    worldcloud库生成词云的过程
    1 分隔 以空格分割单词
    2 统计 单词出现次数并过滤
    3 字体 根据统计配置字号
    4 布局 颜色环境尺寸

    也就是说我们只需要给worldcloud一个以空格分隔的大字符串就可以生成词云

    配置对象参数
    w = wordcloud.WordCloud(参数)
    参数 描述
    width 指定词云生成图片的宽度 默认400
    height 指定词云对象生成图片的高度 默认200像素
    min_font_size 指定词云中字体的最小字号,默认4号
    max_font-size 指定词云中字体的最大字号,根据亮度自动调节
    font_step指定词云中字体字号的步进间隔,默认为1
    font_path 指定字体文件的路径 ,设置字体
    max_words 指定词云显示的最大单词数,默认200
    stop_words 指定词云的排除词列表,即不显示的单词列表
    mask 指定词云形状,默认为长方形 需要引用imread()函数
    background_color 指定词云图片的背景颜色,默认为黑色

    由于wordcloud使用空格来进行形成词云,而中文没有空格,所以使用jieba库来分隔

    ex:对政府工作报告的分析

    import wordcloud
    import jieba
    f = open("工作报告.txt","r",encoding="utf-8")
    t = f.read()
    f.close()
    # 使用jieba库对文件进行分词
    ls = jieba.lcut(t)
    # 使用空格把列表的每一个元素连接起来
    # 形成一个由空格分隔的长字符串
    txt = " ".join(ls)
    # 设置词云对象的属性
    w = wordcloud.WordCloud(font_path="msyh.ttc",width = 1000,height=700,background_color="white",max_words=15)
    # 加载文本
    w.generate(txt)
    w.to_file("grwordcloud1.png")
    
    

    在这里插入图片描述

    对哈姆雷特的分析

    import wordcloud
    import jieba
    f = open("hamlet.txt","r")
    t = f.read()
    f.close()
    # 设置词云对象
    w = wordcloud.WordCloud(font_path="msyh.ttc",width = 1000,height=700,background_color="white",)
    # 加载文本
    w.generate(t)
    w.to_file("grwordcloud3.png")
    
    

    在这里插入图片描述

    展开全文
  • python的worldcloud库可以很容易的生成词云

    词云是一种很好看的数据可视化的手段,python的wordcloud库可以很容易的制作一个好看的词云,快来试试吧!

    依赖环境:
    matplotlib、wordcloud库
    安装方式
    可以直接打开命令行,输入

    pip install wordcloud

    因为国外网站访问速度很慢,经常发生连接中断的情况,可以使用国内的镜像源(以清华镜像为例)

    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud

    正式开始我们最简单的词云学习

    import matplotlib.pyplot as plt  #用于绘图
    import wordcloud        #绘制词云
    
    txt="life is so short,you need python to do everything even if maybe you will face many lies,many sorror,but you must remember to share your happiness and sorror."      
     #一段文本内容,字符串形式
    w=wordcloud.WordCloud(background_color="white")
    w.generate(txt)     #生成词云
    w.to_file("pywcloud.png")    #导出为图片
    

    这样在程序所在的文件夹里面就可以看到我们的词云图片了
    在这里插入图片描述
    如果要在本地看到绘制的词云,需要加上三条语句

    plt.imshow(w)     #对图像进行处理
    plt.axis("off")   #去除坐标系
    plt.show()        #可视化
    

    默认的背景颜色是黑色,这里我们改成了白色,可以对比一下。
    在这里插入图片描述
    矩形词云是最简单的类型,但是我们还可以使用本地图片来作为词云的背景,使它看起来更好看。这里最重要的就是mask参数。

    最开始我了解到可以用scipy库中的imread函数来处理图片
    于是写出了这样的代码

    from scipy.misc import imread
    import matplotlib.pyplot as plt
    import wordcloud
    
    file=open("F:/taylor.txt","r",encoding='utf-8')
    txt=file.read()    #获取字符串的作用
    file.close()    
    mask=imread("C:/Users/lenovo/Pictures/_20200511191731.jpg")
    w=wordcloud.WordCloud(mask=mask,background_color="white")
    w.generate(txt)
    w.to_file("pywcloud.png")
    plt.imshow(w)
    plt.axis("off")
    plt.show()
    

    之后出现了错误

    ImportError: cannot import name 'imread' from 'scipy.misc' (E:\anaconda\lib\site-packages\scipy\misc\__init__.py)
    

    导入错误,也就是说scipy中没有这个函数?以前没有发生过这种情况,所以查找了好久才发现原因。

    主要是scipy自1.3.0后移除了imread、imsave、imresize等方法
    解决方法有:
    可以把scipy库换成1.2.1以下的版本,
    或者使用imageio库中的imwrite、imread等函数,可以替代scipy库中的相应函数。建议采用第二种方式

    只需要把

    from scipy.misc import imread
    

    替换成

    from Imageio import imread
    

    效果图:

    在这里插入图片描述
    看起来蛮不错的嘛,霉霉好好康~~

    也可以用下面的代码代替,效果相同

    from PIL import Image   #pillow库的Image函数用来处理图片 
    import numpy as np
    import matplotlib.pyplot as plt
    import wordcloud
    
    file=open("F:/taylor.txt","r",encoding='utf-8')
    txt=file.read()    #获取字符串的作用
    file.close()    
    image_path="C:/Users/lenovo/Pictures/_20200511191731.jpg"        #这里需要你的本地图片的路径
    img=Image.open(image_path)
    img=np.array(img)
    w=wordcloud.WordCloud(max_font_size=100,min_font_size=2,
                        max_words=200,background_color='white',
                        mask=img)
     #对mask参数的处理,有很多有意思的参数
    w.generate(txt)
    w.to_file("pywcloud1.png")
    plt.imshow(w)
    plt.axis("off")
    plt.show()
    

    注意

    • 平时我们处理的文本往往是大量的,所以需要用文件形式打开,如果与程序在同一目录下,那么可以用相对路径打开文件,否则要使用文件的绝对路径
    • 背景颜色需要注意,这里我采用背景颜色为白色,那么你的图片的背景也应该是白色,否则词云会很失败。

    以上介绍的都是对于制作英文词云的方法,因为英文是以单词为单位的,不需要分词,如果我们需要做一个中文词云,还需要添加一个中文分词库——jieba。

    import jieba
    import wordcloud
    from imageio import imread
    
    file=open("F:/note.txt","r",encoding='ANSI')   
    #编码方式不同的文件不太一样,大部分是utf-8
    txt=file.read()
    file.close()
    txt_list = jieba.lcut(txt)         #精确分词模式
    #精确分词之后形成的是一个以每个词语为元素的列表
    string = ' '.join((txt_list))    #用join函数连接成字符串
    #这里需要一张本地图片,设置成mask参数
    mk = imread('C:/Users/lenovo/Pictures/20200505101029364.png')
    w = wordcloud.WordCloud(max_font_size=100,
                            background_color='white',
                            scale=3,font_path='C:/Windows/SIMLI.TTF',
                            mask=mk)
    w.generate(string)    #生成词云
    w.to_file('axwordcloud.png')
    

    在这里插入图片描述
    在这里插入图片描述
    自己在做的时候,图片的路径和文本文件的路径要改成自己的。

    制作中文和英文词云的方法都比较简单,当然做中文词云需要多一步分词的步骤。这里简单介绍一下jieba的分词方式。
    在这里插入图片描述
    (图片来源于北理工嵩天python课程)
    在这里插入图片描述
    在wordcloud库里面也有很多有用的参数,最重要的莫过于mask参数,其他的例如stopwords,max_words,max_font_size,min_font_size,以及font_path,scale,collocations都有他们的作用。

    这篇文章介绍十分详细https://blog.csdn.net/qq_39611230/article/details/105954600

    展开全文
  • 1.8python文件,数据格式化和worldcloud库的使用

    一,文件的使用

    1. 文件的类型

    (1)文件的理解:文件是数据的抽象和集合;

    • 文件是存储在辅助存储器上的数据序列
    • 文件是数据存储的一种形式
    • 文件展现形态:文本文件和二进制文件
      (2)文本文件 vs. 二进制文件:
    • 文件文件和二进制文件只是文件的展示方式
    • 本质上,所有文件都是二进制形式存储
    • 形式上,所有文件采用两种方式展示
      (3)文本文件:文件是数据的抽象和集合;
    • 由单一特定编码组成的文件,如UTF-8编码
    • 由于存在编码,也被看成是存储着的长字符串
    • 适用于例如:.txt文件、.py文件等
      (3)二进制文件:文件是数据的抽象和集合;
    • 直接由比特0和1组成,没有统一字符编码
    • 一般存在二进制0和1的组织结构,即文件格式
    • 适用于例如:.png文件、.avi文件等
      (4)文本文件 vs. 二进制文件:
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

    2.文件的打开和关闭

    文件处理的步骤: 打开-操作-关闭;
    (1)文件的打开:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    (2)文件的关闭:
    在这里插入图片描述
    在这里插入图片描述

    3.文件内容的读取

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    4.数据的文件写入

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    二,一维数据的格式化和处理

    在这里插入图片描述

    1.数据组织的维度

    (1)从一个数据到一组数据:
    在这里插入图片描述
    维度:一组数据的组织形式
    在这里插入图片描述
    (2)一维数据:由对等关系的有序或无序数据构成,采用线性方式组织;
    在这里插入图片描述
    (3)二维数据:由多个一维数据构成,是一维数据的组合形式;
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2.一维数据的表示

    (1)如果数据间有序:使用列表类型
    ls = [3.1398, 3.1349, 3.1376]

    • 列表类型可以表达一维有序数据
    • for循环可以遍历数据,进而对每个数据进行处理
      (2)如果数据间无序:使用集合类型
      st = {3.1398, 3.1349, 3.1376}
    • 集合类型可以表达一维无序数据
    • for循环可以遍历数据,进而对每个数据进行处理

    3.一维数据的存储

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    4.一维数据的处理

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    三, 二维数据的格式化和处理

    1. 二维数据的表示

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2.CSV数据存储格式

    (1)CSV: Comma-Separated Values

    • 国际通用的一二维数据存储格式,一般.csv扩展名
    • 每行一个一维数据,采用逗号分隔,无空行
    • Excel和一般编辑软件都可以读入或另存为csv文件
      -在这里插入图片描述
      (2)CSV数据存储格式
      CSV: Comma-Separated Values
    • 如果某个元素缺失,逗号仍要保留
    • 二维数据的表头可以作为数据存储,也可以另行存储
    • 逗号为英文半角逗号,逗号与数据之间无额外空格

    3.二维数据的存储

    二维数据的存储
    按行存?按列存?

    • 按行存或者按列存都可以,具体由程序决定
    • 一般索引习惯:ls[row][column],先行后列
    • 根据一般习惯,外层列表每个元素是一行,按行存

    4.二维数据的处理

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    四, wordcloud库的使用

    (wordcloud是优秀的词云展示第三方库)
    在这里插入图片描述

    • 词云以词语为基本单位,更加直观和艺术地展示文本
      wordcloud库的安装:
      (cmd命令行) pip install wordcloud
      在这里插入图片描述
      (1)wordcloud库基本使用
      wordcloud库把词云当作一个WordCloud对象;
    • wordcloud.WordCloud()代表一个文本对应的词云
    • 可以根据文本中词语出现的频率等参数绘制词云
    • 词云的绘制形状、尺寸和颜色都可以设定
      (2)wordcloud库常规方法:
      w = wordcloud.WordCloud()
    • 以WordCloud对象为基础
    • 配置参数、加载文本、输出文件
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      (3)配置对象参数:
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

    五,实例

    1.worldcloud库实例:

    (1)基础版:

    输出文件默认同.py文件目录。

    import wordcloud
    txt="life is a fucking movie"
    c=wordcloud.WordCloud(background_color="white")
    c.generate(txt)
    c.to_file("love.png")
    

    (2)进阶版:

    import jieba
    import wordcloud
    txt="从明天起,做一个幸福的人\
        喂马,劈柴,周游世界\
        从明天起,关心粮食和蔬菜\
        我有一所房子,面朝大海,春暖花开\
        从明天起,和每一个亲人通信\
        告诉他们我的幸福,那幸福的闪电告诉我的\
        我将告诉每一个人\
        给每一条河每一座山取一个温暖的名字\
        陌生人,我也为你祝福\
        愿你有一个灿烂的前程\
        愿你有情人终成眷属\
        愿你在尘世获的幸福\
        我也愿面朝大海,春暖花开"
    c=wordcloud.WordCloud(background_color=("white",width=1000,height=800,font_path="msyh.ttc")
    c.generate(" ".join(jieba.lcut(txt)))
    c.to_file("中文.png")
    

    2.《政府工作报告》:

    文件链接下载地址:
    新时代中国特色社会主义.txt
    关于实施乡村振兴战略的意见.txt

    (1)《新时代中国特色社会主义》.txt词云基础版:

    import jieba
    import wordcloud
    f=open("新时代中国特色社会主义.txt","r",encoding="utf-8")
    t=f.read()
    f.close()
    txt=" ".join(jieba.lcut(t))
    w=wordcloud.WordCloud(width=1000,height=700,background_color="white",font_path="msyh.ttc",max_words=15)
    w.generate(txt)
    w.to_file("新时代中国特色社会主义.jpg")
    

    (2)新时代中国特色社会主义.txt词云进阶版:

    import imageio
    import jieba
    import wordcloud
    f=open("新时代中国特色社会主义.txt","r",encoding="utf-8")
    t=f.read()
    f.close()
    img = imageio.imread("p.jpg")
    txt=" ".join(jieba.lcut(t))
    w=wordcloud.WordCloud(width=1000,height=700,background_color="white",font_path="msyh.ttc",max_words=30,mask=img)
    w.generate(txt)
    w.to_file("2018一号文件.jpg")
    

    3.自动轨迹绘制:

    #生成绘画环境
    import turtle as t
    t.title("自动轨迹绘制")
    t.setup(900,900,0,0)
    t.pensize(5)
    t.pencolor("red")
    #读取数据
    data=[]
    f=open("datal.txt")
    for line in f:
        line=line.replace("\n","")
        data.append(list(map(eval,line.split(","))))
    f.close()
    #自动绘制
    for i in range(len(data)):
        t.pencolor(data[i][3],data[i][4],data[i][5])
        t.fd(data[i][0])
        if data[i][1]:
            t.right(data[i][2])
        else:
            t.left(data[i][2])
    
    展开全文
  • worldcloud库—总结

    2019-09-28 04:39:12
    import worldcloud w=wordcloud.WordCloud(<参数>) # 定义一个WordCloud对象 w.generate(txt) # 向WordC...
  • 正常我们安装第三方:pip install 库名(在cmd环境下); 如果这样安装出错,进入这个里面 https://link.zhihu.com/?target=https%3A//www.lfd.uci.edu/~gohlke/pythonlibs/%23wordcloud 下载你python下载的时候...
  • <p><img alt="" height="192" src="https://img-ask.csdnimg.cn/upload/1621425715380.png" width="1164" /></p>   <p style="text-align:center"><img alt="" height="1066" src=...  </p>
  • 如图所示,可以证明已经安装成功且已经安装在可识别的路径中,一些辅助也已经安装好(如matplotlib)但是仍然无法使用,想请教各位大神,万分感谢! [img=...
  • 在Anaconda中没有WorldCloud库,所以还需要手动安装。 1.先在官网下载WorldCloud安装包:下载地址 注意自己的系统版本是多少位和python版本 cp37代表的就是python3.7 我自己是windows64位 python3.8就下的这个 ...
  • python 词云 worldcloud

    2019-01-12 00:15:42
    下载之后直接运行, 需要先安装 worldcloud, pip install world main_1.py ~ main_7.py 都可以运行 案例是 西游记 全书中 出现频率最高的词组
  • Worldcloud文本词云图

    千次阅读 2018-05-21 08:34:19
    w_cloud(db_name, str(C_new)) def stop_dict(news): ''' 去除所有的停用词 ''' stopwords = open("C:/Anaconda/stopworld.txt", 'r', encoding='utf-8').read() outstr = '' for word in news: if word ...
  • WorldCloud定义用法应用引词分词绘图查询电脑字体格式操作 定义 词云,用词来做的一套东西。worldcloud的作用 基于 Python 的词云生成,可以实现词频可视化,根据你给出字符串,对词频进行统计,以不同的大小显示...
  • 首先我的Anaconda3.5是安装在D盘的 在我的电脑进入到D:\Anaconda3\Lib\site-...接着打开Spyder,在IPython console下输入import wordcloud,如果出现下图,则恭喜你,成功安装了wordcloud这个
  • 中文分词的优秀。 安装:pip install jieba 主要有三种模式,但是最主要有一个函数 模式:精确模式:把文本精确的切分开,不存在冗余单词  全模式:把文本中所有可能的词语都扫描出来,有冗余  搜索引擎...
  • 1.首先要CTRL+R然后cmd进入命令行,输入pip install wordcloud pip install jieba ...安装第三方(快速安装方法:https://editor.csdn.net/md/?articleId=104275631) citucitu ![(https://img-blog....

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,435
精华内容 4,574
关键字:

worldcloud库