精华内容
下载资源
问答
  • 基于Python词云生成器

    2018-11-12 13:00:08
    基于python实现的的免安装词云生成器——使用python实现文章的词云图的绘制,然后需要具有交互界面,并且能够在没有python环境的电脑下运行,方便不懂编程的人直接使用。
  • 看了嵩天老师的《python编程新思维及实战》的课程后,看词云分析挺有意思的,自己也想试试词云分析,所以就爬取了西游记,聊斋志异,红楼梦,三国演义四部图书,存放为txt文件格式,以供分析。 代码如下: # 导入...

    看了嵩天老师的《python编程新思维及实战》的课程后,看词云分析挺有意思的,自己也想试试词云分析,所以就爬取了聊斋志异,红楼梦,三国演义三部图书,存放为txt文件格式以供分析。本次的分析没有加入图片的形状,后续会加入图片的形状。
    代码如下:

    # 导入词云库
    import wordcloud
    # 导入jieba库,做分词使用
    import jieba
    
    # 需要分析的文本
    txt = "聊斋志异.txt"
    # 打开需要分析的文本,爬取的格式为gbk
    f = open(txt, 'r', encoding="gbk")
    # 读取文本内容
    t = f.read()
    # 读取后关闭
    f.close()
    # 精确模式,分词后返回一个列表
    ls = jieba.lcut(t)
    # 将空格与分词分隔开
    txt1 = " ".join(ls)
    # 调用词云
    w = wordcloud.WordCloud(font_path="simkai.ttf", background_color="white",
                            width=600, height=400, max_font_size=120, max_words=3000)
    # 生成词云
    w.generate(txt1)
    # 词云图片命名
    w.to_file(txt.split('.')[0] + ".png")
    

    分析结果如下:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 前言 二级Python第10章《第三方库概览》中介绍了三个...但是,从实际应用开发角度讲,这个库是学习时下Python大数据编程必须要掌握的——当然也是比较简单的。 安装问题 在安装WordCloud过程中遇到失败与成功,特别...

    前言

    二级Python第10章《第三方库概览》中介绍了三个库:

    • PyInstaller
    • Jieba
    • WordCloud
      其中,前两个库是必须掌握的,第三个库是可选学习。因此,编程题中肯定不会出现对于词云库WordCloud的考察要求。但是,从实际应用开发角度讲,这个库是学习时下Python大数据编程必须要掌握的——当然也是比较简单的。

    安装问题

    在安装WordCloud过程中遇到失败与成功,特别记录于下。

    家中机器上的失败安装

    遗憾的是,家中笔记本上安装的是WINDOWS 7 32位,且费了很多劲都无法安装SP1。想转换成64位,无奈家中机器上费了好多劲安装了大量软件,又舍不得,只好作罢,保留现有系统。结果是:

    使用命令:
    pip install wordcloud
    运行错误,显示要求必须先安装python 3.5及以上版本。

    另一个严重问题,在无SP1的WIN7 32位环境下无法安装Python 3.5及以上版本。因此,理想安装是WINDOWS 7 64位SP1。

    还好,全国二Python建议环境是Python 3.4.2-3.5.4。而且,相关考试内容都能够在这样的环境下提供,便考试无忧了,只是想扩展安装一些内容的话,只要“望洋兴叹”了。

    此外,我还试着从https://pypi.org/project/wordcloud/#files处找到一个针对Python 3.4版本的WORDCLOUD的.whl压缩文件(相当于.rar或者.zip)文件。这种文件的安装要求先安装wheel这个第三方小库,它的安装很容易,只是也无法安装——要求是WINDOWS 64位系统。

    办公室机器上的成功安装

    还好,办公室机器上是正统的WINDOWS 7 64 bits SP1,所以直接安装了Python 3.5.4。说明,这个版本的安装可能要求VC++相应的动态链接库,根据需要提示安装即可。(因为我的机器上早已安装了高版本的VS,自然躲过这一劫啦)

    首先,安装Python 3.5.4非常顺利!
    安装信心满满的运行如下命令:

    pip install wordcloud

    结果是失败!!!???
    提示如下:
    二级Python词云包安装问题

    这种提示自然是天下第一大模糊的提示了。但是,分析来分析去,我的系统环境应该是最典型的,Python版本也是最典型的。无奈想到了一个“曲线救国”方案。是:先安装wheel,再安装一个.whl文件,然后在本地安装。居然成功了(只是上面的错误没有跟踪解决,请原谅!)

    先安装wheel,很简单:
    pip install wheel

    再下载.whl文件,地址是:
    https://pypi.org/project/wordcloud/#files

    安装的对象如下图所示:
    二级Python词云包安装问题

    然后,在本地安装上述压缩文件,非常顺利(先跳转到.WHL文件所在路径下):

    pip install pip install wordcloud-1.5.0-cp35-cp35m-win_amd64.whl

    二级Python词云包安装问题

    测试一下

    二级Python词云包安装问题

    随便从网络上抓了一把,形成一个文件,试验:

    内容是:
    When I was young

    我年轻的时候

    I'd listen to the radio

    常听收音机
    Waiting for my favorite songs

    总是期待我喜爱的歌

    When they played I'd sing along

    伴奏声起我会跟随歌唱

    It made me smile

    笑声在歌声中激荡

    Those were such happy time

    那真是幸福的时光

    还有一些空格什么的,没有整理。

    源码如下:

    #导入所需库
    from wordcloud import WordCloud
    f = open('texten.txt','r',encoding='UTF-8').read()
    wordcloud = WordCloud(background_color="white",width=1000, height=860, margin=2).generate(f)
    
    # width,height,margin可以设置图片属性
    # generate 可以对全部文本进行自动分词,但是对中文支持不好
    # 可以设置font_path参数来设置字体集
    #background_color参数为设置背景颜色,默认颜色为黑色
    
    import matplotlib.pyplot as plt
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()
    wordcloud.to_file('test.png')
    # 保存图片,但是在第三模块的例子中 图片大小将会按照 mask 保存

    有两个地方值得注意:

    第一,文本文件是以UTF-8格式保存的。
    第二,运行上述代码前,需要先安装一个第三方图形库,很容易:

    pip install matplotlib

    展开全文
  • 如何用Python词云

    2020-03-29 19:16:01
    一步一步教你如何用Python词云 ...如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来...

    一步一步教你如何用Python做词云

    转自:
    https://www.cnblogs.com/ZaraNet/p/10136589.html
    前言
    在大数据时代,你竟然会在网上看到的词云,例如这样的。

    在这里插入图片描述

    看到之后你是什么感觉?想不想自己做一个?

    如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据、做数学题、写脚本替你偷懒……

    如果你之前没有编程基础,没关系。希望你不要限于浏览,而是亲自动手尝试一番。到完成的那一步,你不仅可以做出第一张词云图,而且这还将是你的第一个有用的编程作品。

    安装wordcloud库
    请确保你的python环境没有问题,我用的开发工具是VsCode,首先你要在Python扩展中安装python开发环境(当然,这不是为你的windows安装python)

    在这里插入图片描述

    那么你还需要安装所需要的第三方库,那么在VSCode中并没有PyCharm那么专业,这里需要获得你自己的Python脚本位置。

    在这里插入图片描述

    我们可以发现里面有一个名为pip.exe文件,这个文件就是python官方给我们去安装python第三方库的一个程序,那么我们可以在VsCode的终端中就可以去通过它,这也是我们为什么要获取python安装位置的根本原因。

    例如我们安装WordCloud,我们的操作如下:

    pip install WordCloud
    数据
    这个时候我们就要开始Code了,我们一定需要数据,这里我自己找了一个绕口令,内容如下:

    Betty Botter bought some butter but she said the butter’s bitter. If I put it in my batter it will make my batter bitter. So, she bought some better butter, better than the bitter butter and she put it in her batter and her batter was not bitter. So 'twas good that Betty Botter bought some better butter.

    翻译: 贝蒂·波特买牛油, 可她说:“牛油是苦的。 不过加上一点好牛油—— 可以使苦牛油更好点。” 于是她买了一点牛油, 比苦牛油好点的牛油。 掺了之后苦牛油真的变的好多了。 所以这就是贝蒂·波特买的一点比苦牛油好点的牛油。

    我把其中的文字存储成了一个文本,叫做minister.txt。

    Code
    python做词云呢,需要导入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平台图像处理标准库,功能是真的强大。首先需要读取文件 。

    首先我们要读取我们的txt文件,那么代码如下:

    复制代码
    from wordcloud import WordCloud
    import PIL .Image as image

    with open(“F:\minister.txt”) as fp:
    text=fp.read()
    print(text)
    复制代码
    运行脚本结果如下:

    在这里插入图片描述

    接下来导包,我们看看如何生成最简单的词云:

    复制代码
    from wordcloud import WordCloud
    import PIL .Image as image

    with open(“F:\minister.txt”) as fp:
    text=fp.read()
    #print(text)
    #将文本放入WordCoud容器对象中并分析
    WordCloud = WordCloud().generate(text)
    image_produce = WordCloud.to_image()
    image_produce.show()
    复制代码
    如果python引入无误,并代码无误,那么会弹出你生成的图片,该图片会储存在你的系统。详细位置一般为:C:\Users\MACHENIKE\AppData\Local\Temp 中。
    在这里插入图片描述

    带形状的词云
    一般来说,我们不想要这么方的词云,肯定喜欢一些有形状的,

    接下来是生成那种有轮廓的词云,这里就需要继续导入其他包,这里导入的包为numpy,numpy系统是python的一种开源的数值计算扩展,这种工具可以用来存储和处理大型矩阵。这里在处理的时候将给出形状的图片表示为一个大型矩阵,再有颜色的地方来进行填词(导包 :import numpy as np)。导包之后需添加一个遮罩层,遮罩层就是用来限制生成图片的形状 。

    网上随便找个图片放入到项目当中(这里我找的是一个💗),然后开始code:

    复制代码
    from wordcloud import WordCloud
    import PIL .Image as image
    import numpy as np

    with open(“F:\minister.txt”) as fp:
    text = fp.read()
    # print(text)
    mask = np.array(image.open(“F:\20180612151652413.png”))
    wordcloud = WordCloud(
    mask=mask
    ).generate(text)
    image_produce = wordcloud.to_image()
    image_produce.show()
    复制代码
    结果如下:

    在这里插入图片描述

    不支持中文的解决方案
    我又从网上摘抄了一段文字,文字内容如下:

    生活星期天早上和朋友一起聊天,朋友说了一个他们听过的故事:“一尊佛像前有一条铺着石板的路,人们每天都踏着这一阶一阶的石板去膜拜佛像。石阶看着人们踏着自己去膜拜佛像,心里很不舒服。石阶心里想,自己和佛本来就来自同一块石头,为什么自己要成为踏脚石,让人们踩着自去去膜拜它呢!它对佛抱怨说这样太不公平!佛像说:这没有什么不公平,你们成为台阶只需挨了四刀,而我是挨了千刀万剐才成了人们膜拜的佛像。

    重新运行,发现雪崩了。
    在这里插入图片描述

    如果需要生成中文的词云,还需导入jieba分词的包。jieba分词的切分还是蛮准的。

    复制代码
    from wordcloud import WordCloud
    import PIL .Image as image
    import numpy as np
    import jieba

    def trans_CN(text):
    word_list = jieba.cut(text)
    # 分词后在单独个体之间加上空格
    result = " ".join(word_list)
    return result;

    with open(“F:\minister.txt”) as fp:
    text = fp.read()
    text = trans_CN(text)
    # print(text)
    mask = np.array(image.open(“F:\20180612151652413.png”))
    wordcloud = WordCloud(
    mask=mask,
    font_path = “C:\Windows\Fonts\msyh.ttc”
    ).generate(text)
    image_produce = wordcloud.to_image()
    image_produce.show()
    复制代码

    在这里插入图片描述
    C盘中有font字体,那么这些呢你可以自己去找,trans_CN方法是分词用的,通过font-path就可以指定里面的生成文本。这大概就是词云的基础了,可以将爬虫和词云生成结合在一起,在爬取信息之后生成这样的词云。

    另一个例子:
    https://www.cnblogs.com/djdjdj123/p/12153603.html

    #!/usr/bin/Python
    # -*- coding: utf-8 -*-
    from os import path
    from PIL import Image
    import numpy as np
    import matplotlib.pyplot as plt
    import jieba
    from wordcloud import WordCloud, STOPWORDS
    
    '''https://www.cnblogs.com/djdjdj123/p/12153603.html'''
    ###当前文件路径
    d = path.dirname(__file__)
    print('当前路径:  ',d)
    d="d:\\"
    # Read the whole text.
    file = open(path.join(d, '婚姻法中关于财产制度的论析.txt'), encoding="utf-8").read()
    ##进行分词
    #刚开始是分完词放进txt再打开却总是显示不出中文很奇怪
    default_mode =jieba.cut(file)
    text = " ".join(default_mode)
    alice_mask = np.array(Image.open(path.join(d, "中国.jpg")))
    stopwords = set(STOPWORDS)
    stopwords.add("said")
    wc = WordCloud(  
        #设置字体,不指定就会出现乱码,这个字体文件需要下载
        font_path=r'D:\\wqy-microhei\\wqy-microhei.ttc',  
        background_color="white",   
        max_words=2000,   
        mask=alice_mask,  
        stopwords=stopwords)
    # generate word cloud
    wc.generate(text) 
    
    # store to file
    wc.to_file(path.join(d, "词云.jpg"))
    
    # show
    plt.imshow(wc, interpolation='bilinear')
    plt.axis("off")
    plt.figure()
    plt.imshow(alice_mask, cmap=plt.cm.gray, interpolation='bilinear')
    plt.axis("off")
    plt.show()
    

    字体:
    https://en.m.fontke.com/search/font/wqy-microhei.ttc/

    安装wordcloud 出现
    error: Microsoft Visual C++ 14.0 is required. Get it with “Build Tools for V
    isual Studio”: https://visualstudio.microsoft.com/downloads/
    的解决办法
    https://blog.csdn.net/gtf215998315/article/details/80194526

    在这里插入图片描述

    展开全文
  • 三月了,希望一切的美好都不负归期。相信疫情总有散去的那一天。居家,不乱跑,戴口罩,勤洗手,就是为国家做贡献。...今天我们就来继续百变Python的讲解-词云: #导入制作词云的相关包 import j...

    三月你好
    三月了,希望一切的美好都不负归期。相信疫情总有散去的那一天。居家,不乱跑,戴口罩,勤洗手,就是为国家做贡献。
    我们的公众号讲C++、讲真题、讲Python、讲库,安装,实操。都是干货。如果你喜欢我们就来关注我们。也希望你把这个都是干货的公众号分享给和你一样的伙伴们。让他们也可以获益。赠人玫瑰手留余香。感谢。
    今天我们就来继续百变Python的讲解-词云:

    #导入制作词云的相关包
    import jieba
    import numpy
    import PIL.Image as Image
    from wordcloud import WordCloud
    
    #文本处理
    def chineseTextJieba(text):
        wordObjectGenerator = jieba.cut(text)
        wordText = "".join(wordObjectGenerator)
        return wordText
    
    #词云制作
    with open("test.txt",encoding="utf-8") as file:
        text = file.read()
        wordTextObj=chineseTextJieba(text)
        mask_image = numpy.array(Image.open("image/heart1.png"))
        wordcloud=WordCloud(background_color="black",\
                            font_path="C:\Windows\Fonts\simkai.ttf",\
                            mask=mask_image,\
                            max_words=50).generate(wordTextObj)
        image=wordcloud.to_image()
        image.show()
    

    运行一下:看看会发生什么神奇的事情吧。
    词云运行结果
    看到什么神奇的景象出现了吗?一个心形图案。而且是由许多文字组成的。是不是很神奇?只要你跟上节奏,不只可以学到词云还可以学到好多有趣实用又好玩的东西。现在CSDN学院里也有相应的课程哦。欢迎关注。

    展开全文
  • #词云 from wordcloud import WordCloud, STOPWORDS from imageio import imread from sklearn.feature_extraction.text import CountVectorizer import jieba import csv # 获取文章内容 with open("mdzs.txt",'r',...
  • 本文采用Python编程,实现对文本文档(中、英文)做词频统计以及词云图展示。 1.何为词云图? 词云图是文本数据的视觉展示,可以快速从大量文本信息中找出关键词。一般来说字体越大就代表出现的频率越高。 E.G. 下图...
  • 一步一步教你如何用Python词云

    千次阅读 2018-12-18 16:43:00
    如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据、做数学题、写脚本替你偷懒…… ...
  • Python语言一直被称颂为很好学的一门编程语言,本人在研读一本入门书籍后,的确可以上手写一些代码文件,这里使用Python做一做《扶摇皇后》小说的词云图,每一句代码上面即是对这句代码的注释...
  • 资源内容:各种pyecharts图表数据可视化的python源码.py文件。 包含的图表类型: 1.柱状图 2.折线图 3.饼图 4.3D柱状图 5.散点图 6.漏斗图 7.词云图 8.地图 9雷达图 10.水球图 11.桑基图 12.横向柱状图 ……还有各种...
  • 点击上方“编程派”,选择设为“设为星标”优质文章,第一时间送达!前言 大家好,不知道大家会在什么场合使用词云图,对我来说词云图的优点除了它可以展示大量文本数据,从而让读者快速抓住重点,更...
  • 主要介绍了Python数据可视化编程 - 词云生成并保存(jieba+WordCloud),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • Python绘制精美词云

    2020-07-14 10:44:25
    pip下载需要的程序包,进行编程。 from wordcloud import WordCloud import PIL.Image as image import jieba import numpy as np def trans_CN(text): word_list = jieba.cut(text,cut_all=False) # ...
  • from tkinter import filedialog import xlrd import tkinter as tk from tkinter import ttk import os import stylecloud import numpy as np from PIL import Image import jieba import jieba.analyse ...
  • 思维导图: 效果(语句版): 源码: # -*- coding: utf-8 -*- Created on Tue Mar 5 17:59:29 2019 @author: dell ...# ============================================================================= ...
  • 最近学习了python的jieba分词库和wordcloud词云库,诞生了想写个小demo,使用python实现文章的词云图的绘制,然后需要具有交互界面,并且能够在没有python环境的电脑下运行,方便不懂编程的人直接使用。 全部代码...
  • myWordCloud.to_file("词云图片.jpg") #保存为图片     注意事项: <一> jieba分词 分词后的返回值类型 分词后的返回值 如何去除所要分离文本的中英文符号,还有空格符 import jieba ...
  • 困于心衡于虑而后作 今天的学习目标是:文件操作 1.自动轨迹绘制 data.txt #data.txt 300,0,144,1,0,0 300,0,144,0,1,0 300,0,144,0,0,1 300,0,144,1,1,0 300,0,108,0,1,1 184,0,72,1,0,1 ...词云制作 环境暂时没有装好
  • 如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据、做数学题、写脚本替你偷懒…… ...
  • m=open('D:\\pyhomework\\0516\\05_python编程设计_史晓娜418105000617_期末作业_03.txt',mode='r',encoding='UTF-8') t=m.read() ls=jieba.lcut(t) #对文件进行分词处理 m.close() #关闭文件 txt
  • 使用Python做中文分词和绘制词云

    万次阅读 多人点赞 2018-01-08 16:51:40
    使用Python做中文分词和绘制词云 李小璐出轨云词图 作为一门编程语言,Python的编写简单,支持库强大,应用场景多,越来越多的人开始将它作为自己的编程入门语言。 Python一个比较重要的场景是做舆情分析,比如...
  • python网络编程项目 根据豆瓣电影url获取电影的ID 如图url中的30306570就是电影《囧妈》的ID 获取每部电影的前10页影评 保存在以电影名称命名的TXT文件中 根据影评 结巴分词 生成词云 运行如图: 词云:(可自定义...
  • 本教程完整再现了本人使用python将数据可视化为词云的整个过程,包括词云库的安装,分词库的安装与应用、中文文字的显示问题与解决,还有根据图片模板生成指定样式的词云图。 目录 摘要 依赖库安装 词云库安装...

空空如也

空空如也

1 2 3 4 5
收藏数 91
精华内容 36
关键字:

python词云编程

python 订阅