精华内容
下载资源
问答
  • 实例内容来自《利用python进行数据分析》。 本文中可能使用的数据集来自:《利用python进行数据分析》数据集。 MovieLens 1M数据集 由GroupLens实验室从MoviesLens收集,内容是20世纪90年代末带21世纪初的电影评分...
  • Python数据分析实例

    万次阅读 多人点赞 2019-06-14 22:13:37
    Python数据分析 Python爬取网页数据

    Python数据分析

    Python爬取网页数据

    // An highlighted block
    import requests
    if __name__=="__main__":
        response = requests.get("https://book.douban.com/subject/26986954/")
        content = response.content.decode("utf-8")
        print(content)
    
    // An highlighted block
    import requests
    url="https://pro.jd.com/mall/active/4BNKTNkRMHJ48QQ5LrUf6AsydtZ6/index.html"
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        print(r.text[:100])
    except:
        print("爬取失败")
    

    Python生成柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    num_list = [1.5,0.6,7.8,6]  
    plt.bar(range(len(num_list)), num_list,color='rbgy')  
    plt.show()  
    

    在这里插入图片描述
    Python生成堆状柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    name_list = ['Monday','Tuesday','Friday','Sunday']  
    num_list = [1.5,0.6,7.8,6]  
    num_list1 = [1,2,3,1]  
    plt.bar(range(len(num_list)), num_list, label='boy',fc = 'y')  
    plt.bar(range(len(num_list)), num_list1, bottom=num_list, label='girl',tick_label = name_list,fc = 'r')  
    plt.legend()  
    plt.show()  
    

    在这里插入图片描述
    Python生成竖状柱状图

    // An highlighted block
    import matplotlib.pyplot as plt  
      
    name_list = ['Monday','Tuesday','Friday','Sunday']  
    num_list = [1.5,0.6,7.8,6]  
    num_list1 = [1,2,3,1]  
    x =list(range(len(num_list)))  
    total_width, n = 0.8, 2  
    width = total_width / n  
      
    plt.bar(x, num_list, width=width, label='boy',fc = 'y')  
    for i in range(len(x)):  
        x[i] = x[i] + width  
    plt.bar(x, num_list1, width=width, label='girl',tick_label = name_list,fc = 'r')  
    plt.legend()  
    plt.show()  
    

    在这里插入图片描述
    Python生成折线图

    // An highlighted block
    import pandas as pd
    import numpy as np
     
    df = pd.DataFrame(np.random.rand(15, 4), columns=['a', 'b', 'c', 'd'])
    df.plot.area() 
    

    在这里插入图片描述
    Python生成柱状图

    // An highlighted block
    import pandas as pd
    import numpy as np
     
    df = pd.DataFrame(3 * np.random.rand(5), index=['a', 'b', 'c', 'd','e'], columns=['x'])
    df.plot.pie(subplots=True)
    

    在这里插入图片描述
    Python生成箱型图

    // An highlighted block
    #首先导入基本的绘图包
    import matplotlib.pyplot as plt
    import numpy as np
    import pandas as pd
    
    #添加成绩表
    plt.style.use("ggplot")
    plt.rcParams['axes.unicode_minus'] = False
    plt.rcParams['font.sans-serif']=['SimHei'] 
    
    #新建一个空的DataFrame
    df=pd.DataFrame()
    
    // An highlighted block
    df["英语"]=[76,90,97,71,70,93,86,83,78,85,81]
    df["经济数学"]=[65,95,51,74,78,63,91,82,75,71,55]
    df["西方经济学"]=[93,81,76,88,66,79,83,92,78,86,78]
    df["计算机应用基础"]=[85,78,81,95,70,67,82,72,80,81,77]
    df
    
    // An highlighted block
    plt.boxplot(x=df.values,labels=df.columns,whis=1.5)
    plt.show()
    

    在这里插入图片描述

    // An highlighted block
    #用pandas自带的画图工具更快
    df.boxplot()
    plt.show()
    

    在这里插入图片描述
    Python生成正态分布图

    // An highlighted block
    # -*- coding:utf-8 -*-
    # Python实现正态分布
    # 绘制正态分布概率密度函数
    import numpy as np
    import matplotlib.pyplot as plt
    import math
    
    u = 0  # 均值μ
    u01 = -2
    sig = math.sqrt(0.2)  # 标准差δ
    
    x = np.linspace(u - 3 * sig, u + 3 * sig, 50)
    y_sig = np.exp(-(x - u) ** 2 / (2 * sig ** 2)) / (math.sqrt(2 * math.pi) * sig)
    print(x)
    print("=" * 20)
    print(y_sig)
    plt.plot(x, y_sig, "r-", linewidth=2)
    plt.grid(True)
    plt.show()
    

    在这里插入图片描述
    喜欢的小伙伴可以尝试一下哦

    这是小编公众号,请动动您可爱的小手手,关注一下💓😘
    在这里插入图片描述

    展开全文
  • Python数据分析案例教程,不仅介绍了使用Python进行数据分析所涉及的常用知识,而且介绍了6个流行的数据分析方面的项目。包括数据分析基础、NumPy模块实现数值计算、Pandas模块实现统计分析、Matplotlib模块实现...
  • 原标题:Python数据分析案例实战至今我们网站已经开设了多个数据分析系列的课程,大部分都是基于算法思路来开展的,课程中着重点在于算法的讲授、软件的使用,案例只是辅助学习。然而很多学员反映,希望可以在课程中...

    原标题:Python数据分析案例实战

    至今我们网站已经开设了多个数据分析系列的课程,大部分都是基于算法思路来开展的,课程中着重点在于算法的讲授、软件的使用,案例只是辅助学习。然而很多学员反映,希望可以在课程中多联系实际,多一点实际案例。本课程将思路反转过来,以一个个案例为线索,从原始的数据到最终的分析结果,一步步地为你讲授,实际案例中各种算法的使用,从原始数据到最终结果,一步步的分析过程,让学员可以真正地将各种数据分析算法应用到实际问题中!

    第一课:电力窃漏电用户识别系统案例实战

    传统的窃漏电分析是通过人工检测来进行的,对人的依赖性太大,为了提高窃漏电的判别效率,电力公司决定先根据用户的电表数据进行初步的自动判断,对于判别为窃漏电的用户再进行人工检测。

    第二课:公共交通运营数据分析案例实战

    某公共交通公司需要对运营数据进行挖掘分析,找出有用的信息以供决策之用。根据各线路的运营数据进行线路聚类,找出不同线路的发展特点。针对线路的历史成本,分析线路发展的基本规律。

    第三课:商圈分析案例实战

    随着交通路线的覆盖,城市中不同的商圈会呈现出不同的交通客运量特征。根据客运量特征对城市不同地点进行分析,区分出不同的商圈特征,并分析新线路或站点的开通对该地点的影响

    第四课:客户价值分析案例实战

    信息时代的到,使得企业营销的焦点从产品中心转变为客户中心,客户关系关系成为企业的核心问题。客户关系管理的关键问题是客户分类,根据客户分类,找到不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。

    第五课:基于用户行为分析的定向网络广告投放案例实战

    随着网络的发展,人们接受信息的渠道 和形式更加多元化,网络营销手段更是日趋多项化。网络时代广告投放最关键是定向性。为了进行定向广告投放,需要根据海量数据分析每个人的真实需求,然后为每个人建立独有的行为档案,根据档案库进行消费分析,匹配最合适有效的广告

    第六课:电子商务网站用户行为分析与推荐系统案例实战

    电子商务平台越发发达,面对的数据也越来越多。客户面对大量数据时难以及时获取自己需要的信息,会使得客户对网站的好感度降低,造成用户的流失。为了更好地满足用户需求,根据网络的海量数据,研究用户的兴趣偏好,分析用户的需求和行为,发现用户的兴趣点,将合适的产品与服务推荐给用户,从而加强网站与用户的联系。

    第七课:文本规律发现案例实战

    客户需要根据给定的样本集数据,学习其中的规律,并且将学习得出的规律用于判断新的数据是否与样本集中的数据具有同样的规律。

    第八课:电商产品评论的情感分析案例实战

    根据商品的评论数据,分析客户对商品的满意程度与对商品的有效建议

    第九课:欺诈交易检测案例实战

    某公司的销售员负责销售公司产品并定期进行销售报告,而销售价格是可以由销售员自行设定。该公司希望根据销售报告去发现交易中的错误与欺诈行为

    第十课:根据产品检测数据的次品判别分析案例实战

    根据产品的各项检测数据,分析正常产品与次品分布规律,并对新产品进行次品判别

    课程预计2019年12月3日开课,课程预计持续时间为12周。

    有一定python基础,对数据分析感兴趣的学员。

    真正让学员可以将各种数据分析算法应用到实际问题中

    何翠仪 毕业于中山大学统计学专业,炼数成金专职讲师。

    在炼数成金上开设了多门关于数据分析与数据挖掘相关的课程,如《大数据的统计学基础》、《大数据的矩阵基础》《金融时间序列分析》等,也曾到不同的公司开展R语言与数据分析的相关培训。对数据分析有深刻认识,曾与不同领域公司合作,参与到多个数据分析的项目中,如华为、广州地铁等返回搜狐,查看更多

    责任编辑:

    展开全文
  • 1.获取数据:想要获得道指30只成分股的最新股价importrequestsimportreimportpandas as pddefretrieve_dji_list():try:r= requests.get('https://money.cnn.com/data/dow30/')exceptConnectionError as err:print(err...

    1.获取数据:

    想要获得道指30只成分股的最新股价

    importrequestsimportreimportpandas as pddefretrieve_dji_list():try:

    r= requests.get('https://money.cnn.com/data/dow30/')exceptConnectionError as err:print(err)

    search_pattern= re.compile('class="wsod_symbol">(.*?).*?(.*?).*? .*?class="wsod_stream">(.*?)')

    dji_list_in_text=re.findall(search_pattern, r.text)

    dji_list=[]for item indji_list_in_text:

    dji_list.append([item[0], item[1], float(item[2])])returndji_list

    dji_list=retrieve_dji_list()

    djidf=pd.DataFrame(dji_list)print(djidf)

    整理数据, 改变列名, index等

    cols=['code','name','lasttrade']

    djidf.columns=cols #改变列名

    djidf.index=range(1,len(djidf)+1)

    最后结果为:

    1307805-20181127182817690-1698626124.png

    数据的选择

    djidf.code #获取code列+index

    djidf['code'] #获取code列 , 两者同功能

    djidf.loc[1:5,] #前5行

    djidf.loc[:,['code','lasttrade']] #所有行

    djidf.loc[1:5,['code','lasttrade']] #1-5行, loc表示标签index

    djidf.loc[1,['code','lasttrade']] #1行

    djidf.at[1,'lasttrade'] #只有一个值的时候可以用at

    djidf.iloc[2:4,[0,2]] #表示物理文职, 并且4取不到, 就只有第三行第四行

    djidf.iat[1,2] #单个值

    简单的数据筛选: 平均股价, 股价大于180的公司名

    djidf.lasttrade.mean() # 121.132

    djidf[djidf.lasttrade>=180].name

    1307805-20181127183508844-463758911.png

    找到股价前三名的公司 , 降序排列

    tempdf=djidf.sort_values(by='lasttrade',ascending=False)

    tempdf[:3].name

    如何根据index排序呢? 专门有函数sort_index()

    df=pd.DataFrame(np.random.randn(3,3),index=['c','b','a'],columns=list('xyz'))

    df.sort_index()#根据index 进行排序

    *获取AXP公司过去一年的股价数据获取

    importrequestsimportreimportjsonimportpandas as pdfrom datetime importdatedefretrieve_quotes_historical(stock_code):

    quotes=[]

    url= 'https://finance.yahoo.com/quote/%s/history?p=%s' %(stock_code, stock_code)try:

    r=requests.get(url)exceptConnectionError as err:print(err)

    m= re.findall('"HistoricalPriceStore":{"prices":(.*?),"isPending"', r.text)ifm:

    quotes= json.loads(m[0]) #m = ['[{...},{...},...]']

    quotes = quotes[::-1] #原先数据为date最新的在最前面

    return [item for item in quotes if not 'type' initem]

    quotes= retrieve_quotes_historical('AXP')

    list1=[]for i inrange(len(quotes)):

    x=date.fromtimestamp(quotes[i]['date'])

    y=date.strftime(x,'%Y-%m-%d')

    list1.append(y)

    quotesdf_ori=pd.DataFrame(quotes,index=list1)

    quotesdf_m= quotesdf_ori.drop(['adjclose'], axis = 1) #删除adjclose列

    quotesdf=quotesdf_m.drop(['date'],axis=1)print(quotesdf)

    上述需要对时间进行处理, 将时间转为'%Y-%m-%d'的格式, 并且将这个时间作为一个list 成为quotesdf的index.

    1307805-20181127183312427-898004346.png

    数据的筛选

    quotesdf[(quotesdf.index>='2017-03-01') & (quotesdf.index<='2017-03-31')]

    quotesdf[(quotesdf.index>='2017-11-30') & (quotesdf.index<='2018-03-31')&(quotesdf.close>=90)]

    简单计算

    (1) 统计AXP股价涨跌的天数 (close>open)

    len(quotesdf.close>quotesdf.open)

    (2) 相邻两天的涨跌

    importnumpy as np

    status=np.sign(np.diff(quotesdf.close))

    status#250 的长度, 比quotesdf 少1

    status[np.where(status==1)].size #np.where(status==1)是由下标构成的array#

    上述统计还可以直接用describe函数, 得到基本统计信息

    importpandas as pdimportnumpy as np

    index_df= pd.DataFrame(np.random.rand(3,3), index=['a','b','c'], columns=['index_1','index_2','index_3'])

    index_df.describe()#超级强大

    1307805-20181127183825487-363916830.png

    (3) 统计2018一月的交易日天数

    t=quotesdf[(quotesdf.index>='2018-01-01') & (quotesdf.index<'2018-02-01')]

    len(t) #21

    进一步, 如何统计近一年每个月的交易日天数?

    统计每个月的出现天数就行了, 如何提取月份信息? 要把时间的字符串转化为 时间格式,

    importtime

    list2=[]for i inrange(len(quotesdf)):

    temp=time.strptime(quotesdf.index[i],'%Y-%m-%d')

    list2.append(temp.tm_mon)#取月份

    tempdf=quotesdf.copy()

    tempdf['month']=list2 #新增一列月份的数据

    print(tempdf['month'].value_counts()) #计算每个月的出现次数

    注意:

    strptime 将字符串格式化为time结构, time 中会包含年份, 月份等信息

    strftime 将time 结构格式化一个字符串, 之前生成quotesdf中用到过

    上述方法略微麻烦, 如何快速知道每个月的交易日天数? groupby

    #统计每一月的股票开盘天数

    x=tempdf.groupby('month').count()#统计近一年每个月的成交量

    tempdf.groupby('month').sum().volume#先每个月进行求和, 但是这些对其他列也进行了求和, 属于无效计算, 如何避免?

    tempdf.groupby('month').volume.sum() #交换顺序即可

    引申: 一般groupby 与apply 在一起用. 具体不展开了

    deff(df):returndf.age.count()

    data_df.groupby('taste of mooncake').apply(f)

    (二) 合并DataFrame: append, concat, join

    #append

    p=quotesdf[:2]

    q=quotesdf['2018-01-01':'2018-01-05']

    p.append(q)#concat

    pieces=[tempdf[:5],tempdf[len(tempdf)-5:]]

    pd.concat(pieces)

    两个结构不同的DataFrame 如何合并?

    piece1=quotesdf[0:3]

    piece2=tempdf[:3]

    pd.concat([piece1,piece2],ignore_index=True)

    piece2有month 但是piece1中没有这个字段

    1307805-20181127184912238-642375928.png

    join函数中的各种参数, 可以用来实现SQL的各种合并功能.

    #join 两个dataframe要有共同的字段(列名)#djidf: code/name#AKdf: volume/code/month#合并之后的字段: code/name/volume/month

    pd.merge(djidf.drop(['lasttrade'],axis=1),AKdf, on='code')

    展开全文
  • python数据分析参考案例,在线选房系统代码和数据,网络收集
  • Python数据分析案例.zip

    2020-09-07 23:21:48
    本人学习Python大数据时,老师在课堂中讲解所用到的案例,比较经典,非常的不错,非常适合初学者做参考。
  • python数据分析案例数据 主要用于本人博客的部分文章案例数据使用。 单变量的样本分布检验(python3) 探索变量间关系 ....... 等文章的案例数据
  • 基本信息书名:Python数据分析案例实战(慕课版):59.80元作者:王浩,袁琴,张明慧 著出版社:人民邮电出版社出版日期:2020_06_01ISBN:9787115520845字数:页码:236版次:01装帧:平装开本:16开商品重量:编辑推荐...

    基本信息

    书名:Python数据分析案例实战(慕课版)

    :59.80元

    作者:王浩,袁琴,张明慧 著

    出版社:人民邮电出版社

    出版日期:2020_06_01

    ISBN:9787115520845

    字数:

    页码:236

    版次:01

    装帧:平装

    开本:16开

    商品重量:

    编辑推荐

    1. 明日科技写作经验丰富,案例众多。

    2. 配套资源丰富,慕课视频制作精良。

    3. 案例式写法适合应用型本科院校。

    本书作为Python数据分析的案例教程,不仅介绍了使用Python进行数据分析所涉及的常用知识,而且介绍了6个流行的数据分析方面的项目。

    内容提要

    主要内容包括:数据分析基础、NumPy模块实现数值计算、Pandas模块实现统计分析、Matplotlib模块实现数据可视化、【案例】客户价值分析、【案例】销售收入预测、【案例】二手房数据分析预测系统、【案例】智能停车场运营分析系统、【案例】影视作品分析和【案例】看店宝。

    目录

    第1章 数据分析基础 1

    1.1 什么是数据分析 2

    1.2 数据分析的应用 2

    1.3 数据分析方法 2

    1.3.1 对比分析法 3

    1.3.2 同比分析法 3

    1.3.3 环比分析法 4

    1.3.4 80/20法则 4

    1.3.5 回归分析法 4

    1.3.6 聚类分析法 5

    1.3.7 时间序列分析法 5

    1.4 数据分析工具 6

    1.5 数据分析流程 7

    1.5.1 明确目的 7

    1.5.2 获取数据 8

    1.5.3 数据处理 9

    1.5.4 数据分析 10

    1.5.5 验证结果 10

    1.5.6 数据展现 10

    1.5.7 数据应用 10

    1.6 Python数据分析常用模块 10

    1.6.1 数值计算模块 10

    1.6.2 数据处理模块 10

    1.6.3 数据可视化模块 11

    1.6.4 机器学习模块 11

    小结 11

    习题 11

    第2章 NumPy模块实现

    数值计算 12

    2.1 初识NumPy模块 13

    2.1.1 NumPy的诞生 13

    2.1.2 NumPy的安装 13

    2.1.3 NumPy的数据类型 14

    2.1.4 数组对象ndarray 15

    2.1.5 数据类型对象dtype 16

    2.2 NumPy模块中数组的基本操作 16

    2.2.1 内置的数组创建方法 16

    2.2.2 生成数 19

    2.2.3 切片和索引 20

    2.2.4 修改数组形状 21

    2.2.5 组合数组 22

    2.2.6 数组分割 24

    2.3 NumPy模块中函数的应用 25

    2.3.1 数学函数 26

    2.3.2 算术函数 27

    2.3.3 统计函数 27

    2.3.4 矩阵函数 30

    2.4 广播机制 31

    小结 32

    习题 32

    第3章 pandas模块实现统计

    分析 33

    3.1 安装pandas模块 34

    3.2 pandas数据结构 35

    3.2.1 Series对象 35

    3.2.2 DataFrame对象 37

    3.3 读、写数据 38

    3.3.1 读、写文本文件 38

    3.3.2 读、写Excel文件 40

    3.3.3 读、写数据库数据 41

    3.4 数据操作 44

    3.4.1 数据的增、删、改、查 44

    3.4.2 NaN数据处理 47

    3.4.3 时间数据的处理 50

    3.5 数据的分组与聚合 52

    3.5.1 分组数据 52

    3.5.2 聚合数据 54

    3.6 数据的预处理 56

    3.6.1 合并数据 56

    3.6.2 去除重复数据 60

    小结 62

    习题 62

    第4章 Matplotlib模块实现

    数据可视化 63

    4.1 基本用法 64

    4.1.1 安装 Matplotlib 64

    4.1.2 pyplot子模块的绘图流程 65

    4.1.3 pyplot子模块的常用语法 65

    4.2 绘制常用图表 66

    4.2.1 绘制条形图 66

    4.2.2 绘制折线图 69

    4.2.3 绘制散点图 70

    4.2.4 绘制饼图 71

    4.2.5 绘制箱形图 73

    4.2.6 多面板图表 75

    4.3 3D绘图 78

    4.3.1 3D线图 78

    4.3.2 3D曲面图 79

    4.3.3 3D条形图 81

    小结 82

    习题 82

    第5章 客户价值分析 83

    5.1 背景 84

    5.2 系统设计 84

    5.2.1 系统功能结构 84

    5.2.2 系统业务流程 84

    5.2.3 系统预览 84

    5.3 系统开发 86

    5.3.1 开发环境及工具 86

    5.3.2 项目文件结构 86

    5.4 分析方法 87

    5.4.1 RFM模型 87

    5.4.2 聚类分析 87

    5.4.3 k_means聚类算法 88

    5.5 技术准备 88

    5.5.1 sklearn模块 89

    5.5.2 k_means聚类 89

    5.5.3 pandas模块 90

    5.6 用Python实现客户价值分析 90

    5.6.1 数据抽取 90

    5.6.2 数据探索分析 90

    5.6.3 数据处理 91

    5.6.4 客户聚类 92

    5.6.5 客户价值分析 94

    小结 94

    习题 94

    第6章 销售收入分析与预测 95

    6.1 背景 96

    6.2 系统设计 96

    6.2.1 系统功能结构 96

    6.2.2 系统业务流程 96

    6.2.3 系统预览 97

    6.3 系统开发 97

    6.3.1 开发环境及工具 97

    6.3.2 项目文件结构 97

    6.4 分析方法 97

    6.4.1 线性回归 97

    6.4.2 最小二乘法 98

    6.5 线性回归模型 100

    6.6 Excel日期数据处理 101

    6.6.1 按日期筛选数据 101

    6.6.2 按日期显示数据 101

    6.6.3 按日期统计数据 102

    6.7 分析与预测 102

    6.7.1 数据处理 103

    6.7.2 日期数据统计并显示 103

    6.7.3 根据历史销售数据

    绘制拟合图 103

    6.7.4 预测销售收入 104

    小结 105

    习题 105

    第7章 二手房数据分析

    预测系统 106

    7.1 需求分析 107

    7.2 系统设计 107

    7.2.1 系统功能结构 107

    7.2.2 系统业务流程 107

    7.2.3 系统预览 107

    7.3 系统开发 111

    7.3.1 开发环境及工具 111

    7.3.2 文件夹组织结构 111

    7.4 技术准备 111

    7.4.1 sklearn库概述 111

    7.4.2 加载datasets子模块中的

    数据集 111

    7.4.3 支持向量回归函数 114

    7.5 图表工具模块 115

    7.5.1 绘制饼图 115

    7.5.2 绘制折线图 116

    7.5.3 绘制条形图 117

    7.6 二手房数据分析 118

    7.6.1 清洗数据 118

    7.6.2 各区二手房均价分析 119

    7.6.3 各区房子数量比例 120

    7.6.4 全市二手房装修程度分析 121

    7.6.5 热门户型均价分析 122

    7.6.6 二手房售价预测 123

    小结 126

    习题 126

    第8章 智能停车场运营

    分析系统 127

    8.1 需求分析 128

    8.2 系统设计 128

    8.2.1 系统功能结构 128

    8.2.2 系统业务流程 128

    8.2.3 系统预览 128

    8.3 系统开发 132

    8.3.1 开发环境及工具 132

    8.3.2 文件夹组织结构 132

    8.4 技术准备 133

    8.4.1 初识Pygame 133

    8.4.2 Pygame的基本应用 133

    8.4.3 时间模块 136

    8.4.4 日期时间模块 138

    8.5 智能停车场数据分析 141

    8.5.1 停车时间数据分布图 141

    8.5.2 停车高峰时间所占比例 143

    8.5.3 每周繁忙统计 145

    8.5.4 月收入分析 147

    8.5.5 每日接待车辆统计 149

    8.5.6 车位使用率 150

    小结 152

    习题 152

    第9章 影视作品分析 153

    9.1 需求分析 154

    9.2 系统设计 154

    9.2.1 系统功能结构 154

    9.2.2 系统业务流程 154

    9.2.3 系统预览 155

    9.3 系统开发 156

    9.3.1 开发环境及工具 156

    9.3.2 文件夹组织结构 156

    9.4 技术准备 157

    9.4.1 使用jieba模块进行分词 157

    9.4.2 使用wordcloud库实现

    词云图 159

    9.5 主窗体设计 162

    9.5.1 实现主窗体 162

    9.5.2 查看部分的隐藏与显示 163

    9.5.3 下拉列表处理 164

    9.6 数据分析与处理 166

    9.6.1 获取数据 166

    9.6.2 生成全国热力图文件 167

    9.6.3 生成主要城市评论数及平均

    分文件 168

    9.6.4 生成词云图 168

    9.7 单击查看显示内容 169

    9.7.1 创建显示HTML页面的窗体 169

    9.7.2 创建显示图片的窗体 170

    9.7.3 绑定查询按钮单击事件 171

    小结 172

    习题 172

    第10章 看店宝 173

    10.1 需求分析 174

    10.2 系统设计 175

    10.2.1 系统功能结构 175

    10.2.2 系统业务流程 175

    10.2.3 系统预览 175

    10.3 系统开发 179

    10.3.1 开发环境及工具 179

    10.3.2 文件夹组织结构 179

    10.4 技术准备 180

    10.4.1 使用Python操作数据库 180

    10.4.2 JSON模块的应用 181

    10.5 主窗体的UI设计 182

    10.5.1 对主窗体进行可视化设计 182

    10.5.2 将可视化窗体转换为.py

    文件 184

    10.5.3 设置窗体及控件背景 184

    10.5.4 创建窗体控制文件 185

    10.5.5 主窗体预览效果 185

    10.6 设计数据库表结构 186

    10.7 初始数据的爬取 187

    10.7.1 爬取排行信息 187

    10.7.2 爬取价格信息 190

    10.7.3 爬取评价信息 191

    10.7.4 定义数据库操作文件 194

    10.8 图表分析数据 197

    10.8.1 饼图展示评价信息 197

    10.8.2 分析出版社所占比例的

    条形图 198

    10.8.3 折线图分析价格走势 199

    10.8.4 Top10数据展示 200

    10.9 商品排行展示 203

    10.9.1 热销商品排行榜 203

    10.9.2 热门商品展示 205

    10.10 关注商品 207

    10.10.1 分析关注商品的预警信息 207

    10.10.2 重点商品的关注与取消 208

    10.11 商品营销预警 214

    10.11.1 商品中、差评预警 214

    10.11.2 商品价格变化预警 216

    10.12 关注商品图表分析 218

    10.12.1 关注商品评价分析饼图 218

    10.12.2 关注商品出版社占有比例 220

    10.13 其他功能 222

    小结 224

    习题 224

    作者介绍

    明日科技,程序设计类畅销图书作者,绝大多数品种在"全国计算机图书排行榜”同品种排行中名列前茅,累计销售百万册。作者编写的《Python从入门到项目实战》《零基础学Python》《Python从入门到精通》等长期占据各网店排行榜的榜首位置。

    序言

    展开全文
  • 最好使用notebook运行.如果直接用使用python运行,只会出现一张图片。
  • Python数据分析案例实战 视频课程 JAVA企业级应用讲师、大数据实时处...
  • python数据分析:客户价值分析案例实战 数据集,相应文章地址为:https://blog.csdn.net/weixin_42000526/article/details/82014361
  • Python数据分析课程以Python为核心工具,结合其工具包pyecharts+开发IDEA pycharm + web 框架Flask。课程以案例为中心,结合案例讲解让同学们更清晰的掌握每一个知识点的应用与工作流程。 2大项目案例: 重点讲解 ...
  • Python数据分析案例篇(一)泰坦尼克号数据分析

    千次阅读 多人点赞 2019-08-02 21:01:32
    Kaggle Titanic 数据分析案例 背景介绍 20世纪初,由英国白星航运公司制造的一艘巨大豪华客轮。是当时世界上最大的豪华客轮,被称为是“永不沉没的”或是“梦幻客轮”。 泰坦尼克号是人类的美好梦想达到顶峰时...
  • 无论是做机器学习还是做数据分析,都离不开获取数据后的第一步-数据清洗工作。据统计,数据清洗工作占据整个工作时间百分之50左右,有的甚至能达到百分之70。下面我将介绍我进行数据清洗得思路流程。 数据清洗整体...
  • 两个学习道具:1)这个网页可以调用全球最大的搜索引擎(长按此处可以复制):事先准备:在notebook中想要导入Excel文件,要先安装一个读取Excel文件的包:xlrd安装步骤:1>现在conda中进入当前文件所在的Python环境...
  • 数据的增删改查 NaN数据处理 时间数据的处理 数据的分组与聚合 分组数据 Series对象 DataFrame对象 SeriesGroupBy 对象 DataFrameGroupBy对象 key data a 1 a 2 b 3 c 4 a 5 分组 a 1 a 2 a 5 b 3 c 4 求和 key data...
  • 全面地介绍数据分析的流程和Python数据分析库的应用,详细讲解利用Python解决企业实际问题的方法。* 1章介绍了数据分析的基本概念等相关知识;* 2~6章介绍了Python数据分析的常用库及其应用,涵盖NumPy数值计算、...
  • 《利用python进行数据分析》中所用的CSV文件,用于各种python pandas以及其他第三方包的功能的展示。
  • Python数据分析案例-药店销售数据分析

    万次阅读 多人点赞 2020-05-20 11:14:02
    最近学习了Python数据分析的一些基础知识,就找了一个药品数据分析的小项目来练一下手。 数据分析的目的: 本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,通过对朝阳区...
  • 对Excel数据进行读取并重新整理至新Excel,并绘制Excel中数据为图表
  • Python数据分析:数据可视化案例

    万次阅读 多人点赞 2019-04-29 21:35:42
    Python数据分析:数据可视化案例 import pandas as pd import matplotlib.pyplot as plt from matplotlib import style style.use('ggplot') # 设置图片显示的主题样式 # 解决matplotlib显示中文问题 plt.rcParams...
  • 其中包含4个案例,以毕业论文的格式写出。包含原始数据。代码可复制粘贴。
  • 2021python数据分析实例教程 python数据分析与可视化教程
  • 2、NumPy中用于统计分析的基本运算函数。3、矩阵创建方法。4、数组索引的方法。5、pyplot基础语法。6、子图的绘制方法。7、散点图、折线图的绘制方法。8、直方图绘制方法。9、饼图绘制。10、箱线图绘制。
  • 数据集的获取: 1、grouplens官方网址 或者 2、 链接: https://pan.baidu.com/s/1wfU20GH2gLd1Ok262v_X2Q 提取码: us6i 使用上述压缩包中的以下三个文件 有关上述三个文件的介绍: u.data -- The full u data ...
  • python数据分析基础

    2021-07-01 04:23:21
    8个常用python工具库 + 10小时以上视频课程 + 50个工作常用技能 + 4个爬虫案例 + 10个行业数据分析案例, 介绍python数据分析、爬虫基础技巧, 助你提升职场竞争力, 转行、应聘简历加分。 课程介绍python数据读取、...
  • 课程——基于Python数据分析与机器学习案例实战教程分享网盘下载——https://pan.baidu.com/s/1jHSaRAY 密码: xk37 课程背景基于数据分析与机器学习领域,使用python作为课程的实战语言,随着大数据与人工智能领域日...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 158,734
精华内容 63,493
关键字:

python数据分析案例

python 订阅