python数据分析实战 订阅
《Python数据分析实战》是2019年7月人民邮电出版社出版的图书,作者是[意]内利(Fabio Nelli)。 展开全文
《Python数据分析实战》是2019年7月人民邮电出版社出版的图书,作者是[意]内利(Fabio Nelli)。
信息
页    数
290页
作    者
[意]内利(Fabio Nelli)
定    价
59元
装    帧
平装
书    名
Python数据分析实战
出版时间
2019年7月
开    本
16开
出版社
人民邮电出版社
ISBN
9787115432209
Python数据分析实战内容简介
Python 简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python 语言的强大功能,以小的编程代价进行数据的提取、处理和分析,主要内容包括:数据分析和Python 的基本介绍,NumPy 库,pandas 库,如何使用pandas 读写和提取数据,用matplotlib 库和scikit-learn 库分别实现数据可视化和机器学习,以实例演示如何从原始数据获得信息、D3 库嵌入和手写体数字的识别。 [1] 
收起全文
精华内容
下载资源
问答
  • Python数据分析实战

    千次阅读 多人点赞 2020-06-11 14:42:48
    Python数据分析实战 数据及要求 现请帮班主任做如下工作: 给成绩表加上姓名列; 给成绩表加上字段“总分”列,并求出总分; 增加列字段“等级”,标注每人“总分”的“优、良、中、及格、差”(270≤优,240...

    Python数据分析实战

    数据及要求

    文件可以在博主得资源上下载,如果是源文件有个缺考得话,把他人为改成0或者使用python代码写也可以
    在这里插入图片描述
    在这里插入图片描述
    现请帮班主任做如下工作:

    1. 给成绩表加上姓名列;

    2. 给成绩表加上字段“总分”列,并求出总分;

    3. 增加列字段“等级”,标注每人“总分”的“优、良、中、及格、差”(270≤优,240≤良, 210≤中,及格≤180,差≤180);

    4. 计算各门课程的平均成绩以及标准差;

    5. 做"总分"成绩分布图,纵坐标表示成绩,横坐标表示学号或者姓名,画出总分的均分横线,让每位同学的总分圆点分布在均分线上下,以便于观察每位同学的成绩离开均分的距离。

    一、导入数据

    import pandas as pd
    sheet1 = pd.read_excel("E:\python_data.xlsx",sheet_name="成绩表")
    sheet2 = pd.read_excel("E:\python_data.xlsx",sheet_name="信息表")
    sheet1
    
    

    在这里插入图片描述

    二、将sheet2的姓名添加至sheet1中

    注意你们的文件上的列名是“手机号码”还是“手机号”,博主使用的是“手机号”为列名

    sheet1 = pd.merge(sheet1,sheet2,left_on='学号',right_on='学号')      #连接两个表
    sheet1 = sheet1.drop(columns = ['手机号']) 
    sheet1
    
    

    或者在第一步读取文件的时候改成sheet2 = pd.read_excel("E:\python_data.xlsx",sheet_name="信息表",usecols=[0,1]),这样就可以不用drop手机号了
    在这里插入图片描述

    三、计算总分
    如果源文件是有缺考得话还需要加多一句代码,替换下sheet1.loc[sheet1['线代']=='缺考','线代']=0

    sheet1["总分"] = sheet1["C#"]+sheet1["线 代"]+sheet1["Python"]
    sheet1
    
    

    在这里插入图片描述
    四、为总分定等级

    • 方法一
    def return_ans(x):
        
        if x>=270:
            b='优'
        elif x>=240 and x<270:
            b='良'
        elif x>=210 and x<240:
            b='中'
        elif x>=180 and x<210:
            b='及格'
        else:
            b='差'
        return b
    sheet1['等级'] = sheet1['总分'].apply(lambda x:return_ans(x))
    sheet1
    
    

    在这里插入图片描述

    • 方法二

    此处得bins最后不可以写max(sheet1.总分)+1,因为这份数据没有一个总分超过270得,所以会报错

    bins=[min(sheet1.总分)-1,180,210,240,270,999]
    labels=["差","及格","中","良","优"]
    sheet1['等级']=pd.cut(sheet1.总分,bins,right=False,labels=labels)
    sheet1
    
    

    在这里插入图片描述
    五、计算各科成绩的均值和标准差

    print("C#的平均成绩为",sheet1['C#'].values.mean())
    print("C#的标准差为",sheet1['C#'].values.std())
    print("线 代的平均成绩为",sheet1['线 代'].values.mean())
    print("线 代的标准差为",sheet1['线 代'].values.std())
    print("Python的平均成绩为",sheet1['Python'].values.mean())
    print("Python的标准差为",sheet1['Python'].values.std())
    
    

    在这里插入图片描述
    六、对数据进行可视化,并用红线代表平均分数线

    import matplotlib.pyplot as plt
    plt.rcParams['font.sans-serif'] = ['Simhei']
    s = sheet1['总分'].values.mean()
    plt.bar(range(len(sheet1['总分'])),sheet1['总分'],width=0.8)
    plt.xticks(range(len(sheet1['总分'])),sheet1['姓名'])
    plt.axhline(s, color='red', linestyle='--')
    plt.show()
    
    

    在这里插入图片描述

    赞~

    展开全文
  • Python数据分析实战作者:(印)伊凡·伊德里斯(Ivan Idris) 著出版日期:2017年08月文件大小:79.34M支持设备:¥50.00在线试读适用客户端:言商书局iPad/iPhone客户端:下载 Android客户端:下载PC客户端:下载...

    20170828145404890.jpg

    Python数据分析实战

    作者:(印)伊凡·伊德里斯(Ivan Idris) 著

    出版日期:2017年08月

    文件大小:79.34M

    支持设备:

    ¥50.00在线试读

    适用客户端:

    ys-logo.png言商书局

    iPad/iPhone客户端:下载 Android客户端:下载PC客户端:下载更多详情:查看

    ?对图书下载、阅读卡购买有疑问:立即进入帮助中心>>

    图书简介

    目录

    Python语言诞生已经超过25年,距离Python3发布也已经快10年了。经过大浪淘沙,Python却依旧势头强劲,长期稳居编程语言市场占有率前十,甚至前五。各个领域都能看到Python的身影,从Web开发到数据挖掘,从网络爬虫到图像分析等。这从一个侧面也印证了一门编程语言要想"成功”,除了优良的语言本身特性之外,强大的生态圈也必不可少。

    译者序

    前言

    第1章 为可重复的数据分析奠定基础

    1.1 简介

    1.2 安装Anaconda

    1.3 安装数据科学工具包

    1.4 用virtualenv和virtualenvwrapper创建Python虚拟环境

    1.5 使用Docker镜像沙盒化Python应用

    1.6 在IPython Notebook中记录软件包的版本和历史

    1.7 配置IPython

    1.8 学习为鲁棒性错误校验记录日志

    1.9 为你的代码写单元测试

    1.10 配置pandas

    1.11 配置matplotlib

    1.12 为随机数生成器和NumPy打印选项设置种子

    1.13 使报告、代码风格和数据访问标准化

    第2章 创建美观的数据可视化

    2.1 简介

    2.2 图形化安斯库姆四重奏

    2.3 选择Seaborn的调色板

    2.4 选择matplotlib的颜色表

    2.5 与IPython Notebook部件交互

    2.6 查看散点图矩阵

    2.7 通过mpld3使用d3.js进行可视化

    2.8 创建热图

    2.9 把箱线图、核密度图和小提琴图组合

    2.10 使用蜂巢图可视化网络图

    2.11 显示地图

    2.12 使用类ggplot2图

    2.13 使用影响图高亮数据

    第3章 统计数据分析和概率

    3.1 简介

    3.2 将数据拟合到指数分布

    3.3 将聚合数据拟合到伽马分布

    3.4 将聚合计数拟合到泊松分布

    3.5 确定偏差

    3.6 估计核密度

    3.7 确定均值、方差和标准偏差的置信区间

    3.8 使用概率权重采样

    3.9 探索极值

    3.10 使用皮尔逊相关系数测量变量之间的相关性

    3.11 使用斯皮尔曼等级相关系数测量变量之间的相关性

    3.12 使用点二列相关系数测量二值变量和连续变量的相关性

    3.13 评估变量与方差分析之间的关系

    第4章 处理数据和数值问题

    4.1 简介

    4.2 剪辑和过滤异常值

    4.3 对数据进行缩尾处理

    4.4 测量噪声数据的集中趋势

    4.5 使用Box-Cox变换进行归一化

    4.6 使用幂阶梯转换数据

    4.7 使用对数转换数据

    4.8 重组数据

    4.9 应用logit()来变换比例

    4.10 拟合鲁棒线性模型

    4.11 使用加权最小二乘法考虑方差

    4.12 使用任意精度进行优化

    4.13 使用任意精度的线性代数

    第5章 网络挖掘、数据库和大数据

    5.1 简介

    5.2 模拟网页浏览

    5.3 网络数据挖掘

    5.4 处理非ASCII文本和HTML实体

    5.5 实现关联表

    5.6 创建数据库迁移脚本

    5.7 在已经存在的表中增加一列

    5.8 在表创建之后添加索引

    5.9 搭建一个测试Web服务器

    5.10 实现具有事实表和维度表的星形模式

    5.11 使用Hadoop分布式文件系统

    5.12 安装配置Spark

    5.13 使用Spark聚类数据

    第6章 信号处理和时间序列

    6.1 简介

    6.2 使用周期图做频谱分析

    6.3 使用Welch算法估计功率谱密度

    6.4 分析峰值

    6.5 测量相位同步

    6.6 指数平滑法

    6.7 评估平滑法

    6.8 使用Lomb-Scargle周期图

    6.9 分析音频的频谱

    6.10 使用离散余弦变换分析信号

    6.11 对时序数据进行块自举

    6.12 对时序数据进行动态块自举

    6.13 应用离散小波变换

    第7章 利用金融数据分析选择股票

    7.1 简介

    7.2 计算简单收益率和对数收益率

    7.3 使用夏普比率和流动性对股票进行排名

    7.4 使用卡玛和索提诺比率对股票进行排名

    7.5 分析收益统计

    7.6 将个股与更广泛的市场相关联

    7.7 探索风险与收益

    7.8 使用非参数运行测试检验市场

    7.9 测试随机游走

    7.10 使用自回归模型确定市场效率

    7.11 为股票价格数据库建表

    7.12 填充股票价格数据库

    7.13 优化等权重双资产组合

    第8章 文本挖掘和社交网络分析

    8.1 简介

    8.2 创建分类的语料库

    8.3 以句子和单词标记化新闻文章

    8.4 词干提取、词形还原、过滤和TF-IDF得分

    8.5 识别命名实体

    8.6 提取带有非负矩阵分解的主题

    8.7 实现一个基本的术语数据库

    8.8 计算社交网络密度

    8.9 计算社交网络接近中心性

    8.10 确定中介中心性

    8.11 评估平均聚类系数

    8.12 计算图的分类系数

    8.13 获得一个图的团数

    8.14 使用余弦相似性创建文档图

    第9章 集成学习和降维

    9.1 简介

    9.2 递归特征消除

    9.3 应用主成分分析来降维

    9.4 应用线性判别分析来降维

    9.5 多模型堆叠和多数投票

    9.6 学习随机森林

    9.7 使用RANSAC算法拟合噪声数据

    9.8 使用Bagging来改善结果

    9.9 用于更好学习的Boosting算法

    9.10 嵌套交叉验证

    9.11 使用joblib重用模型

    9.12 层次聚类数据

    9.13 Theano之旅

    第10章 评估分类器、回归器和聚类

    10.1 简介

    10.2 直接使用混淆矩阵分类

    10.3 计算精度、召回率和F1分数

    10.4 检测接收器操作特性和曲线下的面积

    10.5 可视化拟合优度

    10.6 计算均方误差和中值绝对误差

    10.7 用平均轮廓系数评估聚类

    10.8 将结果与伪分类器进行比较

    10.9 确定平均绝对百分误差和平均百分误差

    10.10 与伪回归器进行比较

    10.11 计算平均绝对误差和残差平方和

    10.12 检查分类的kappa系数

    10.13 运用Matthews相关系数

    第11章 图像分析

    11.1 简介

    11.2 安装OpenCV

    11.3 应用尺度不变特征变换(SIFT)

    11.4 使用加速鲁棒特征检测特征

    11.5 量化颜色

    11.6 图像降噪

    11.7 提取图像区域

    11.8 使用Haar级联进行面部识别

    11.9 搜索明亮的星星

    11.10 从图像中提取元数据

    11.11 从图像中提取纹理特征

    11.12 对图像应用层次聚类

    11.13 使用光谱聚类分割图像

    第12章 并行和性能

    12.1 简介

    12.2 使用Numba做即时编译

    12.3 使用Numexpr加速数值表达式

    12.4 使用线程模块运行多线程

    12.5 使用concurrent.futures模块启动多任务

    12.6 使用asyncio模块异步访问资源

    12.7 使用execnet做分布式处理

    12.8 分析内存使用情况

    12.9 计算平均值、方差、偏度和峰度

    12.10 使用最近最少使用算法进行缓存

    12.11 缓存HTTP请求

    12.12 使用Count-min sketch进行流式统计

    12.13 充分利用GPU和OpenGL

    附录A 术语表

    附录B 函数参考

    附录C 在线资源

    附录D 命令行和其他工具的一些提示和技巧

    展开全文
  • 第四章 Python数据分析实战 习题(数据见附件sizhang.xlsx) 班主任现有一班级的两张表,如下。 表一:成绩表 学 号 C# 线 代 Python 16010203 78 88 96 表二:信息表 姓 名 学 号 手机号码 张三 16010203 ...

    第四章 Python数据分析实战 习题(数据见附件sizhang.xlsx)

    1. 班主任现有一班级的两张表,如下。

    表一:成绩表

    学 号 C# 线 代 Python

    16010203 78 88 96

    表二:信息表

    姓 名 学 号 手机号码

    张三 16010203 16699995521

    现请帮班主任做如下工作:

    1. 给成绩表加上姓名列;

    2. 给成绩表加上字段“总分”列,并求出总分;

    3. 增加列字段“等级”,标注每人“总分”的“优、良、中、及格、差”(270≤优,240≤良, 210≤中,及格≤180,差≤180);

    4. 计算各门课程的平均成绩以及标准差;

    5. 做"总分"成绩分布图,纵坐标表示成绩,横坐标表示学号或者姓名,画出总分的均分横线,让每位同学的总分圆点分布在均分线上下,以便于观察每位同学的成绩离开均分的距离。

    你们要的Python作业来啦,详细代码介绍可查看我徒弟的博客Python数据分析实战

    此处只是将我徒弟的代码做一个总合。其中有需要注意的地方,运行时有个问题: 读取Excel表格数据时,sheet_name根据你的表格sheet名称填写。
    在这里插入图片描述

    在此声明,此代码来自我徒弟:潇囧囧_的博客,更多好文章,学习总结可关注我徒弟一起学习交流。

    import pandas as pd
    sheet1 = pd.read_excel("D:\Downloads\python_data.xlsx",sheet_name="成绩表")
    sheet2 = pd.read_excel("D:\Downloads\python_data.xlsx",sheet_name="信息表")
    print(sheet1)
    
    sheet1 = pd.merge(sheet1,sheet2,left_on='学号',right_on='学号')      #连接两个表
    sheet1 = sheet1.drop(columns = ['手机号']) 
    print(sheet1)
    
    sheet1["总分"] = sheet1["C#"]+sheet1["线 代"]+sheet1["Python"]
    print(sheet1)
    
    def return_ans(x):
        
        if x>=270:
            b='优'
        elif x>=240 and x<270:
            b='良'
        elif x>=210 and x<240:
            b='中'
        elif x>=180 and x<210:
            b='及格'
        else:
            b='差'
        return b
    sheet1['等级'] = sheet1['总分'].apply(lambda x:return_ans(x))
    print(sheet1)
    
    print("C#的平均成绩为",sheet1['C#'].values.mean())
    print("C#的标准差为",sheet1['C#'].values.std())
    print("线 代的平均成绩为",sheet1['线 代'].values.mean())
    print("线 代的标准差为",sheet1['线 代'].values.std())
    print("Python的平均成绩为",sheet1['Python'].values.mean())
    print("Python的标准差为",sheet1['Python'].values.std())
    
    import matplotlib.pyplot as plt
    plt.rcParams['font.sans-serif'] = ['Simhei']
    s = sheet1['总分'].values.mean()
    plt.bar(range(len(sheet1['总分'])),sheet1['总分'],width=0.8)
    plt.xticks(range(len(sheet1['总分'])),sheet1['姓名'])
    plt.axhline(s, color='red', linestyle='--')
    plt.show()
    
    
    

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    欢迎关注公众号【夜来疏影】
    在这里插入图片描述

    展开全文
  • Python数据分析实战(高清版)PDF百度网盘链接:https://pan.baidu.com/s/1nlHM1IW8MYg3z79TUwIsWg提取码:ux8t复制这段内容后打开百度网盘手机App,操作更方便哦内容简介 · · · · · ·Python 简单易学,拥有...

    Python数据分析实战(高清版)PDF

    百度网盘

    链接:https://pan.baidu.com/s/1nlHM1IW8MYg3z79TUwIsWg

    提取码:ux8t

    复制这段内容后打开百度网盘手机App,操作更方便哦

    内容简介 · · · · · ·

    Python 简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python 语言的强大功能,以最小的编程代价进行数据的提取、处理和分析,主要内容包括:数据分析和Python 的基本介绍,NumPy 库,pandas 库,如何使用pandas 读写和提取数据,用matplotlib 库和scikit-learn 库分别实现数据可视化和机器学习,以实例演示如何从原始数据获得信息、D3 库嵌入和手写体数字的识别。

    作者简介 · · · · · ·

    作者简介:

    Fabio Nelli

    IRBM科学园IT科学应用专家,曾为IBM、EDS等企业提供咨询。目前正在开发Java应用,对接科学仪器和Oracle数据库,生成数据和Web服务器应用,为研究人员提供实时分析结果。他还是Meccanismo Complesso社区(www.meccanismocomplesso.org)的项目协调人。

    译者简介:

    杜春晓

    英语语言文学学士,软件工程硕士。其他译著有《电子达人——我的第一本Raspberry Pi入门手册》和《Python数据挖掘入门与实践》。新浪微博:@宜_生。

    目录 · · · · · ·

    第1章 数据分析简介  1

    1.1 数据分析  1

    1.2 数据分析师的知识范畴  2

    1.2.1 计算机科学  2

    1.2.2 数学和统计学  3

    1.2.3 机器学习和人工智能  3

    · · · · · · (更多)

    展开全文
  • 2020互联网数据分析师教程视频 统计学分析与数据实战 r语言数据分析实战 python数据分析实战 excel自动化报表分析实战 excel数据分析处理实战
  • 本课程是Python数据分析实战课程,从数据搜集、数据存取、数据清洗、数据分析、数据可视化一步一步完成北京二手房价数据分析过程。
  • 第四章 Python数据分析实战 习题(数据见附件sizhang.xlsx)班主任现有一班级的两张表,如下。表一:成绩表学 号C#线 代Python16010203788896表二:信息表姓 名学 号手机号码张三1601020316699995521现请帮班主任做...
  • python数据分析实战 pdf是一本由意大利内利编写的python教程,可以帮助你充分的了解python语言的强大所在,并且提供拥有可行性的案例,有需要可以下载学习!python数据分析实战 pdf简介《python数据分析实战》作者...
  • 原标题:Python数据分析案例实战至今我们网站已经开设了多个数据分析系列的课程,大部分都是基于算法思路来开展的,课程中着重点在于算法的讲授、软件的使用,案例只是辅助学习。然而很多学员反映,希望可以在课程中...
  • python数据分析与挖掘实战是一本python语言数据分析和挖掘指南,由张良均,王路,谭立云和苏剑林等十余个专家编著而成。本书以大家熟知的数据挖掘建模工具Python语言来展开,以解决某个应用的挖掘目标为前提,先介绍...
  • Python数据分析实战-Pandas

    千人学习 2019-12-02 10:54:20
           Pandas包是基于Python平台的数据管理利器,已经成为了Python进行... 这门课程目标是,高效快速的让大家在最短的时间内掌握好pandas这个在python数据分析中不可缺少的数据分析框架。 
  • 第二课:公共交通运营数据分析案例实战某公共交通公司需要对运营数据进行挖掘分析,找出有用的信息以供决策之用。根据各线路的运营数据进行线路聚类,找出不同线路的发展特点。针对线路的历史...
  • 基本信息书名:Python数据分析案例实战(慕课版):59.80元作者:王浩,袁琴,张明慧 著出版社:人民邮电出版社出版日期:2020_06_01ISBN:9787115520845字数:页码:236版次:01装帧:平装开本:16开商品重量:编辑推荐...
  • Python数据分析实战 适用人群:适合需提升竞争力、提升工作效率、喜欢用数据说话的职场人士,如从事产品、运营、市场、分析、挖掘、程序等 【课程简介】 跟小蚊子学数据分析--Python数据分析实战,简单、实用的...
  • 最新Python数据分析实战教程

    千次阅读 2019-02-22 14:21:20
    课程简介:·跟小蚊子学数据分析--Python数据分析实战,简单、实用的Python数据分析视频教程。·主要介绍Python在数据处理、数据分析、数据可视化方面常用的实战方法与技巧。·本课程目的是帮助学员提升工作效率及...
  • 系列一:《python数据分析基础与实践》 章节1Python概况 课时2Python简介 章节2Python安装 课时3安装Anaconda 课时4使用Anaconda 章节3数据准备 课时5数据类型 – 布尔型 课时6数据类型 – 数值型 课时7数据类型 – ...
  • 课程简介:·跟小蚊子学数据分析--Python数据分析实战,简单、实用的Python数据分析视频教程。·主要介绍Python在数据处理、数据分析、数据可视化方面常用的实战方法与技巧。·本课程目的是帮助学员提升工作效率及...
  • 这是Python数据分析实战基础的第一篇内容,主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学,可以加快手速滑动浏览或者直接略过本文。 01重要的前言 这段时间和一些做数据分析的同学闲聊,我发现数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,808
精华内容 3,923
关键字:

python数据分析实战

python 订阅