精华内容
下载资源
问答
  • Python数据分析与可视化》共12章的完整课件、例题代码和所有实验数据
  • 目录第1章数据分析与可视化概述1.1数据分析1.2数据可视化1.3数据分析与可视化常用工具1.4为何选用Python进行数据分析与可视化1.5Python数据分析与可视化常用类库1.6Jupyter Notebook的使用1.7本章小结第2章...

    目录

    第1章数据分析与可视化概述

    1.1数据分析

    1.2数据可视化

    1.3数据分析与可视化常用工具

    1.4为何选用Python进行数据分析与可视化

    1.5Python数据分析与可视化常用类库

    1.6Jupyter Notebook的使用

    1.7本章小结

    第2章Python编程基础

    2.1Python语言基本语法

    2.1.1基础数据类型

    2.1.2变量和赋值

    2.1.3运算符和表达式

    2.1.4字符串

    2.1.5流程控制

    2.2内置数据类型

    2.2.1列表

    2.2.2元组

    2.2.3字典

    2.2.4集合

    2.3函数

    2.3.1函数的定义

    2.3.2lambda函数

    2.4文件操作

    2.4.1文件处理过程

    2.4.2数据的读取方法

    2.4.3读取CSV文件

    2.4.4文件写入与关闭

    2.5本章小结

    本章实训

    第3章NumPy数值计算基础

    3.1NumPy多维数组

    3.1.1创建数组对象

    3.1.2ndarray对象属性和数据转换

    3.1.3生成随机数

    3.1.4数组变换

    3.2数组的索引和切片

    3.2.1一维数组的索引

    3.2.2多维数组的索引

    3.3数组的运算

    3.3.1数组和标量间的运算

    3.3.2ufunc函数

    3.3.3条件逻辑运算

    3.4数组读/写

    3.4.1读/写二进制文件

    3.4.2读/写文本文件

    3.4.3读取CSV文件

    3.5NumPy中的数据统计与分析

    3.5.1排序

    3.5.2重复数据与去重

    3.5.3常用统计函数

    3.6本章小结

    本章实训

    第4章Pandas统计分析基础

    4.1Pandas中的数据结构

    4.1.1Series

    4.1.2DataFrame

    4.1.3索引对象

    4.1.4查看DataFrame的常用属性

    4.2Pandas索引操作

    4.2.1重建索引

    4.2.2更换索引

    4.3DataFrame数据的查询与编辑

    4.3.1DataFrame数据的查询

    4.3.2DataFrame数据的编辑

    4.4Pandas数据运算

    4.4.1算术运算

    4.4.2函数应用和映射

    4.4.3排序

    4.4.4汇总与统计

    4.5数据分组与聚合

    4.5.1数据分组

    4.5.2数据聚合

    4.5.3分组运算

    4.6数据透视表

    4.6.1透视表

    4.6.2交叉表

    4.7Pandas可视化

    4.7.1线形图

    4.7.2柱状图

    4.7.3直方图和密度图

    4.7.4散点图

    4.8本章小结

    本章实训

    第5章Pandas数据载入与预处理

    5.1数据载入

    5.1.1读/写文本文件

    5.1.2读/写Excel文件

    5.2合并数据

    5.2.1merge数据合并

    5.2.2concat数据连接

    5.2.3combine_first合并数据

    5.3数据清洗

    5.3.1检测与处理缺失值

    5.3.2检测与处理重复值

    5.3.3检测与处理异常值

    5.3.4数据转换

    5.4数据标准化

    5.4.1离差标准化数据

    5.4.2标准差标准化数据

    5.5数据转换

    5.5.1类别型数据的哑变量处理

    5.5.2连续型变量的离散化

    5.6本章小结

    本章实训

    第6章Matplotlib数据可视化基础

    6.1Matplotlib简介

    6.2Matplotlib绘图基础

    6.2.1创建画布与子图

    6.2.2添加画布内容

    6.2.3绘图的保存与显示

    6.3设置Pyplot的动态rc参数

    6.3.1全局参数定制

    6.3.2rc参数设置

    6.3.3绘图的填充

    6.3.4文本注解

    6.4Pyplot中的常用绘图

    6.4.1折线图

    6.4.2散点图

    6.4.3直方图

    6.4.4饼图

    6.4.5箱线图

    6.4.6概率图

    6.5词云

    6.5.1安装相关的包

    6.5.2词云生成过程

    6.5.3词云生成示例

    6.6本章小结

    本章实训

    第7章Seaborn可视化

    7.1Seaborn简介

    7.2风格设置

    7.2.1Seaborn绘图设置

    7.2.2Seaborn 主题设置

    7.2.3设置绘图元素比例

    7.3Seaborn中的常用绘图

    7.3.1直方图和密度曲线图

    7.3.2散点图

    7.3.3箱线图

    7.3.4散点图矩阵

    7.3.5小提琴图

    7.3.6柱状图

    7.3.7多变量图

    7.3.8回归图

    7.4本章小结

    本章实训

    第8章pyecharts可视化

    8.1pyecharts简介

    8.2pyecharts的使用方法

    8.3pyecharts常用图表

    8.3.1柱状图

    8.3.2饼图

    8.3.3漏斗图

    8.3.4散点图

    8.3.5K线图

    8.3.6仪表盘

    8.3.7词云

    8.3.8组合图表

    8.4本章小结

    本章实训

    第9章时间序列数据分析

    9.1日期和时间数据类型

    9.1.1datetime构造

    9.1.2数据转换

    9.2时间序列基础

    9.2.1时间序列构造

    9.2.2索引与切片

    9.3日期范围、频率和移位

    9.3.1日期范围

    9.3.2频率和移位

    9.4时期

    9.4.1时期基础

    9.4.2频率转换

    9.4.3时期数据转换

    9.5重采样、降采样和升采样

    9.5.1重采样

    9.5.2降采样

    9.5.3升采样

    9.6本章小结

    本章实训

    第10章SciPy科学计算

    10.1SciPy中的常数与特殊函数

    10.1.1SciPy的constants模块

    10.1.2SciPy的special模块

    10.2SciPy中的线性代数基本运算

    10.2.1基本的矩阵运算

    10.2.2线性方程组求解

    10.2.3行列式的计算

    10.2.4范数

    10.2.5特征值分解

    10.2.6奇异值分解

    10.3SciPy中的优化

    10.3.1方程求解及求极值

    10.3.2数据拟合

    10.4SciPy中的稀疏矩阵处理

    10.4.1稀疏矩阵的存储

    10.4.2稀疏矩阵的运算

    10.5SciPy中的图像处理

    10.5.1图像平滑

    10.5.2图像旋转和锐化

    10.6本章小结

    本章实训

    第11章统计与机器学习

    11.1Scikitlearn的主要功能

    11.2分类

    11.2.1决策树规约

    11.2.2KNN算法

    11.2.3支持向量机

    11.2.4朴素贝叶斯分类

    11.3聚类

    11.3.1KMeans聚类

    11.3.2层次聚类

    11.3.3基于密度的聚类

    11.4主成分分析

    11.5本章小结

    本章实训

    第12章图像数据分析

    12.1OpenCV简介与导入

    12.1.1OpenCV简介

    12.1.2Python中OpenCV的安装与导入

    12.2cv2图像处理基础

    12.2.1cv2的基本方法与属性

    12.2.2cv2图像处理示例

    12.3应用尺度不变特征变换

    12.4使用加速鲁棒特征检测

    12.5图像降噪

    12.6本章小结

    本章实训

    第13章综合案例

    13.1职业人群体检数据分析

    13.2股票数据分析

    展开全文
  • 讲解Python数据分析与可视化中的九大模块,内容全面详实; 提供11个课程实训和2个完整的项目案例,理论结合实践 ; 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 超值赠送: 教学大纲、教学课件、电子...

    讲解Python数据分析与可视化中的九大模块,内容全面详实; 提供11个课程实训和2个完整的项目案例,理论结合实践 ; 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程

    ¥38.70定价:¥49.00(7.9折)

    /2020-03-01

    1.作者经验丰富。本书作者在数据分析领域工作10年,拥有大量的数据分析经验、案例、场景和方法,并且在数据分析领域颇有口碑。 2.结构合理,层次清晰。本书内容围绕数据分析展开,能将数据分析工作流程介绍清楚且完整、有用、实用,不仅能帮助读者学到所学知识,更能帮助读者快速用到数据分析实践中。 3.案例与实训丰富。本书不仅提供专业的理论知识,而且配有案例和课后实训,帮助读者快速了解Python数据分析知识。

    ¥47.70定价:¥49.80(9.58折)

    /2020-08-01

    1.Python零基础,轻松学会数据分析与挖掘 2.编码、分析、挖掘,数据分析全流程一次搞定 3.微课视频,扫码即可观看,重点难点逐个击破 本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。

    ¥47.70定价:¥49.80(9.58折)电子书:¥22.50

    /2020-01-01

    1.从零开始,适合新手学习对于只有代码入门基础的新手来说,看文档学习使用工具是十分困难的一件事。因为对代码的不理解、没有编程思维,看文档简直就像是在看天书。另外大部分的新文档都是英文版的,国内的中文文档都是翻译过来的,在翻译过程中容易产生偏差。而本书基础知识篇中,从各官方文档中直接整理出爬虫爬取需要用到的部分。没有繁杂啰唆的文字,用简单的语言告诉你学习的重点知识,让你快速上手爬虫。在实战阶段,详细介绍每一个步骤,便于理解,让你也能靠自己写出爬虫。 2.实例丰富,解决各种爬虫问题网上很多爬虫的各种教程,大部分都是爬取豆瓣电影、招聘网站职位进行分析。本书实战项目挑选的都是网上少有人爬取的网站,让你可以学习到各式各样的爬取方式。 3.站得更高,设计自己的产品本书除了教你如何爬取网站外,

    ¥47.20定价:¥59.80(7.9折)电子书:¥56.81

    /2019-10-01

    (1)本书采用理论与案例相结合的形式,以 Anaconda 为主要开发工具,系统、全面地介绍了 Python 数据分析的相关知识。(2)zui后一章为综合案例,演示如何在项目中运用所学的知识。

    ¥38.00定价:¥52.00(7.31折)

    /2019-01-01

    采用 理实一体化 教学方式,配套大量上机操作 涵盖新大数据分析知识及相关开源库的使用 提供150分钟视频讲解及丰富的配套教学资源 提供教学大纲、教学课件、电子教案、程序源码、习题答案等教学课件

    ¥47.20定价:¥59.80(7.9折)

    1.Python零基础,轻松学会数据分析与挖掘 2.编码、分析、挖掘,数据分析全流程一次搞定 3.微课视频,扫码即可观看,重难逐个破 本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。

    这本Python爬虫技术书是一个完整大数据应用框架:从数据收集、分析到数据可视化、数据建模。本书各章节以实际案例为出发点,对大数据分析、爬虫技术应用感兴趣的小伙伴们来说, 值得购买。

    ¥34.50定价:¥69.00(5折)电子书:¥48.30

    /2020-07-01

    本书内容来自笔者在高校授课的内容,主要介绍如何运用 Python 工具获取电商平台的页面数据,并对数据进行清洗和存储。本书简化了Python 基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容。 本书采用的版本是 Python 3.6.2,是笔者写书时的*版本,而且笔者习惯用的操作平台是Windows 系统。

    ¥24.50定价:¥49.00(5折)

    配套视频教程 手把手教你学Python 提炼避坑心法 简明、高效懂Python 实战案例分析 轻松、快速玩Python 讲解 实践 案例 视频 源代码 源数据 针对Python新手量身定做,入门必备的真爱之选 作者简介:余本国,博士,硕士研究生导师。于中北大学理学系任教,主讲线性代数、微积分、Python语言、大数据分析基础等课程。2012年到加拿大York University做访问学者。出版有《Python数据分析基础》等著作。

    ¥34.90定价:¥69.80(5折)

    /2018-07-01

    构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。

    ¥39.50定价:¥79.00(5折)电子书:¥50.60

    /2020-11-01

    就跟Java在web领域无可撼动的地位一样,Python也已经在金融量化投资领域占据了重要位置,从各个业务链条都能找到相应的框架实现。 《从零开始学Python 大数据与量化交易》的特点如下: 轻松入门:帮助投资者快速掌握的量化交易知识及Python编程基础。 内容全面:书中系统讲解了量化交易的常用获取数据函数、量化选股技巧、量化择时的技术指标函数、量化交易策略的回测技巧、量化交易策略的因子分析技巧等。 量化交易策略实战:精心选择案例,交易反复练习,举一反三。 经验总结:本书知识体系完整,力求从零开始,通俗易懂。理论与实例结合紧密,以实例讲解理论,注重对初学者的实战技巧的培养。

    ¥44.20定价:¥59.00(7.5折)

    /2019-11-01

    《Python数据可视化之matplotlib实践》主要是面向matplotlib的入门读者,读者通过学习可以掌握matplotlib的基本概念和基本操作方法,满足Python数据可视化的初级应用需求。《Python数据可视化之matplotlib精进》主要帮助读者提高对matplotlib的理解程度和操作技能,从而满足Python数据可视化的中高级应用需求。因此,可以将这两本书理解成是关于matplotlib的系列图书,如果读者能将这两本书结合起来阅读,一定可以对matplotlib有一个全面而深刻的理解,从而完成对matplotlib的立体式学习。

    ¥34.50定价:¥69.00(5折)

    /2019-04-01

    1.轻松入门 详细介绍Jupyter Notebook 基础操作,手把手教你学会使用Jupyter Notebook。 2.进阶技能 使用pandas 进行数据分析,掌握Python数据分析核心技能。 3.精彩实战 使用Matplotlib 和Bokeh 绘制多种图形,轻松实现数据可视化。

    ¥49.50定价:¥99.00(5折)

    本书涉及的主题如下: 数据分析; 数据清洗; 数据可视化; 探索性数据分析; 概率分布与假设检验; 群组分析; 购物篮分析; 时间序列分析。 本书突出的特点如下: 系统讨论基于Python的数据分析环境构建与数据分析流程; 将数据分析理论与实践结合,基于真实的案例介绍数据分析。

    ¥62.40定价:¥79.00(7.9折)

    /2020-07-01

    1.从零始,适合新手学习对于只有代码门基础的新手来说,看文档学习使用工具是十分困难的一件事。因为对代码的不理解、没有编程思维,看文档简直就像是在看天书。另外大部分的新文档都是英文版的,国内的中文文档都是翻译过来的,在翻译过程中容易产生偏差。而本书基础知识篇中,从各官方文档中直整理出爬虫爬取需要用到的部分。没有繁杂啰唆的文字,用简单的语言告诉你学习的重知识,让你快速上手爬虫。在实战阶段,详细介绍每一个步骤,便于理解,让你也能靠自己写出爬虫。 2.实例丰富,解决各种爬虫问题网上很多爬虫的各种教程,大部分都是爬取豆瓣电影、招聘网站职位行分析。本书实战项目挑选的都是网上少有人爬取的网站,让你可以学习到各式各样的爬取方式。 3.站得更高,设计自己的产品本书除了教你如何爬取网站外,还有很多以

    "讲解Python数据分析与可视化中的九大模块,内容全面详实;提供11个课程实训和2个完整的项目案例,理论结合实践 ;赠送420分钟的教学视频及丰富的配套资源,便于教师教学。超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程"

    ¥36.80定价:¥49.00(7.52折)

    /2020-03-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; 提供11个课程实训和2个完整的项目案例,理论结合实践 ; 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程

    ¥35.80定价:¥49.00(7.31折)

    /2019-12-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; n 提供11个课程实训和2个完整的项目案例,理论结合实践 ; n 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 n 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程 n

    ¥34.30定价:¥49.00(7折)

    /2019-12-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; 提供11个课程实训和2个完整的项目案例,理论结合实践 ; 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程

    ¥43.00定价:¥49.00(8.78折)

    /2019-12-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; n 提供11个课程实训和2个完整的项目案例,理论结合实践 ; n 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 n 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程 n

    ¥43.10定价:¥49.00(8.8折)

    /2019-12-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; 提供11个课程实训和2个完整的项目案例,理论结合实践 ; 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程

    ¥44.71定价:¥49.00(9.13折)

    /2019-12-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; n 提供11个课程实训和2个完整的项目案例,理论结合实践 ; n 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 n 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程 n

    ¥34.30定价:¥49.20(6.98折)

    /2019-12-01

    讲解Python数据分析与可视化中的九大模块,内容全面详实; 提供11个课程实训和2个完整的项目案例,理论结合实践 ; 赠送420分钟的教学视频及丰富的配套资源,便于教师教学。 超值赠送: 教学大纲、教学课件、电子教案、程序源码、教学进度表、在线教程

    ¥45.08定价:¥49.00(9.2折)

    /2019-12-01

    展开全文
  • python数据分析可视化 涉及内容 (1)Pandas的Series数据类型的定义及相关操作函数; (2)Pandas的DataFtame数据类型的定义及相关操作函数; (3)Pandas的统计功能; (4)Pandas的合并连接和排序; (5)Pandas...

    python数据分析及可视化

    涉及内容
    (1)Pandas的Series数据类型的定义及相关操作函数;
    (2)Pandas的DataFtame数据类型的定义及相关操作函数;
    (3)Pandas的统计功能;
    (4)Pandas的合并连接和排序;
    (5)Pandas的帅选和过滤功能;
    (6)Pandas的数据导入和导出功能。

    Pandas库入门
    }
    1.生成一维数组

    import numpy as np
    import pandas as pd
    x = pd.Series([1, 3, 5, np.nan])
    x
    0 1.0
    1 3.0
    2 5.0
    3 NaN
    dtype: float64

    pd.Series(range(5)) # 把Python的range对象转换为一维数组
    0 0
    1 1
    2 2
    3 3
    4 4
    dtype: int32

    pd.Series(range(5),
    index=list(‘abcde’)) # 指定索引
    a 0
    b 1
    c 2
    d 3
    e 4
    dtype: int32

    2.二维数组DataFrame的操作
    (1)生成二维数组

    pd.DataFrame(np.random.randn(12,4), # 数据
    index=dates, # 索引
    columns=list(‘ABCD’)) # 列名
    A B C D
    2018-01-31 1.060900 0.697288 -0.058990 -0.487499
    2018-02-28 -0.353329 1.160652 -0.277649 1.076614
    2018-03-31 2.323984 -0.435853 -0.591344 -0.754395
    2018-04-30 -0.077860 -0.432890 1.318615 0.125510
    2018-05-31 -0.993383 -1.064773 -0.430447 -3.073572
    2018-06-30 -0.390067 -1.549639 0.984916 1.046770
    2018-07-31 1.699242 1.088068 1.531813 -0.430381
    2018-08-31 0.044789 0.602462 -1.990035 -0.450742
    2018-09-30 -0.200117 -0.656987 -0.198375 -0.018999
    2018-10-31 -0.326242 -0.105304 -1.512876 0.166772
    2018-11-30 -0.057293 -1.153748 -0.875683 1.784142
    2018-12-31 -0.285507 0.937567 -0.891066 0.135078
    df = pd.DataFrame({‘A’:np.random.randint(1, 100, 4),
    ‘B’:pd.date_range(start=‘20180301’, periods=4, freq=‘D’),
    ‘C’:pd.Series([1, 2, 3, 4],
    index=[‘zhang’, ‘li’, ‘zhou’, ‘wang’],
    dtype=‘float32’),
    ‘D’:np.array([3] * 4,dtype=‘int32’),
    ‘E’:pd.Categorical([“test”,“train”,“test”,“train”]),
    ‘F’:‘foo’})

    df
    A B C D E F
    zhang 60 2018-03-01 1.0 3 test foo
    li 36 2018-03-02 2.0 3 train foo
    zhou 45 2018-03-03 3.0 3 test foo
    wang 98 2018-03-04 4.0 3 train foo

    (2)查看二维数组数据

    df.head() # 默认显示前5行,不过这里的df只有4行数据
    A B C D E F
    zhang 60 2018-03-01 1.0 3 test foo
    li 36 2018-03-02 2.0 3 train foo
    zhou 45 2018-03-03 3.0 3 test foo
    wang 98 2018-03-04 4.0 3 train foo

    df.head(3) # 查看前3行
    A B C D E F
    zhang 60 2018-03-01 1.0 3 test foo
    li 36 2018-03-02 2.0 3 train foo
    zhou 45 2018-03-03 3.0 3 test foo

    df.tail(2) # 查看最后2行
    A B C D E F
    zhou 45 2018-03-03 3.0 3 test foo
    wang 98 2018-03-04 4.0 3 train foo

    (3)查看二维数组数据的索引、列名和值

    df.index # 查看索引
    Index([‘zhang’, ‘li’, ‘zhou’, ‘wang’], dtype=‘object’)

    df.columns # 查看列名
    Index([‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’], dtype=‘object’)

    df.values # 查看值
    array([[60, Timestamp(‘2018-03-01 00:00:00’), 1.0, 3, ‘test’, ‘foo’],
    [36, Timestamp(‘2018-03-02 00:00:00’), 2.0, 3, ‘train’, ‘foo’],
    [45, Timestamp(‘2018-03-03 00:00:00’), 3.0, 3, ‘test’, ‘foo’],
    [98, Timestamp(‘2018-03-04 00:00:00’), 4.0, 3, ‘train’, ‘foo’]], dtype=object)

    (4)查看二维数组数据的统计信息

    df.describe() # 平均值、标准差、最小值、最大值等信息
    A C D
    count 4.000000 4.000000 4.0
    mean 59.750000 2.500000 3.0
    std 27.354159 1.290994 0.0
    min 36.000000 1.000000 3.0
    25% 42.750000 1.750000 3.0
    50% 52.500000 2.500000 3.0
    75% 69.500000 3.250000 3.0
    max 98.000000 4.000000 3.0

    (5)对二维数组进行排序操作

    df.sort_index(axis=0, ascending=False) # 对索引进行降序排序
    A B C D E F
    zhou 45 2018-03-03 3.0 3 test foo
    zhang 60 2018-03-01 1.0 3 test foo
    wang 98 2018-03-04 4.0 3 train foo
    li 36 2018-03-02 2.0 3 train foo

    df.sort_index(axis=0, ascending=True) # 对索引升序排序
    A B C D E F
    li 36 2018-03-02 2.0 3 train foo
    wang 98 2018-03-04 4.0 3 train foo
    zhang 60 2018-03-01 1.0 3 test foo
    zhou 45 2018-03-03 3.0 3 test foo

    df.sort_index(axis=1, ascending=False) # 对列进行降序排序
    F E D C B A
    zhang foo test 3 1.0 2018-03-01 60
    li foo train 3 2.0 2018-03-02 36
    zhou foo test 3 3.0 2018-03-03 45
    wang foo train 3 4.0 2018-03-04 98

    df.sort_values(by=‘A’) # 按A列对数据进行升序排序
    A B C D E F
    li 36 2018-03-02 2.0 3 train foo
    zhou 45 2018-03-03 3.0 3 test foo
    zhang 60 2018-03-01 1.0 3 test foo
    wang 98 2018-03-04 4.0 3 train foo

    df.sort_values(by=[‘E’, ‘C’]) # 先按E列升序排序

                                   # 如果E列相同,再按C列升序排序
                                   # 可以使用ascending=[True,False]指定顺序 
        A          B    C  D      E    F
    

    zhang 60 2018-03-01 1.0 3 test foo
    zhou 45 2018-03-03 3.0 3 test foo
    li 36 2018-03-02 2.0 3 train foo
    wang 98 2018-03-04 4.0 3 train foo

    (7)二维数组数据的选择与访问

    df[‘A’] # 选择某一列数据
    zhang 60
    li 36
    zhou 45
    wang 98
    Name: A, dtype: int32

    60 in df[‘A’] # df[‘A’]是一个类似于字典的结构

                                       # 索引类似于字典的键 
                                       # 默认是访问字典的键,而不是值 
    

    False

    60 in df[‘A’].values # 测试60这个数值是否在A列的值中
    True

    df[0:2] # 使用切片选择多行
    A B C D E F
    zhang 60 2018-03-01 1.0 3 test foo
    li 36 2018-03-02 2.0 3 train foo

    df.loc[:, [‘A’, ‘C’]] # 选择多列
    A C
    zhang 60 1.0
    li 36 2.0
    zhou 45 3.0
    wang 98 4.0

    df.loc[[‘zhang’, ‘zhou’], [‘A’, ‘D’, ‘E’]] # 同时指定多行和多列
    A D E
    zhang 60 3 test
    zhou 45 3 test

    df.loc[‘zhang’, [‘A’, ‘D’, ‘E’]] # 查看’zhang’的三列数据
    A 60
    D 3
    E test
    Name: zhang, dtype: object

    (8)二维数组的数据修改

    df.iat[0, 2] = 3 # 修改指定行、列位置的数据值
    df.loc[:, ‘D’] = np.random.randint(50, 60, 4)

                                    # 修改某列的值 
    

    df[‘C’] = -df[‘C’] # 对指定列数据取反
    df # 查看上面三个修改操作的最终结果
    A B C D E F
    zhang 60 2018-03-01 -3.0 52 test foo
    li 36 2018-03-02 -2.0 52 train foo
    zhou 45 2018-03-03 -3.0 59 test foo
    wang 98 2018-03-04 -4.0 54 train foo

    (9)二维数组数据预处理
    二维数组缺失值的处理。

    df1 = df.reindex(columns=list(df.columns)+[‘G’])

                                     # 增加一列,列名为G
    

    df1 # 其中NaN表示缺失值
    A B C D E F G
    zhang 60 2018-03-01 9.0 52 test foo NaN
    li 36 2018-03-02 4.0 52 train foo NaN
    zhou 45 2018-03-03 9.0 59 test foo NaN
    wang 98 2018-03-04 16.0 54 train foo NaN

    1.打开当前目录下“2018数据科学名册.XLS”文件进行如下操作:
    (1)查看头3行,倒数5行,中间的10-20行的数据;删除已经留级的同学;
    代码:

    path1=“C:/learn_data/learn_d/2018数据科学名册.xlsx”

    df=pd.read_excel(path1,names=[‘code’,‘name’,‘sex’])
    print(df)
    print(df.iloc[:3,:])
    print(df.iloc[-5:,:])
    print(df.iloc[9:20,:])

    执行结果:
    在这里插入图片描述

    (2)查看索引,查看列名,查看值;
    代码:

    print(df.columns,df.index,df.values)

    执行结果:
    在这里插入图片描述

    (3)查找所有“张“姓”同学;
    代码:
    在这里插入图片描述

    bool=df[‘name’].str.contains(“张”)
    print(df[bool])
    执行结果:

    (4)统计所有男生和女生并计数;
    代码:

    在这里插入图片描述

    bool=df[‘sex’].str.contains(“男”)
    print(df[bool].count())
    bool=df[‘sex’].str.contains(“女”)
    print(df[bool].count())
    执行结果:

    (5)按姓名排序;
    代码:
    print(df.sort_values(by=‘name’,ascending=True))
    执行结果:

    在这里插入图片描述

    (6)按“学号”查找自己的信息;
    代码:
    print(df[df[‘code’]==3180706223])

    执行结果:

    在这里插入图片描述

    (7)增加“数据库”“python数据分析”两列及成绩;
    代码:
    df[‘数据库’]=np.random.randint(60,100,len(df))
    df[‘python数据分析’]=np.random.randint(60,100,len(df))
    执行结果:
    在这里插入图片描述

    (8)对(7)的成绩进行降序排序并进行统计;
    代码:

    print(df.sort_values([‘数据库’, ‘python数据分析’], ascending=[False,True]))
    执行结果:
    在这里插入图片描述

    2.利用pandas内置函数read_csv读取并显示taobao_data.csv中的数据。
    (1)丢弃“宝贝”和“卖家”两列,按“位置”进行分组,求“价格”和“成交量”的均值,并按照“成交量”的降序排列。
    代码:

    path1=“C:/learn_data/learn_d/taobao_data.csv”

    df=pd.read_csv(path1)
    print(df)
    df=df.drop([‘宝贝’,‘卖家’],axis=1)
    print(df.loc[:,[‘成交量’,‘价格’]].groupby([df[‘位置’]]).mean().sort_values(‘成交量’,ascending=False))

    执行结果:
    在这里插入图片描述

    (2)以“位置”为X轴,分别以“价格”和“成交量”为Y轴,绘制出“各省 份的平均价格”和“各省份的平均成交量”的横向柱状图、纵向柱状图、饼图和散点图。
    代码:

    df.plot.bar()
    plt.figure()
    df.plot.barh()
    plt.figure()
    df[‘成交量’].plot.pie(autopct=’%1.1f%%’)
    plt.figure()
    df[‘价格’].plot.pie(autopct=’%1.1f%%’)
    plt.figure()
    plt.scatter(x=df.index,y=df[‘成交量’])
    plt.figure()
    plt.scatter(x=df.index,y=df[‘价格’])
    plt.show()
    执行结果:

    在这里插入图片描述

    展开全文
  • (2)专注于Python数据分析与可视化操作中实际用到的技术。相比大而全的书籍资料,本书能让读者尽快上手,开始项目开发。(3)书中的“新手问答”和“小试牛刀”栏目能让读者巩固知识,举一反三,学以致用。《Python...

    (1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果。(2)专注于Python数据分析与可视化操作中实际用到的技术。相比大而全的书籍资料,本书能让读者尽快上手,开始项目开发。(3)书中的“新手问答”和“小试牛刀”栏目能让读者巩固知识,举一反三,学以致用。

    《Python数据分析与可视化从入门到精通》以“零基础”为起点,系统地介绍了Python在数据处理与可视化分析方面的应用。全书内容共分3篇12章,具体安排如下。 篇:基础篇,包括~4章。主要介绍了Python语言的基本情况与现状、环境搭建与软件安装,以及Python语言的基本知识。 第2篇:应用篇,包括第5~11章。主要介绍了Python的数据存取方法、数据清洗和预处理、大数据可视化分析基础,以及2D、3D等图形的绘制与可视化分析的方法与相关应用。 第3篇:实战篇,包括2章。以抓取中国天气网相关数据存入MySQL数据库,并绘制相应图形为主线,综合本书各章知识点,介绍了数据采集、清理、保存及绘制可视化图形的基本步骤和方法。 本书既适合希望从事Python数据处理与可视化的用户学习,也适合作为广大职业院校相关专业参考用书,还可作为相关培训班的教材用书。

    高博,不错工程师,IT杂家。主要研究方向为云计算与大数据、数据可视化等,熟悉.Net、PHP、Python,DevOps,MySQL、SQLServer等技术和工具。作为一作编写了《Discuz!社区管理员实用教程》《代码的力量——Discuz!源码分析与插件开发实例进阶》《PHP+MySQL+AJAX Web开发给力起飞》,参与编写了《Web 2.0社区网站实用宝典》《ASP.NET 4.0 MVC敏捷开发给力起飞》《Java Web应用开发给力起飞》等书籍。主持省部级纵向课题3项,参与纵向、横向课题16项,获得软件著作权12项。 刘冰,博士研究生,重庆邮电大学计算机科学与技术学院/人工智能学院教师,先后翻译出版程序设计、图像处理、计算机视觉等领域著作4部,编写教材5部,获发明2项,发表SCI/EI论文4篇,参与重量、省部级项目3项。荣获重庆邮电大学很好班主任、很好班导师、很好青年教师等荣誉称号。 李力,毕业于西安交通大学计算机学院,现工作于教育考试招生战线,曾长期在国防军工单位从事网络战、信息战研究,擅长需求分析与设计,参与纵、横向课题12项,获得软件著作权4项。

    篇 基础篇章 认识大蟒:Python快速入门21.1 什么是大蟒(Python)31.2 Python是位“年轻的老同志”31.3 Python语言有什么特点51.4 Python语言的应用领域7★新手问答★8本章小结8第2章 磨好利牙,子弹上膛:准备好工作环境92.1 版本的比较与选择102.2 在Windows上安装Python142.2.1 下载安装程序152.2.2 图解安装步骤172.3 在macOS上安装Python192.3.1 版本选择202.3.2 下载安装程序202.3.3 图解安装步骤222.4 选择合适的开发工具262.4.1 Anaconda262.4.2 Visual Studio272.4.3 PyCharm272.4.4 Eclipse 282.4.5 Komodo 292.4.6 Visual Studio Code/Sublime/EditPlus/UltraEdit302.5 安装所需的第三方组件(库)302.5.1 安装Matplotlib、NumPy和SciPy312.5.2 安装Python Imaging Library(Pillow)342.5.3 安装Requests352.5.4 安装BeautifulSoup362.5.5 安装Pandas372.5.6 安装Basemap392.5.7 安装SQLAlchemy40★新手问答★42★小试牛刀★42本章小结44第3章 大蟒的基本技能之一:Python语言基础453.1 基本概念463.1.1 变量463.1.2 保留字473.1.3 注释483.1.4 行与缩进493.2 数据类型503.2.1 Number503.2.2 Bool543.2.3 String553.2.4 正则表达式583.2.5 List633.2.6 Tuple693.2.7 Set703.2.8 Dictionary733.3 运算符743.3.1 算术运算符743.3.2 比较(关系)运算符743.3.3 赋值运算符753.3.4 逻辑运算符763.3.5 位运算符773.3.6 成员运算符783.3.7 身份运算符783.3.8 运算符优先级79★新手问答★79★小试牛刀★80本章小结80第4章 大蟒的基本技能之二:Python语言进阶814.1 流程控制824.1.1 条件语句824.1.2 循环语句854.1.3 break、continue和pass874.2 异常处理894.3 函数924.3.1 函数的基本概念924.3.2 变量作用域994.3.3 迭代器和生成器1004.3.4 装饰器1054.4 面向对象编程1074.4.1 类和对象1084.4.2 魔术方法1144.5 文件操作116★新手问答★119★小试牛刀★119本章小结120第2篇 应用篇第5章 给大蟒找食:Python的数据存取操作1225.1 餐前小食:文本文件的数据存取1235.1.1 基于分隔符的文本数据文件1235.1.2 基于JSON格式的文本文件1295.2 开胃菜:Excel文件的数据存取1325.2.1 Excel的模块和库1325.2.2 读取Excel文件1335.2.3 生成Excel文件并写入数据1355.3 主菜:写一个爬虫来收集网页数据1365.3.1 爬虫的概念1365.3.2 写一个简单的爬虫1375.3.3 保存爬取到的数据1405.4 主菜:操作MySQL数据库1415.4.1 MySQL数据库是什么1425.4.2 选择并安装MySQL数据库连接组件1425.4.3 连接到MySQL数据库1435.4.4 把数据放进去1455.4.5 把数据拿出来1495.4.6 删除和更新数据1515.5 甜点:ORM框架153★新手问答★159★小试牛刀★160本章小结162第6章 洗干净了再吃:使用Python预处理数据1636.1 清洗和预处理数据的原因及方法1646.1.1 数据清洗和预处理的意义及原则1646.1.2 脏数据清洗方法1656.2 使用Pandas预处理数据1676.2.1 Pandas数据结构1676.2.2 预处理数据171★新手问答★177★小试牛刀★177本章小结182第7章 有营养的食物:大数据分析及可视化基础知识1837.1 大数据的概念1847.2 大数据分析1867.2.1 数据收集1867.2.2 数据存储1867.2.3 资源管理与服务协调1877.2.4 计算引擎1877.2.5 数据分析1887.2.6 数据可视化1887.3 使用NumPy和SciPy快速处理数据1887.3.1 使用NumPy处理多维数组1887.3.2 使用SciPy完成不错数学计算195★新手问答★202★小试牛刀★202本章小结206第8章 大蟒神通之一:使用Matplotlib绘制基础图形2078.1 绘制简单图形2088.1.1 使用plot()绘制折线图2088.1.2 使用bar()绘制柱状图2108.1.3 使用barh()绘制条形图2148.1.4 使用hist()绘制直方图2158.1.5 使用pie()绘制饼图2188.1.6 使用polar()绘制雷达图2208.1.7 使用scatter()绘制散点图2218.1.8 使用stem()绘制棉棒图2228.1.9 使用boxplot()绘制箱线图2238.1.10 使用errorbar()绘制误差棒图2258.1.11 使用stackplot()绘制堆积折线图2278.1.12 使用broken_barh()绘制间断条形图2288.1.13 使用step()绘制阶梯图2298.2 绘制不错图形2318.2.1 对数图2318.2.2 频谱图2328.2.3 矢量场流线图2338.2.4 绘制两个变量间的互相关图形234★新手问答★235★小试牛刀★236本章小结238第9章 大蟒神通之二:使用Matplotlib美化和修饰图形2399.1 调整坐标轴和刻度2409.1.1 设置坐标轴刻度2409.1.2 设置坐标轴的标签文本2419.1.3 绘制刻度线的网格线2439.1.4 移动坐标轴的位置2449.2 添加标题、图例和注释文本2459.2.1 设置标题的展示样式2469.2.2 设置图例的展示样式2489.2.3 添加注释文本2499.3 设置线形和文本字体2519.3.1 设置线形样式2519.3.2 设置文本属性和字体属性2539.4 使用颜色2589.4.1 使用颜色参数2589.4.2 使用色彩映射和添加颜色标尺2599.5 划分画布262★新手问答★263★小试牛刀★264本章小结2660章 大蟒神通之三:数据可视化之3D图形应用26710.1 创建3D可视化图表26810.1.1 3D柱状图和3D直方图26810.1.2 3D线框图、3D曲面图和3D三翼面图27010.2 使用Matplotlib创建动画273★新手问答★275★小试牛刀★276本章小结2781章 大蟒神通之四:图像处理27911.1 使用Python Imaging Library处理图像28011.2 生成CAPTCHA图像283★新手问答★286★小试牛刀★286本章小结288第3篇 实战篇2章 综合案例:全国县级市天气预报的数据可视化分析29012.1 目标与计划29112.1.1 具体目标29112.1.2 工作计划29312.2 确定目标数据29312.3 试验抓取数据29712.4 保存数据入库29912.5 检查清理数据31012.5.1 检查数据完整性与合法性31012.5.2 清理或预处理数据31112.6 绘制图形图表311本章小结314附录315附录A Python命令行参数处理模块argparse简介316附录B Python编程代码的风格319附录C Python常见面试题精选321

    展开全文
  • plth = fig.add_subplot(221) plth.plot(htime, hstrain, ‘y’) plth.set_xlabel(‘Time(seconds’) #画出以时间为x轴,应变数据为y轴的图像,并设置标题和坐标轴的标签 plth.set_ylabel(‘H1 Strain’) plth.set_...
  • 1.2 数据可视化1.3 数据分析与可视化常用工具1.4 Python数据分析与可视化常用类库 1.1 数据分析 1.1.1 数据、信息与数据分析 数据: 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、...
  • 想用最短路径逆袭成为数据可视化大神吗?想在除了PRD外什么都没有的情况下,体验职场真人版绝境求生吗?概念:LADV是以上例子中,生成的可视化图表,均可以在DataV的环境下做进一步的样式调优和数据接入,最终发布为...
  • (2)专注于Python数据分析与可视化操作中实际用到的技术。相比大而全的书籍资料,本书能让读者尽快上手,开始项目开发。(3)书中的"新手问答”和"小试牛刀”栏目能让读者巩固知识,举一反三,学以致用。...
  • 随着互联网的飞速发展,人们在互联网上...在数据分析领域,Python语言简单易用,第三方库强大,并提供了完整的数据分析框架,因此深受数据分析人员的青睐,Python已经当仁不让地成为数据分析人员的一把利器。因此,...
  • 数据分析、数据挖掘数据可视化是一个古老的话题,并非什么新生事物。近些年来,借助于计算机软硬件的飞速发展,数据分析、挖掘、可视化相关理论和技术在各领域的应用更是有了质的飞跃。饭店选址、公交路线站牌...
  • 本书以“零基础”为起点,系统地介绍了Python数据处理与可视化分析方面的应用。全书共分3篇12章内容,具体安排如下。第1篇:基础篇,包括第1-4章。第1章 先来认识一下大蟒:Python入门。第2章 磨好利牙,子弹上膛...
  • #数据可视化分析#python中matplotlib绘制图像'''import matplotlib.pyplot as pltimport matplotlib as mplimport numpy as npimport warningswarnings.filterwarnings("ignore")plt.style.use("classic")#正常的二...
  • 用python做数据分析与可视化(一) python编程基础 ...这篇就来看看几个小实例 后面有python很基础的知识点和例子 后面数据分析能...f = open("D:/大学/大三/python数据分析与可视化/源码和视频/列题源代码/Python数据分析与
  • 第1章数据分析与可视化概述1.1数据分析1.2数据可视化1.3数据分析与可视化常用工具1.4为何选用Python进行数据分析与可视化1.5Python数据分析与可视化常用类库1.6Jupyter Notebook的使用1.7本章小结第2章Python...
  • 第一章 单元测试1、缩进对于Python程序至关重要。A:错B:对正确答案:【对】2、在Python 3.x中不能使用汉字作为变量名。A:对B:错正确答案:【错】3、下面哪些是正确的Python标准库对象导入语句?A:from math importB:...
  • 城市几何中心的距 His monthly expense _________ 350 dollars.A、totals toB、amounts asC、adds up toD、accounts They are all _________ at the _______ news.A、exciting; excitedB、excited; excitingC、 ...
  • 若关于x的不等式组x2+x+13>03x+5a+4>4(x+1)+3a恰有三个整数解,求实数a的取值范围.若不等式组x>ax-3≤0只有三个整数解,求a的取值范围______.解不等式组:1-2x>1x+16-2不等式组x-1≤03x+6>0的解...
  • 数据分析与可视化(一)1.1 数据分析1.1.1数据、信息与数据分析 1.1 数据分析 1.1.1数据、信息与数据分析 数据: 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的...
  • ● Kerberos由认证服务器(AS)和票证授予服务器(TGS)两部分组成,当用户A通过Kerberos向服务器V请求一个角它的补角的度数之比为1:8,求这个角的余角的度数.已知∠α=26°,则∠α的补角是______度.监理单位应...
  • 第1章数据分析与可视化概述1.1数据分析1.2数据可视化1.3数据分析与可视化常用工具1.4为何选用Python进行数据分析与可视化1.5Python数据分析与可视化常用类库1.6Jupyter Notebook的使用1.7本章小结第2章Python...
  • 大家好,关于Python数据分析的工具我们已经讲了很多了,相信一直关注的读者对于Pandas、NumPy、Matplotlib的各种操作一定不陌生,今天我们就用一份简单的数据来学习如何使用Python进行数据分析,本文主要涉及下面三...
  • 教学进度计划表(教学日历)名称总...常用工具二、Python数据分析与可视化常用库、Jupyter NoteBook的基本用法2了解数据分析与可视化的主要工具;掌握数据分析与可视化常用库、Jupyter NoteBook的基本用法。2一、Py...
  • python数据分析与可视化 -第二次笔记

    千次阅读 2018-08-05 09:50:50
    python数据分析与可视化 –前言 –导入模块 –导入数据 –柱状图的绘制 –直方图的绘制 –箱型图的绘制 –折线图的绘制 –饼状图的绘制 前言 python可视化主要利用matplotlib模块和seaborn模块 这两...
  • Python 科学库与可视化课程介绍Python应用场景Python数据分析与可视化课程特色时间就是生命,浓缩才是精华 (4小时,完成了数据分析与挖掘必备知识点讲解)课程体系完整 ( 应用场景、Python 科学库、可视化、时间序列...
  • 数据可视化 6
  • 数据分析与可视化概述 一、数据、信息与数据分析 数据:是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。 ...
  • 是一个料下载在线系统、,是各类考生顺利通过的!《红楼梦》前八十回的作者可能是。曹雪芹-更新本课程大致可以分为()大版块。四-更新《红楼梦》让现代人望而却步的原因不包括()。艺术水平不高-更新本课程主要讲授的...
  • Python数据分析与可视化(读取数据)

    千次阅读 多人点赞 2020-07-24 21:53:15
    读取数据 含有逗号分隔符文件 JSON文件 源文件 含有逗号分隔符文件 本节主要讲CSV类型的文件以及如何使用Pandas库来读取CSV文件。 CSV文件的简介 用Pandas来读取CSV文件 CSV文件的简介 在机器学习中以逗号作为...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,399
精华内容 1,359
关键字:

python数据分析与可视化

python 订阅