2017-12-22 14:24:14 qq_38472535 阅读数 1844
  • Python文本数据分析--实战视频教学

    购买课程后,可扫码进入学习群,获取唐宇迪老师答疑 课程首先概述文本分析的基本概念,整个课程围绕案例进行:新闻分类任务。案例从零开始讲解如何使用Python库进行分析与建模的工作。案例中实例演示如何从杂乱的文本数据开始进行分词预处理到后应用贝叶斯算法进行分类预测。 专属会员卡更超值:http://edu.csdn.net/lecturer/1079

    3905 人正在学习 去看看 唐宇迪
课程简介:

近两年来,数据分析师的岗位需求非常大,90%的岗位技能需要掌握Python作为数据分析工具,本课程以案例驱动的方式讲解如何利用Python完成数据获取、处理、数据分析及可视化方面常用的数据分析方法与技巧。

面向人群:
      1.  想了解和学习典型的数据分析流程和实践方法的学习者
      2.  想接触和学习非结构化数据(比如:文本、图像等)分析的学习者
      3.  想学习数据分析中常用建模知识的相关从业人员
      4.  尚不会使用Python的数据分析师从业者
      5.  想转行从事数据分析师行业的学习者: 
      6.  想使用Python实现金融数据分析、机器学习或深度学习的工程师


学习收益:
通过本课程的学习,学员将会收获:, 
      1.  熟悉数据分析的流程,包括数据采集、处理、可视化、数据建模等,
      2.  掌握Python语言作为数据分析工具,从而有能力驾驭不同领域数据分析实践:
      3.  掌握非结构化数据的处理与分析、探索性数据分析及量化分析
      4.  快速积累多个业务领域数据分析项目经验,包括金融数据、文本数据及图像数据
      5.  掌握使用Python实现基于机器学习及深度学习的数据分析和预测
      6.  掌握数据分析中常用的建模知识


开课时间:
2017年2月28日

课程大纲:
第一讲 工作环境准备及数据分析建模理论基础
第二讲 数据采集与操作
第三讲_数据分析工具Pandas8
第四讲_数据可视化
第五讲_时间序列数据分析
第六讲_文本数据分析
第七讲_图像数据处理及分析
第八讲_机器学习基础及机器学习库scikit-learn入门
第九讲_项目实战

资料课件和代码


下载地址:百度网盘下载

2018-08-09 14:49:17 djt_20180507 阅读数 99
  • Python文本数据分析--实战视频教学

    购买课程后,可扫码进入学习群,获取唐宇迪老师答疑 课程首先概述文本分析的基本概念,整个课程围绕案例进行:新闻分类任务。案例从零开始讲解如何使用Python库进行分析与建模的工作。案例中实例演示如何从杂乱的文本数据开始进行分词预处理到后应用贝叶斯算法进行分类预测。 专属会员卡更超值:http://edu.csdn.net/lecturer/1079

    3905 人正在学习 去看看 唐宇迪
Python数据分析—149人已学习
课程介绍    
jpg
    本课程主要讲解Python基础、数据分析扩展包Numpy、Pandas、Matplotlib及scikit-learn,Python爬虫及Scrapy框架,Python操作MySQL,MySQL常用方法,聚类分析算法,RFM模型,课程的后,会讲2个实战案例,互联网金融投资平台客户价值分析、航空公司客户价值分析。
课程收益
    1.掌握python语法基础 2.掌握python大数据爬虫 3.积累python数据分析项目实战经验
讲师介绍
    杨帅更多讲师课程
    计算机博士,目前就职于中科院某研究所,长期从事深度学习与机器学习研究工作,在NLP与CV领域有很深造诣,主持多项科技专项,并带领团队深入一线研发并落地,XXX视频监控与分析系统、XXX舆情监控系统、XXX智能对话系统及 XXX森林防火无人机跟拍系统等。申请发明专利2项、部级科技进步二等奖一次,在SIGIR、CIKM及AAAI的国际会议发表多篇文章.
课程大纲
  第1章:Python基础语法
    1.Python介绍及安装  31:14
    2.Python基础语法-缩进、注释  20:47
    3.Python基础语法-基本数据类型  8:32
    4.Python基础语法-运算符  16:36
    5.Python基础语法-if条件控制语句  15:36
    6.Python基础语法-循环控制语句  12:39
    7.Python基础语法-常见数据结构  39:44
    8.Python基础语法-列表推导式  4:43
    9.Python基础语法-函数  14:33
    10.Python基础语法-异常  16:42
    11.Python基础语法-import  7:06
    12.Python基础语法-pass  4:11
    13.生成器与迭代器  21:45
    14.面向对象-类  30:39
    15.文件读写  22:21
    16.几道Python练习题讲解  9:57
  第2章:Python数据分析扩展包
    1.Pandas基础-Series、DataFrame  31:29
    2.Python爬虫基本原理-Requests库及xpath用法简介  23:38
    3.Python爬虫初体验-51job爬虫  28:24
    4.Numpy常用方法  51:34
    5.Pandas常用方法  59:15
  第3章:Python数据可视化
    1.数据分析常用图表  47:44
    2.matplotlib基本用法及常见图表绘制  43:55
    3.Pandas中的绘图函数  21:23
    4.Python数据可视化应用-模拟随机漫步  22:41
  第4章:Python爬虫基本原理
    1.Python爬虫-正则表达式初步  38:18
    2.网页图片爬取  26:22
    3.Python爬虫-深入正则表达式  01:00:57
    4.异步加载的数据-京东商品图片、百度贴吧图片  15:23
    5.反爬策略——模拟浏览器  22:43
    6.反爬策略——设置代理IP  15:53
    7.异常处理——超时异常  12:01
    8.模拟登陆1  57:45
    9.模拟登陆2  5:42
    10.案例:京东商品爬虫1  53:34
  第5章:Python Scrapy爬虫
    1.案例:京东商品爬虫2  34:20
    2.Scrapy安装与配置  5:58
    3.Scrapy爬虫初体验及常用命令  54:28
    4.Scrapy项目的目录结构及核心架构  18:33
    5.51job Scrapy爬虫  49:11
    6.Python连接MySQL  26:13
    7.MySQL常见用法1  01:01:12
    8.MySQL常见用法2  54:49
    9.Scrapy爬虫案例:京东商品爬虫  56:00
    10.Scrapy爬虫案例:腾讯课堂Scrapy爬虫1  13:06
    11.Scrapy爬虫案例:腾讯课堂Scrapy爬虫2  55:22
  第6章:数据预处理及基础统计分析
    1.数据探索及数据预处理常见用法1  01:02:28
    2.数据探索及数据预处理常见用法2  35:32
    3.Python读取MySQL中的数据  17:36
    4.案例:腾讯课堂数据预处理及基础统计分析  37:37
    5.案例:京东商品数据预处理及基础统计分析  28:29
  第7章:聚类分析
    1.聚类分析原理1  23:27
    2.聚类分析原理2  31:27
    3.Python实现系统聚类法1  24:19
    4.Python实现系统聚类法2  5:16
    5.K-Means聚类分析及Python实现  54:46
    6.案例:Nutrition数据Python聚类分析1  12:23
    7.案例:Nutrition数据Python聚类分析2  19:59
  第8章:数据分析实战:互联网金融投资平台客户价值分析
    1.RFM模型原理  6:55
    2.案例:某互联网金融投资平台客户价值分析  31:38
  第9章:数据分析实战:航空公司客户价值分析
    1.案例:某航空公司客户价值分析1  56:47
    2.案例:某航空公司客户价值分析2  45:16
大家可以点击【查看详情】查看我的课程
2019-05-28 19:36:57 qq_42554007 阅读数 3238
  • Python文本数据分析--实战视频教学

    购买课程后,可扫码进入学习群,获取唐宇迪老师答疑 课程首先概述文本分析的基本概念,整个课程围绕案例进行:新闻分类任务。案例从零开始讲解如何使用Python库进行分析与建模的工作。案例中实例演示如何从杂乱的文本数据开始进行分词预处理到后应用贝叶斯算法进行分类预测。 专属会员卡更超值:http://edu.csdn.net/lecturer/1079

    3905 人正在学习 去看看 唐宇迪

相关数据下载,请关注公众号"一行数据",回复"python可视化"免费获得

很多人学python是从数据分析开始的,一方面进行可视化绘图很容易产生成就感,另一方面也是添加了学习的乐趣。
在这里插入图片描述
在这里插入图片描述

2018-06-04 23:20:42 qq_40589051 阅读数 114
  • Python文本数据分析--实战视频教学

    购买课程后,可扫码进入学习群,获取唐宇迪老师答疑 课程首先概述文本分析的基本概念,整个课程围绕案例进行:新闻分类任务。案例从零开始讲解如何使用Python库进行分析与建模的工作。案例中实例演示如何从杂乱的文本数据开始进行分词预处理到后应用贝叶斯算法进行分类预测。 专属会员卡更超值:http://edu.csdn.net/lecturer/1079

    3905 人正在学习 去看看 唐宇迪

Numpy,全称Numeric Python,是一个开源的Python科学计算库,C语言编写,所以运算速度非常快,加上对矩阵的操作非常方便,所以数据分析中一般不用python的数据类型list与dictionary。numpy也是pandas的基础,所以非常有必要了解一下啦~

教学视频推荐:莫烦python教学,虽然up主日常翻车,但是长的可爱~2333333

一个假的目录:

numpy数据类型的创建

运算

索引

合并

分割

复制

--------------------------------------------------------------------正式开始啦--------------------------------------------------------------------------------------

1 numpy.array的创建

numpy中的数据类型叫做numpy.array,所谓创建实际上是把list转换为numpy数据类型的一个操作,所以嘞就有个通用的格式:

a = np.array([[12,1,2],[2,3,55]])

本质就是括号里面写list,一维数组就是[....],二维数据就是[[],[]....]酱紫的!

是不是超级容易!

打段代码来瞅瞅就是这样滴~

import numpy as np

#创建array
利用array把list转变为array
a = np.array([[1,22,3],[1,4,5]])
print(a)

输出结果是生成了一个2维矩阵。

肉眼可见数字之间是没有逗号啦,这是np.array和list之间的一个差别。

如果想自定义array中元素的类型,(默认是int64位或者32位),那就加一丢丢:

np.array([2,23,24],dtype=np.float/int)

就o98k咯!

如果你想生成特定的矩阵,那么使用如下语句就ok啦~

b = np.zeros((3,4))#三行四列
c = np.ones((3,4))
d = np.empty((2,3))#空矩阵的意思是生成元素非常接近于0

一年后的补充:

np.random.random((3.4))生成0-1之间的随机数

np.random.randn(3.4)服从正态分布的随机数

注意两句话中都是生成三行四列的二维矩阵,但是括号层数不同,要注意。

利用arange创建array也是很方便的,arange和range是类似的用法。它能生成一维的一个数组,之后你利用reshape方法,就可以把它转换成你需要的矩阵形式啦~

e = np.arange(12,20,2)#12到19,步长为2的array
f = np.arange(12).reshape(3,4)#reshape的作用是将生成的一维array形状变化为3行四列
g = np.linspace(1,10,4)#1-10分成4段

运行结果如下:

这篇文章是一年前写的了,所以呢,经过一年项目冲击的我.....当然还是菜鸡一个,但是已经能发现以前写的东西错的地方有点多拉,比如np.linespace(1,20,4)其中的4不是段数哦,而是分割得到的元素数量。

另外,之前一直困惑,reshape(-1)里面的-1到底是什么,其实-1的意思就是我也不知道分多少行or多少列,程序你看着办吧的意思,比如,reshape(-1)输出就是一行,reshape(-1,2)就会输出两列,行数是根据元素个数程序自动计算的。

创建的array的属性如何查看嘞?它也不是娇滴滴的蒙面女郎啦

查看array的属性 very 简单。

array.ndim

array.shape

array.size

array.dtype

分别是维度,形状,元素个数,元素的数据类型。注意没有括号哦,查看属性不是调用方法,所以不要加括号哦!

2 numpy中的基本运算

加减:+-

乘方:**2

乘法:用*都是对应元素相乘,若要用矩阵乘法,应该为:np.dot(a,b) or a.dot(b)

三角运算:np.sin(a), cos,tan同理。

判断大小:print(A<5)#判断array中各个元素是否小于5。返回值是布尔值。

计算和:np.sum(a)

计算最大值,最小值:np.min(a)、np.max(a)

返回最大值索引:np.argmax(a)

排序(从小到大逐行排序):np.sort(a)

转置:np.transpose(a)和a.T

将某一区间的数留下:np.clip(A,5,9)#把array A中的小于5的数变成5,大于9的数变成9。

还有mean,median,cumsum(累加和),diff(累差)等,都是一样的方式。

如果只想计算行的和或者行中,列中最大值最小值的话,加上axis=0或者1即可。

0是按列,1是按行。

比如:

a = np.array([[1,22,3],[1,4,5]])
print(np.sum(a,axis=1))
print(np.sum(a,axis=0))

输出结果为:

其实一年前这里的理解不太对,axis是指的框的位置,0就是最外面的框,1就是第二层框,以此类推,框中的数据就会被运算,比如这里axis=0,那么第一层框中的数据被相加,看起来就是按列相加的,其实是把框里面的数据元素当做一个个数据个体来运算的。

3 numpy的索引

numpy的取值是通过索引来办到滴。

比如a[1],对于一维array来说,就是取索引为1的元素。对于二维array来说,就是取行数的索引为1的一行元素。

a[1][1]或者是a[1,1]就是取一行一列的元素。

a[4,;]取前四行所有元素

a[:,4]取前四列所有元素

a[1,2:4]取一行的2-3索引值的元素

a[1:2,3:4] 取索引值为1的行,以及该行索引值为3的元素

总结一下就是一个样子:

a[,]

逗号分隔行列数,单个:代表所有,:加在数中间就表示取区间。

so easy~

4 numpy的合并

合并操作其实困惑了我很久.......按行按列啥的日常昏迷,知道后面发现.....英语的重要性!!!!!

np.vstack((a,b))其中的v = vertical 垂直的意思,所以就是把数据竖起来合并的意思

np.hstack((a,b))其中的h = horizon 水平的意思,所以就是把数据水平合并咯!

如此浅显易懂....我当年真是太弱鸡了!!(现在至少学会了两个英语单词)

而np.concatenate((a,b,c,d),axis = 0/1)中的0/1就是使用0和1来选择v还是h。

并且两种合并方式都可以实现多个合并哟~

a = np.array([[1,22,3],[1,4,5]])
b = np.array([[1,44,3],[1,4,2]])
print(np.vstack((a,b)))#上下合并
print(np.hstack((a,b)))#左右合并
print(np.concatenate((a,b,a,b),axis=0))#多个合并

结果为:

哈哈哈哈我这结果展示 真的非常让人迷离哈~见谅 懒得改了

5 numpy的分割

以下代码里面都是实现的都是均匀的分割,除了array_split可以分割不均匀的数组:

a = np.array([[1,22,3,8],[1,4,5,8],[4,5,6,8]])
b = np.array([[1,44,3],[1,4,2],[5,7,8]])

print(np.split(a,2,axis=1))#纵向分割
print(np.array_split(a,2,axis=0))#横向分割
print(np.vsplit(a,3))#横向分割
print(np.hsplit(b,3))#竖向分割


结果为:

如果要实现不均匀的分割,那么就只需要:

np.split(a,[1,2,3],axis = 1),把第二个参数分成你想要的元素分段个数就好啦~

第二个参数[分割组每组的列数/行数,分成多少组,步长],

如果没有多余的数组来分割了就会输出空数组;如果有多余的数据会自动形成一个新数组。

 

6 numpy的复制

copy和deep copy

b = a 把a赋值给b,那么对b的所有操作,都会同步在a上发生。

b = a.copy()# deep copy  就不会有连带关系

 

以上就是numpy的简单操作,其他的操作在实际项目遇见了一般都是查询官方文档啦~

各位加油ヾ(◍°∇°◍)ノ゙

 

 

 

2017-07-26 09:59:19 tangyudi 阅读数 116
  • Python文本数据分析--实战视频教学

    购买课程后,可扫码进入学习群,获取唐宇迪老师答疑 课程首先概述文本分析的基本概念,整个课程围绕案例进行:新闻分类任务。案例从零开始讲解如何使用Python库进行分析与建模的工作。案例中实例演示如何从杂乱的文本数据开始进行分词预处理到后应用贝叶斯算法进行分类预测。 专属会员卡更超值:http://edu.csdn.net/lecturer/1079

    3905 人正在学习 去看看 唐宇迪
Python文本数据分析—2827人已学习
课程介绍    
201804021808275058.png
    课程首先概述文本分析的基本概念,整个课程围绕案例进行:新闻分类任务。案例从零开始讲解如何使用Python库进行分析与建模的工作。案例中实例演示如何从杂乱的文本数据开始进行分词预处理到后应用贝叶斯算法进行分类预测。 专属会员卡更超值:http://edu.csdn.net/lecturer/1079
课程收益
    掌握文本数据分析基础概念以及如何应用Python进行文本数据分析与分类任务
讲师介绍
    唐宇迪更多讲师课程
    计算机博士,专注于机器学习与计算机视觉领域,深度学习领域一线实战讲师。在图像识别领域有着丰富经验,实现过包括人脸识别,物体识别,关键点检测等多种应用的新算法。 参与多个国家级计算机视觉项目,多年数据领域培训经验,丰富的教学讲解经验,出品多套机器学习与深度学习系列课程,课程生动形象,风格通俗易懂。
课程大纲
  第1章:文本分析概述
    1.课程简介(数据代码下载--->)  1:30
    2.文本分析与关键词提取  12:11
    3.相似度计算  11:43
  第2章:贝叶斯算法
    1.贝叶斯算法概述  6:58
    2.贝叶斯推导实例  7:37
    3.贝叶斯拼写纠错实例  11:46
    4.贝叶斯垃圾邮件过滤实例  14:09
  第3章:案例实战:新闻数据分类
    1.新闻数据与任务简介  10:19
    2.TF-IDF关键词提取  13:28
    3.LDA建模  9:09
    4.基于贝叶斯算法进行新闻分类  14:53
    5.NLTK库概述  7:46
    6.NLTK常用方法  12:16
    7.NLTK分类器  7:58
大家可以点击【查看详情】查看我的课程
没有更多推荐了,返回首页