热门好课推荐
猜你喜欢
相关培训 相关博客
  • 机器学习初使用1回归1.1线性回归-最小二乘法拟合importnumpyasnpimportmatplotlib.pyplotaspltfromIPython.displayimportLatex,displayprint("-"*100)x=np.array([1,2,3,4,5,6,7,8,9])y=np.array([0.199,0.389...
    2019-02-19 19:36:58
    阅读量:243
    评论:2
  • 一、基础篇(了解一些基本概念)1、大数据分析要做哪些工作:通过建立指标对数据进行统计来发现数据之间的联系。利用数据挖掘和机器学习的方法,发现事件的规律和知识,并对未来事物发展进行预测。2、做大数据分析需掌握哪些知识:数据库方面的如MySQL、hive等,数据加工如Python语言,统计学知识,数据分析方法如建模、挖掘、机器学习、回归分析、分类聚类等,以及相关的业务知识。3、什么可以称之为数据...
    2019-02-06 19:33:26
    阅读量:47
    评论:0
  • 2018年11月5日《大数据与机器学习实战笔记》关于python的下载问题关于模组的下载问题关于程序的小bug1、关于python的下载问题进入python官网下载最新的版本就可以了2、关于模组的下载问题第一个模组numpy出现Nomodulenamed“numpy”numpy下载地址我下载的最下面那个zip格式的,因为我的电脑一直显示whl不能在平...
    2018-11-05 15:15:49
    阅读量:60
    评论:0
  • 第一章:大数据产业1、大数据是一个以数据为核心的产业,是一个围绕大数据生命周期不断循环往复的生产过程,在作者看来大数据产业生产流程从数据的生命周期的传导和演变上可以分为几个部分:数据收集、数据存储、数据建模、数据分析、数据变现。2、大数据人才,大数据人才可以分为以下3个方向:(1)偏重基建与架构的“大数据结构”方向研究方向为:架构理论(高并发,高可用,并行计算,MapReduce,Spa...
    2019-07-23 18:14:12
    阅读量:144
    评论:0
  • (对聚类、分类、关联分析、用户画像、推荐算法、文本挖掘、人工神经网络的简单了解)一、聚类1、k-means算法是基于向量的距离来进行聚类。首先从N个向量中任意选k个向量,计算其他N-k个向量与k个中心点的距离;然后把任意向量与它中心距离最近的归为一类,并重新计算每个类的中心向量的位置;重复上一步骤,计算与中心向量的距离,使得归类漂移小于1%。此方法要求指定类的数量和初始类的中心。2、...
    2019-02-12 20:03:44
    阅读量:43
    评论:0
  • 欧式距离漫哈顿距离同比与环比抽样高斯分布泊松分布伯努利分布 ————白话大数据与机器学习笔记 
    2016-12-20 15:18:00
    阅读量:17
    评论:0
  • 1:大数据产业生产流程从数据的生命周期的传导和演变上可以分为这样几个部分:数据收集、数据存储、数据建模、数据分析、数据变现。3:大数据人才的一将难求不奇怪:(1)大数据产业发展迅速。(2)大数据人才培养成本居高不下。3:大数据人才大致可以分为这三个方向:(1)偏重基建与架构的”大数据架构“方向。(2)偏重建模与分析的”大数据分析“方向。(3)偏重应用实现的”大数据开发“方向。...
    2017-10-23 12:38:00
    阅读量:2
    评论:0
  • 拿到一份陌生数据时,我们首先提取一些基础的统计指标看一下数据情况。平均数、标准差、中位数,众数。平均数代表数据宏观中的平均情况。标准差代表数据的离散情况,存在大量极端数据还是都是分散在平均值。中位数来判断数据是否是“正太分布”众数某种意义上代表数据的偏好程度。  ——————白话大数据与机器学习笔记 ...
    2016-12-19 13:31:00
    阅读量:18
    评论:0