热门好课推荐
猜你喜欢
相关培训 相关博客
  • 如今,人工智能技术已经成为国家战略,无人超市、人脸识别、自动驾驶、智能家居等“黑科技”正逐渐成为现实。像云计算、大数据、深度学习、算法、语音识别、技术机器人技术等作为人工智能的技术储备,都离不开Python、Java、C++等编程语言的支撑。而当下热门的Python被认为是现阶段人工智能技术的首选编程语言。因此想入门人工智能领域,需要从Python入手(下图来自拉勾网2019年8月8日数据)...
    2019-08-19 17:56:03
    阅读量:310
    评论:0
  • 什么是机器学习?机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测为什么需要机器学习解放生产力、解决专业问题、提供社会便利机器学习应用场景自然语言处理、无人驾驶、计算机视觉、推荐系统、、、机器学习在各领域带来的价值领域:医疗、航空、教育、物流、电商。。。。目的:让机器学习程序替换手动的步骤,减少企业的成本也提高...
    2019-06-07 16:05:16
    阅读量:44
    评论:0
  •   学习过程中梳理一些知识点,在机器学习中,对原始数据的处理和特征提取,是最为重要的,处理好原始数据,哪怕后面使用简单的算法都可以得到比较好的准确率。  这是大神们的理解      说白了,所谓的特征工程,听起来很高大上,其实就是从数据中抽取出来的对预测结构有用的信息,使得其能在机器学习算法上发挥更好的作用。   大部分算法精进和数据分析所做的工作都是:  a)跑数据,  各...
    2018-06-22 14:23:40
    阅读量:703
    评论:0
  • 机器学习里有一句名言:数据和特征决定了机器学习的上限,而模型和算法的应用只是让我们逼近这个上限。这个说法形象且深刻的提出前期数据处理和特征分析的重要性。这一点从我们往往用整个数据挖掘全流程60%以上的时间和精力去做建模前期的数据处理和特征分析也能看出。那么疑问来了,这超过60%时间和精力我们都用在哪了?本文基于以往的知识储备以及实际的项目经验,我做一个总结。主要包括三部分,一是获取数据、数据抽样,二是数据探索,三是数据预处理与清洗。
    2017-11-30 11:58:11
    阅读量:9447
    评论:3
  • 1.大数据与机器学习的关系:大数据领域我们做的是数据的存储和简单的统计计算,机器学习在大数据的应用是为了发现数据的规律或模型,用机器学习算法对数据进行计算的到的模型,从而决定我们的预测与决定的因素(比如在大数据用户画像项目里,生成的特殊用户字段)。2.大数据在机器学习的应用目前市场实际开发模式中,应该在大数据哪一个阶段层次应用到机器学习的相关技术呢,我们接下来来说明,首先目前大数据的架...
    2018-09-21 10:00:46
    阅读量:1883
    评论:0
  • 1.为什么做特征工程       我们学习编程语言时被告知程序=数据结构+算法,那么对于机器学习,我认为也可以类比为机器学习=大数据+机器学习算法+运行平台。面对一个机器学习问题,一般有两种解题思路:传统机器学习算法或者深度学习算法。一般而言,传统机器学习需要的样本数量相对少、算法运行快、内存开销小、算法的运行和部署难度小,但困难是对数据的表示:特征工程,也可以形容为沙里淘金;而深度学习算法,可...
    2018-07-10 15:42:33
    阅读量:1534
    评论:0
  • 机器学习实战的特征工程主要包含数据预处理、特征构建、特征选择三步,首先来介绍数据预处理。我选择python作为工具,并将主要用到pandas、numpy等数据工具库。加载库:importpandasaspdimportnumpyasnp1.观察数据(1)查看数据的行数和列数print("TRAINshape:",train.shape)(2)查看数据的...
    2018-09-26 10:59:39
    阅读量:169
    评论:1
  • 机器学习-数据特征预处理数据的特征预处理对数据进行处理:通过特定的统计方法(数学方法),把数据转换成算法需要的数据。类:sklearn.preprocessing数值型数据:​ 标准缩放: 归一化标准化缺失值类别型数据:one-hot编码时间类型:时间的切分归一化归一化处理:统计人觉得几个特征同等重要时,要用归一化目的:使得一个特征不会对最终结果不会造成更大...
    2018-12-03 15:45:09
    阅读量:66
    评论:0
  • 机器学习数据特征预处理特征同等重要时进行归一化或标准化1、归一化归一化缺点:如果数据中异常点较多,会使得某一特征对最终结果造成影响。2、标准化注:上边标准化特点应该是标准差为1归一化与标准化比较3、缺失值处理注:np.nan为float类型4、数据降维(特征的数量)1、过滤式...
    2019-07-03 12:00:05
    阅读量:8
    评论:0
  • 机器学习流程、有监督学习、无监督学习、数据预处理、特征工程总共分为四个notebook,主要讲解机器学习的流程,有监督无监督学习,数据处理与特征工程。1.背景在我们学习某个行业之前,首先大概了解一下这个行业的发展,以及要研究的方向,以下是从网上找的一些有关于机器学习的一些发展史。1.1机器学习40年发展史1.2机器学习的前世今生1.3一文让你了解机器学习的历...
    2018-05-10 17:39:43
    阅读量:3089
    评论:0