精华内容
下载资源
问答
  • 机器学期库dlib

    2017-10-31 14:00:22
    Dlib is a modern C++ toolkit containing machine learning algorithms and tools for creating complex software in C++ to solve real world problems. It is used in both industry and academia in a wide ...
  • Spark中机器学期(Machine Learning)之KMeans算法完整代码讲解
  •  机器学习是被人工设置好的条件来分析处理数据(适合处理少量数据);  而深度学习是自动找出这个分类问题所需要的重要特征来进行对比区分,它可以用概念组成网状层级结构来表示想要分析的对象,每一个概念和更...

    初步对比查看链接:https://baijiahao.baidu.com/s?id=1595509949786067084&wfr=spider&for=pc

    总结下来就是:

      机器学习是被人工设置好的条件来分析处理数据(适合处理少量数据);

      而深度学习是自动找出这个分类问题所需要的重要特征来进行对比区分,它可以用概念组成网状层级结构来表示想要分析的对象,每一个概念和更简单的概念相连接,抽象的概念用没那么抽象的概念相连(适合处理大数据,要求有GPU参与运算,因为GPU是专门为矩阵运算而设计的).

    接下来的是矩阵运算的介绍链接:https://www.baidu.com/s?tn=80035161_2_dg&wd=%E7%9F%A9%E9%98%B5%E8%BF%90%E7%AE%97

    GPU和深度学习更搭配的介绍链接:https://www.sohu.com/a/196892449_804770

    转载于:https://www.cnblogs.com/zhangxiangning/p/10288119.html

    展开全文
  • 广州大学机器学习与数据挖掘实验报告,其中一个链接为:https://editor.csdn.net/md/?articleId=113242787
  • 一、本学期的的总结: 本学期从第一个网络LeNet写起,到AlexNet,再到VGG16。期间使用LeNet做了手写数字识别,使用AlexNet做了猫狗大战的分类。 卷积神经网络的基本单元:卷积层、Kernel-size、Zero-padding、池化...

    一、本学期的的总结:

     

    本学期从第一个网络LeNet写起,到AlexNet,再到VGG16。期间使用LeNet做了手写数字识别,使用AlexNet做了猫狗大战的分类。

     

    卷积神经网络的基本单元:

    卷积层、Kernel-size、Zero-padding、池化层、非线性激活函数

    、全连接层

     

     

     

     

    LetNet网络结构:

     

    AlexNet网络结构:

     

    Vgg网络结构:

     

     

    RestNet网络结构:

     

     

    具体实现代码在仓库:

    https://coding.net/u/Qinxianshen/p/Tensorflow-Learning/git?public=true

     

    二、自己对机器学习的理解:

    我在念高中期间,做了不少题目的。会通过刷题目,总结一类题目的解法,以后遇到这类题目,就用这个“套路”去解决。这其实就说明了一种学习方式,从特殊到抽象一般规律,再用一般规律去解决特殊问题。这种从一般到特殊的过程,被称为“泛化”,而从一般到特殊的过程,被称为“演绎”。

    我们可以通过这个例子来理解机器学习,在做的事情。机器学习,顾名思义。也就是让机器去学习。这其实是一个研究“学习”的过程。通过,让机器从一群数据中摸索,得出一个模型,当新的样本出现的时候,用这个模型,来解决问题。

    对于人来说,我们可以从数据中得到一些规律,进而抽象出一些概念,发展出一门学科。这被称为“概念形成”,“概念学习”。但是,当数据的特征,属性太多的时候,人们往往很难得出概念,或者说概念无法被人类理解。举一个例子,我们可以很容易理解3维、4维空间的事物,在脑海中,可以很容易形成这些画面。但是随着维度的增加,我们就很难从脑海中想象了。

    这里举一些例子,来理解接下来的概念。

    首先,我们来问一个问题,“什么样的蘑菇是有毒的?”你可能会回答,“颜色太鲜艳的是有毒的”。很好,你提到了蘑菇的颜色。这个是蘑菇的一个特征(Feature),当然还有很多很多。味道,气味,触摸感等等。随着你的参考特征的增加,这个问题的研究维度就在不断的增加。我们把这些特征张成的空间称为“属性空间”或者“样本空间”,空间的维度与你研究这个问题选取的特征数有关。就如同,你在做平面几何的时候,参考的是x 和 y 两个坐标轴,那么x,y张成的空间是2维的,当你研究立体几何的时候,增加了z轴这个参考,4维的话,你可以加上时间轴。5维的话,根据你研究的问题,选取对应的特征。是有些抽象,可以停一下,再读下去。

    好,我们继续。我们说过,学习的过程往往要从很多案例中学习,这一个个案例,被称为“样本”。假设我们有足够的案例,是否可以继续来研究“什么样的蘑菇是有毒的”这个问题呢?或许还不行,最好我们还能知道,每个案例的结果,也就是每个样本我都知道,哪些是有毒的,哪些是没有毒的。也就是样本的“标签”(Target)。而这些有标记信息的示例张成的空间被称为“标记空间”或者“输出空间”。我们把样本作为行,特征作为列,把这些例子写在一张表上。看看我们能不能从这张表中得出规律。不知道,看到这里你有没有注意到,这张表是不是和你学的矩阵很类似。其实潜移默化中,我们已经把问题转化成,在一个空间里寻找最优解的问题了。

    “矩阵不仅仅是数字排列而成的表而已。比如M*N的矩阵A,它表示了从n维空间到m维空间的“映射”。具体来讲就是把n维空间中的点x(n维列向量)变换到m维空间的点(m维列向量)Ax的映射”。

    上面这一段是节选自《程序员的数学》这一册书的第三本《线性代数》里的综述。我很建议大家读读这本书,对大家理解线性代数,有很大的帮助。矩阵的运算,可以理解为空间的变换。

    回到我们的蘑菇,“什么样的蘑菇有毒?”实际上就是把众多的案例分类成“有毒”、“没毒”。这种问题被称为“分类”问题。而这个例子,只分成两类,那么就是“二分类”问题。

    想象一下,这个问题就可以转化成,例子就是散落在一个高维空间的一个个点,你要用一个线或者超平面,去把这些点优雅地分开。

    当然这个例子只是一个分类问题,因为我们预测的值是离散的,比如明天是阴天还是晴天。但是,当研究问题变成明天会是多少度。预测的值变成连续的,定量的,那么这就是一个回归问题。

    当然这些问题都是,你已经知道了案例的结果而定的。如果说,你不知道“标签”,也就是Target时,怎么办?事实上,现实生活中,这样的例子挺多的。你事先不知道结果。这些数据,是否能够拿来学习呢?答案是可以的,我们可以分析,这些案例之间的特征相似度,把他们分成一个个组,或者叫做“簇类”。“物以类聚,人与群分”。这就是一个聚类的过程。

    前者能够,知道标签的学习,被称为“监督学习”,没有标签的学习,被称为“非监督学习”。

     

    上述理解是我本学期时写的一段理解,现在记录在此处:

    https://www.bilibili.com/read/cv331390

     

    三、使用深度学习做的一些小尝试:

     

    (1)用机器学习算法实现简单图像分类

    运行效果:

     

    实现说明:

     

    数据集:Kaggle 猫狗大战数据集合

    地址:https://www.kaggle.com/c/dogs-vs-cats/data

    PS:该数据集分为 train 和 test 两个文件夹 一共有25000张图片。由于数据集文件太大,就没有放到项目里了。

     

     

    Logs文件夹:存放这训练的保存文件。每2000保存一次,我们训练的总次数10000次 所以保存了 2000 4000 6000 8000 9999步的训练模型。

     

    主要代码:

    input_data.py 文件:

    用于数据处理和解析。get_files函数,对图片的路径进行切片,取出图片名字里的标签,猫和狗,给图片进行标签。并随机打乱。get_batch函数,对处理好的数据每次只取一定数量,我们是每次取出了64张。(根据电脑的不同,选择不同,内存如果大可以选择多一些)

    model.py文件:

    定义了网络的结构。具体网络结构写在后文。除了定义网络结构,还写了一些辅助的函数,方便训练时操作。losses,evaluation,trainning等。

    train_and_val.py文件:

    程序的入口。主要编写了training的函数,训练模型的函数。和随机从25000张图片里取出一张用模型进行检测。

     

    网络结构:(该网络并非经典的letnet,alexnet,vgg16等等)

     

    输入:

    208*208

    卷积:3*3    步长:1      输入通道:3   输出通道16

    208*208

    池化:3*3    步长:2     

    104*104

    卷积:3*3    步长:1      输入通道:16   输出通道16

    104*104

    池化:3*3    步长:1

    104*104

    全连接 输入:104*104*16 输出128

    全连接 输入:128   输出128

    全连接 输入:128   输出2(分成2类)

    相关参数说明:

    最终分类:2类(2分类问题,数据集可以拓展)

    输入图片宽度:208

    输入图片长度:208

    训练集和测试集:8:2

    每次取出64张图片进行训练。

    分配程序内存:2000mb

    训练次数:10000

    学习率:0.0001

    非线性函数:relu

    正则化处理:lrn(虽然已经过时了,但是在这个简单的网络还是很适用的)

    优化器:Adapoptimizer

     

     

     

    拓展:

    上述代码是二分类问题。手写数字识别可以实现多分类问题。


     

    上述实验,我们在答辩的时候也有演示,使用的是Lenet网络。

    具体代码已经存放在我们的代码仓库:

    https://coding.net/u/Qinxianshen/p/Tensorflow-Learning/git?public=true

     

    (2)使用Google开源的API 进行object detection:

    使用前的准备工作:

    https://www.zhihu.com/question/61173908

    可以加入opencv 通过摄像头实时识别:

     

    首先要加入opencv的库

    sudo apt-get install opencv-python

    调用官方的api的代码在 object-detection-change.py

    参考了这个教程:

    https://www.youtube.com/watch?v=COlbP62-B-U

    四、本学期了解的其他有趣的案例

    1.RNN的通俗解释

    http://blog.csdn.net/qq_39422642/article/details/78676567

    2.机器学习如何用GPU实现优化

    http://blog.csdn.net/Uwr44UOuQcNsUQb60zk2/article/details/79049210

    3.使用Tensorflow RNN来写诗

    https://github.com/hzy46/Char-RNN-TensorFlow

    4.使用Tensorflow RNN来预测比特币的股价

    https://gitee.com/fendouai/TensorFlow-Bitcoin-Robot

    5.详细配置Caffe

    http://blog.csdn.net/A_Z666666/article/details/72853346

    6.Tensorflow1.7新特性

    http://blog.csdn.net/dqcfkyqdxym3f8rb0/article/details/79572577

    7.如何在ubuntu16.04安装TensorflowGPU

    http://blog.csdn.net/qin_xian_shen/article/details/79574056

    8.如何安装Ubuntu16.04

    https://www.bilibili.com/video/av16053502/

    9.Tensorflow入门经典教程(CNN RNN 等等)

    https://github.com/aymericdamien/TensorFlow-Examples

    10.Tensorflow物体识别

    https://github.com/tensorflow/models/tree/master/research/object_detection

    对应的中文教程:

    https://www.zhihu.com/question/61173908

    11.Tensorflow的生成艺术的模型: https://github.com/tensorflow/magenta/tree/master/magenta/models

    12.Tensorflow音乐生成

    1)Google Magenta Github地址 https://github.com/tensorflow/magenta

    2)用Tensorflow创作曲子: https://github.com/llSourcell/Music_Generator_Demo

    13.用Tensorflow画画

    1)Skatch RNN 论文地址: https://arxiv.org/pdf/1704.03477.pdf

    2)Skatch RNN Tensorflow官网的介绍: https://magenta.tensorflow.org/sketch_rnn

    3)Google Blog 对Skatch RNN的介绍: https://research.googleblog.com/2017/04/teaching-machines-to-draw.html

    4)Sketch RNN的notebook地址: https://github.com/tensorflow/magenta-demos/blob/master/jupyter-notebooks/Sketch_RNN.ipynb

    5)Quick Draw 感受一下这个画图的识别游戏: https://quickdraw.withgoogle.com/data

     

     

     

    展开全文
  • 机器学习实战(第六章-支持向量机-所有代码与详细注解-python3.7) 机器学习实战(第六章-支持向量机-所有代码与详细注解-python3.7)
  • 斯坦福大学机器学习视频,包括完整的视频,PPT,教学源码,课程笔记,每张节的PDF。
  • 在 Python 中有很多机器学习的模块,比如 Sklearn Tensorflow Caffe 等,可以很方便地调用一些机器学习的算法如果你对 Python 机器学习感兴 趣,这份 python 机器学习视频教程 的就分享给你 python 基础教程:/s/1...
  • 这篇文档总结了常见机器学习的基本算法,希望能对大家有用!
  • 机器学习基础知识之概率论的Matlab描述概率的图像(二) 一、引言 二、实际的Matlab的应用 1、F分布 2、泊松分布 3、指数分布 4、均匀分布 5、二项分布 6、这个是求一组随机数据的平均值 7、试生成一组...

    文章目录

    • 机器学习基础知识之概率论的Matlab描述概率的图像(二)
    • 一、引言
    • 二、实际的Matlab的应用
    • 1、F分布
    • 2、泊松分布
    • 3、指数分布
    • 4、均匀分布
    • 5、二项分布
    • 6、这个是求一组随机数据的平均值
    • 7、试生成一组40000个正态分布随机数,使其均值为0.5,标准差为1.5,试分析这样的数据实际的均值、方差、标准差等。
    • 8、求解协方差
    • 9、求解相关系数矩阵
    • 10、求解各阶矩
    • 11、求解集合均值
    • 12、求解调和平均
    • 13、求解中值

    小福利:领完再看!迪迦给大家准备的250G人工智能学习资料礼包内含:两大Pytorch、TensorFlow实战框架视频、图像识别、OpenCV、计算机视觉、深度学习与神经网络等等等视频、代码、PPT以及深度学习书籍

    只需要你点个关注,然后扫码添加助手小姐姐VX即可无套路领取!

      扫码添加即可

    一、引言

    本文我们直接接着上一篇文章,继续进行概率论的Matlab描述概率的图像,上一篇文章是:

    机器学习基础知识之概率论的Matlab描述概率的图像(一)_江月的博客-CSDN博客

    (上一篇说到了:9、Rayleigh分布函数的绘制)

    二、实际的Matlab的应用

    1、F分布

    下面首先展示一下绘制 F分布 的代码:

    在这里插入图片描述

    绘制出来的图像如下图所示:(F分布。)

     在这里插入图片描述

     在这里插入图片描述

    在这里插入图片描述 

    2、泊松分布 

    在这里插入图片描述

     在这里插入图片描述

     

    3、指数分布

    在这里插入图片描述

    在这里插入图片描述 

     4、均匀分布

    在这里插入图片描述

    5、二项分布 

    在这里插入图片描述

     在这里插入图片描述

     

    以下我们所列举的一些例子与绘图可能是并没有太多的关系的,但是,这些都是绘制多维图像的基础了啦,所以也是值得一看的哦。

    6、这个是求一组随机数据的平均值在这里插入图片描述

     

    7、试生成一组40000个正态分布随机数,使其均值为0.5,标准差为1.5,试分析这样的数据实际的均值、方差、标准差等。

    在这里插入图片描述

     

    8、求解协方差

    cov是协方差啦。

    (cov函数。

    在这里插入图片描述

    9、求解相关系数矩阵 

    在这里插入图片描述

    10、求解各阶矩 

    在这里插入图片描述

     11、求解集合均值

    在这里插入图片描述

    12、求解调和平均 

    在这里插入图片描述

     13、求解中值

    在这里插入图片描述

     

    以上有的例子可能跟图像没啥关系,但是那些都是绘制多维图形的基础。

    好了,本文就到此为止了,在最后一篇文章里面将会主要绘制多维的曲线和图像了。

    最后,期待大家的关注与点赞哦。

    谢谢大家的阅读与支持,(づ ̄3 ̄)づ╭❤~。

    展开全文
  • 本文档包括吴恩达机器学习视频百度网盘(视频+PPT+个人笔记+作业)
  • Course mechine-learning 斯坦福 吴恩达 机器学习 编程作业答案
  • 这是一本好书,刚好对应我的知识水平,看得很爽不用停歇。 编译原理、通信原理、概率论、线性代数。 转载于:https://www.cnblogs.com/l2017/p/10326697.html...

    这是一本好书,刚好对应我的知识水平,看得很爽不用停歇。

    编译原理、通信原理、概率论、线性代数。

    转载于:https://www.cnblogs.com/l2017/p/10326697.html

    展开全文
  • 1、多特征的回归函数 此时我们将一个样本数据的多个特征看作向量,回归函数的系数也看作向量   求回归系数:   ...数据归一化是通过减少随机梯度下降算法的迭代次数来提高算法效率的...
  • 2019-2020第一学期软件工程专业 机器学习的试卷(回忆版),老师是xxs。考试形式是开卷,考试的时候就怕写字速度不够快,资料太多翻不过来。
  • 机器学习读书笔记:假设检验(一)

    万次阅读 2020-08-12 14:39:20
    在前一篇文章写到的评估方法与性能评价中(白话机器学习:模型性能评价),我们可以针对某个学习算法去计算出性能指标来。那么这个性能指标是不是真的好呢?因为我们获得的是测试集的性能指标,而不是整个全局的性能...
  • 机器学习在生活中的九大有趣应用

    千次阅读 2019-08-11 21:56:49
    机器学习是这些私人助理的重要组成部分,首先他们在收集和完善信息上发挥了重要作用,然后将使用这组数据来呈现根据您的首选项定制的结果。怎么样,机器学习是不是很强大呢?   No2: 交通预测   ...
  • 比如在图像识别中,一开始机器在识别事物的时候准确率是比较差的,机器的表现带有很大随机性,但是经过一段时间训练,随着我们给机器看的图像越来越多,机器的图像识别准确性会逐步提高。当学习的图片积累到一定数量...
  • 使用FC算法解决futoshiki问题, 在该代码中,利用了结构体的形式,将比较大小的进行了简单化,以及利用copy的方法使得DSF时状态很容易回到原状态,并附加了学习的ppt,ppt中也有伪码,该代码的适用性比较高,在知道...
  • 学习大纲  第一课 MATLAB入门基础  第二课 MATLAB进阶与提高  第三课 BP神经网络  第四课 RBF、 GRNN和PNN神经网络  第五课 竞争神经网络与SOM神经网络 ... 第六课 支持向量机( Support Vector ...
  • 通过开发可以回顾从基因组数据库中选出的蛋白质信息的机器学习模型,研究人员发现了用于构建人工蛋白质的相对简单的设计规则。当团队在实验室中构建这些人造蛋白质时,他们发现它们的化学反应非常出色,可以与自然...
  • 机器学习概述

    千次阅读 2018-05-25 22:56:41
    机器学习概述 一、机器学习的定义 机器学习是一门从数据中研究算法的多领域交叉学科,研究计算机如何模拟或实现人类的学习行为,根据已有的数据或以往的经验进行算法选择、构建模型,预测新数据,并重新组织已有的...
  • 机器学习领域,人们说起回归,有时候是指一类问题,有时候是指一类算法,这一点常常会使初学者有所困惑。常见的回归算法包括:最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归...
  • 处理日期和时间1.1 把字符串转换成日期1.2 处理时区1.3 选择日期和时间1.4 将日期数据切分成多个特征1.5 计算两个日期之间的时间差1.6 对一周之内的各天进行编码1.7 创建一个滞后的特征1.8 使用滚动时间窗口1.9 处理...
  • 机器学习(1) —- 机器学习算法综述 个人博客,欢迎参观: http://www.ioqian.top/about/ 本着拓展知识的态度看了机器学习的一个视频,把自己的理解做个总结,分为3部分 1.机器学习算法分类,主要看分类,...
  • [HITML]哈工大2020秋机器学习期末试题

    千次阅读 2020-11-22 18:58:22
    哈工大2020秋机器学习期末试题 (1) 样本标签Y和属性A1之间的信息可以选择属性。给出互信息的定义。 (2) 决策树空间很大,用互信息(信息增益)选择属性的目的?这样做有什么好处? (3) 如何避免决策树过拟合? Y...
  • 机器学习评价指标

    千次阅读 2018-10-05 21:19:37
    1.10.3 排序误差 2 拟合(回归) 2.1 平均绝对误差 2.2 平均平方误差 2.3 解释变异 2.4 决定系数 3 聚类 3.1 兰德指数 3.2 互信息 3.3 轮廓系数 4 信息检索 在使用机器学习算法的过程中,针对不同场景需要...
  • Datawhale干货来源:大数据文摘,整理:数据派THU本文约5300字,建议阅读10分钟。本文为你介绍23种机器学习项目创意,以获取有关该增长技术的真实经验。我们都知道,教科书上...
  • 机器学习课程的学期项目 该项目的目的是为灰度图像着色。 通常,经典的着色方法可以大致分为三类: 基于涂抹的着色(通常基于优化) 基于示例的着色(通常基于优化和/或基于机器学习) 基于学习的着色(通常基于...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,521
精华内容 5,408
关键字:

机器学期