精华内容
下载资源
问答
  • 机器学习速成课笔记

    2018-07-25 16:44:03
    机器学习速成课笔记,整理机器学习速成课笔记机器学习速成课笔记
  • 机器学习速成课程Whether you know it or not, machine learning has seeped into every aspect of our lives, now is a critical time for everyone to have a basic understanding in machine learning....

    机器学习速成课程

    Whether you know it or not, machine learning has seeped into every aspect of our lives, now is a critical time for everyone to have a basic understanding in machine learning. This article is designed to not only give you a macro perspective into how machine learning is applied, but to also give you the commonly left out micro perspective into how machine learning works.

    你知不知道w ^论是,学习机已经渗透到我们生活的每一个方面,现在是大家都在机器学习的基本理解的关键时刻。 本文的目的不仅是为您提供有关如何应用机器学习的宏观观点,而且还为您提供有关机器学习如何工作的通常被遗忘的微观观点。

    机器学习,深度学习和AI有什么区别? (What is the difference between Machine Learning, Deep Learning and AI?)

    All of these buzz-words are thrown out all the time and are assumed to be identical in meaning. The reality is quite different.

    所有这些流行语一直被扔掉,并被认为在含义上是相同的。 现实是完全不同的。

    Image for post
    Credit to Andreas Holzinger, Peter Kieseberg, Edgar Weippl & A Min Tjoa 2018. Current Advances, Trends and Challenges of Machine Learning and Knowledge Extraction: From Machine Learning to Explainable AI. Springer Lecture Notes in Computer Science LNCS 11015. Cham: Springer, pp. 1–8, doi:10.1007/978–3–319–99740–7_1.
    感谢Andreas Holzinger,Peter Kieseberg,Edgar Weippl和A Min Tjoa2018。机器学习和知识提取的最新进展,趋势和挑战:从机器学习到可解释的AI。 Springer计算机科学LNCS 11015中的讲义。Cham:Springer,第1-8页,doi:10.1007 / 978–3–319–99740–7_1。

    This Venn Diagram shows that Deep Learning is a subset of Machine Learning which in turn is a subset of Artificial Intelligence.

    该维恩图显示深度学习是机器学习的子集 ,而机器学习又是人工智能的子集

    Artificial intelligence is a much broader concept of machines having “intelligence”, as we humans perceive it. Machine Learning is programming an algorithm that adapts with experience. Deep Learning is a subset of Machine Learning which consists of multi-layered Neural Networks. The main focus of this article is Machine Learning, and a special emphasis on Deep Learning.

    正如我们人类所感知的那样,人工智能是具有“智能”的机器的更广泛的概念。 机器学习是一种根据经验进行调整的算法。 深度学习是机器学习的一个子集,它由多层神经网络组成。 本文的主要重点是机器学习,特别着重于深度学习。

    机器学习到底是什么? (What Exactly is Machine Learning?)

    Machine Learning can be split into to two categories: Supervised and Unsupervised learning.

    机器学习可以分为两类:监督学习和无监督学习。

    Image for post
    https://www.extrahop.com/company/blog/2019/supervised-vs-unsupervised-machine-learning-for-network-threat-detection/ https://www.extrahop.com/company/blog/2019/supervised-vs-unsupervised-machine-learning-for-network-threat-detection/

    监督下 (Supervised)

    Supervised learning is when a model is trained on labelled data: This means clear input data and “solutions” for the data.

    监督学习是指在模型上标记的数据上进行训练:这意味着要清除输入数据和该数据的“解决方案”。

    Supervised learning can be split into two types: Classification and Regression.

    监督学习可以分为两种类型:分类和回归。

    Image for post
    Credit to : https://whataftercollege.com/machine-learning/classification-of-machine-learning/
    归功于: https : //whataftercollege.com/machine-learning/classification-of-machine-learning/

    Classification is trying to identify the class that a piece of data belongs to, Regression is drawing a best-fit line in the data that can “catch” as many points as possible.

    分类试图识别数据所属的类,回归正在数据中绘制一条最适合的线,可以“捕获”尽可能多的点。

    An example of supervised learning is predicting if a human is male or female based on the measurements of the body. There is a clear solution here: the gender of the human.

    监督学习的一个例子是根据身体的大小预测一个人是男性还是女性。 这里有一个明确的解决方案:人的性别。

    要查看的算法: (Algorithms to look at:)

    Adam, RMSprop, Stochastic Gradient Descent

    亚当,RMSprop,随机梯度下降

    无监督 (Unsupervised)

    You can think of Unsupervised learning more of the interpretation of data, or the re-arranging of data to gain valuable insight.

    您可以想到无监督学习更多的数据解释,或者重新安排数据以获得有价值的见解。

    An example of unsupervised learning is clustering different music listeners together based on music that they’ve listened to. There is no clear solution for the data: it is simply categorising the data to gain insight.

    无监督学习的一个示例是根据不同的音乐收听者所听音乐将它们聚集在一起。 对于数据,没有明确的解决方案:它只是对数据进行分类以获得洞察力。

    要查看的算法: (Algorithms to look at:)

    K-means clustering, Naive Bayes Classifier, Random Forest Classifier

    K-均值聚类,朴素贝叶斯分类器,随机森林分类器

    神经网络和深度学习简介: (Introduction to Neural Networks and Deep Learning:)

    Now that you have a birds-eye view of Machine Learning, Let’s delve deeper into Deep Learning.

    既然您已经有了机器学习的鸟瞰图,那么让我们更深入地研究深度学习。

    Image for post
    Credit to: https://becominghuman.ai/understanding-the-structure-of-neural-networks-1fa5bd17fef0
    图片来源: https : //becominghuman.ai/understanding-the-structure-of-neural-networks-1fa5bd17fef0

    There are 2 in which to understand Neural Networks: A Layman’s Perspective:

    有2种方法可以理解神经网络:Layman的观点:

    To put it simply, neural networks are a flexible framework that can be easily altered to change results. You can think of a neural network as a function machine, that takes in a value and gives out an output. All that machine learning algorithms do is to change these values to get the best results possible.

    简而言之,神经网络是一个灵活的框架,可以轻松更改以更改结果。 您可以将神经网络视为功能机器,该机器接受一个值并给出输出。 机器学习算法所做的一切就是更改这些值以获得可能的最佳结果。

    This perspective retains a macro perspective of what a Neural Network really does, without getting into the nitty gritty mathematical details.

    这种观点保留了神经网络实际功能的宏观观点,而无需深入了解具体的数学细节。

    数学家的观点: (A Mathematician’s Perspective:)

    A neural network is a set of matrices, and to get an output, one must do a set of matrix multiplications to end up with an output value. Machine Learning algorithms are trying to calculate a partial derivative, that explains the relationship between each matrix and the output. By using this partial derivative to alter the matrices, the accuracy of the network can be maximised.

    神经网络是一组矩阵,要获得输出,必须进行一组矩阵乘法才能得到输出值。 机器学习算法正在尝试计算偏导数,以解释每个矩阵与输出之间的关系。 通过使用该偏导数来更改矩阵,可以使网络的精度最大化。

    迷你数学课: (A mini math lesson:)

    (I’ll try to keep this as simple as possible)

    (我会尽量保持简单)

    Let’s go back to the analogy of the neural network being a function machine. First let’s simplify the neural network down to two connected neurons:

    让我们回到神经网络作为功能机器的类比。 首先,我们将神经网络简化为两个相连的神经元:

    The mathematical way to describe a neural network is:

    描述神经网络的数学方法是:

    pred = w*xx = input_data
    w = weight
    pred = output

    This means that the output is calculated by multiplying the input the data, by the variable w. The variable w is the heart of neural networks.

    这意味着通过将输入数据乘以变量w来计算输出。 变量w是神经网络的心脏。

    衍生产品简介: (Introducing Derivatives:)

    Now let’s plot a graph for how the value of y changes, when the value of w changes (assuming x is constant):

    现在让我们绘制一个图表,以了解当w的值改变时(假设x为常数)y的值如何变化:

    Image for post

    Let’s calculate the derivative of the graph:

    让我们计算图的导数:

    Derivative is just a fancy way of saying, how do you get from the value w to y?

    导数只是一种奇特的说法,如何从值w转换为y?

    Since pred = w*x,
    the derivative of w is x, as you can multiply w by x to get pred.

    MSE: (MSE:)

    MSE is a calculation of how accurate a line of best fit is:

    MSE是对最佳拟合线的准确性的计算:

    Image for post
    Credit to: https://www.freecodecamp.org/news/machine-learning-mean-squared-error-regression-line-c7dde9a26b93/
    感谢: https : //www.freecodecamp.org/news/machine-learning-mean-squared-error-regression-line-c7dde9a26b93/

    With a line of best fit, and the set of true points, this is the equation:

    用一条最合适的线和一组真点,这是等式:

    for every real_point:
    mse += (real_point-line_of_best_fit)^2

    The MSE is essentially calculating the sum of all the errors and adding them together, for a general understanding of how accurate a line of best fit is.

    MSE本质上是计算所有误差的总和并将它们加在一起,以大致了解最佳拟合线的精确度。

    计算导数: (Calculating Derivatives:)

    The goal of the machine learning algorithm is to get a numerical value of how each weight impacts the overall accuracy of the network, and then change the weight to improve the accuracy.

    机器学习算法的目标是获得一个数值,说明每个权重如何影响网络的整体准确性,然后更改权重以提高准确性。

    Mathematically speaking, we are looking for the partial derivative of the MSE to the parameter w.

    从数学上讲,我们正在寻找MSE对参数w的偏导数。

    According to a mathematical theory called the chain rule, to calculate the derivative of a composite function (a nested function), one can multiply the derivatives with respect to each order of the function.

    根据称为链规则的数学理论,要计算复合函数(嵌套函数)的导数,可以将导数相对于函数的每个阶乘。

    In this case, it means one just has to calculate the rate of change between the MSE and the output value, then the output_value to the parameter y and multiply them together.

    在这种情况下,这意味着只需要计算MSE和输出值之间的变化率,然后将output_value转换为参数y并将它们相乘即可。

    Since the derivative of x^2 is 2x,
    the derivative of the MSE function is 2(real_points-y)We already calculated the derivative of the parameter w to be x.Therefore, the derivative of the MSE function to w is:
    x*2(y-pred)

    This means for every change in w, the MSE function increases by x*2(y-pred). Since the MSE function is a measure of error, we are trying to find the what value of the parameter w will minimize the MSE function.

    这意味着对于w的每一个变化,MSE函数都会增加x * 2(y-pred)。 由于MSE函数是一种误差度量,因此我们试图找到参数w的值将MSE函数最小化。

    Without the mathematics standpoint, machine learning would just be a black box, with no rhyme or reason to what they do.

    没有数学的观点,机器学习将只是一个黑匣子,没有韵律或理由。

    码: (Code:)

    Code is obviously a large part of machine learning, but it is very difficult and time consuming to teach a programming language to someone. I will post some annotated python code for you to run if you are interested to delve even deeper into machine learning.

    代码显然是机器学习的很大一部分,但是向某人教授编程语言非常困难且耗时。 如果您有兴趣深入研究机器学习,我将发布一些带注释的python代码供您运行。

    '''
    This is a simple neural network with just one input and one output.
    The goal of the network is to change the value of w to be 2, as the true value is 2 and the x_value is 1.
    '''x = 1
    true_values = 2*x
    w = 1
    for i in range(100):
    pred = w*xmse = (true_values-pred)**2
    # derivative of mse and prediction
    dmse_dpred = (true_values-pred)*2
    dpred_dw = x
    # Therefore
    dmse_dw = dmse_dpred * dpred_dw
    w += dmse_dw*0.1
    # This value should be very close to 0, as the accuracy of the network is increasing
    print(mse)

    应用范围: (Applications:)

    After a deep dive into a micro perspective of the math behind machine learning, let’s zoom out and look at the applications of machine learning.

    在深入研究了机器学习背后的数学的微观观点之后,让我们缩小范围并研究一下机器学习的应用。

    机器学习的工作地点: (Where Machine Learning works:)

    Image for post
    Credit to: https://www.analyticsinsight.net/10-parameters-for-big-data-assessment/
    归功于: https : //www.analyticsinsight.net/10-parameters-for-big-data-assesssment/

    When there is plentiful of labelled and doctored data, machine learning performs exceptionally well and usually draws groundbreaking conclusions. For example, machine learning algorithms that have learnt to classify fraudulent or legitimate transactions, after processing the billions of transactions per day, are now online banking’s first line of defense against internet fraudsters.

    当有大量经过标记和篡改的数据时,机器学习的表现异常出色,通常可以得出开创性的结论。 例如,在每天处理数十亿笔交易之后,已经学会对欺诈交易或合法交易进行分类的机器学习算法,如今已成为网上银行抵御互联网欺诈者的第一道防线。

    在没有的地方: (And Where It Doesn’t:)

    Machine Learning Models are very fragile and are not very robust: This means that Machine Learning models do not work for data that is scarce or extremely volatile. An example of this is to diagnose a rare disease: Since the disease does not affect many people, there is little to no data on the disease, making it impossible for the machine learning to gain true insight on the disease.

    机器学习模型非常脆弱,并且不够健壮:这意味着机器学习模型不适用于稀缺或极不稳定的数据。 这样的一个例子是诊断一种罕见的疾病:由于该疾病不会影响很多人,因此关于该疾病的数据很少甚至没有,因此机器学习无法获得对该疾病的真知灼见。

    结论: (Conclusion:)

    From this article, I hope you have learnt an overview of Machine Learning, how it fits into AI, categories of Machine Learning, a basic understanding of the math behind deep learning, and how to apply Machine Learning.

    从本文中,我希望您了解了机器学习的概述,它如何适合AI,机器学习的类别,对深度学习背后的数学知识的基本理解以及如何应用机器学习。

    Good Luck with your Machine Learning ventures!

    祝您在机器学习事业中万事如意!

    翻译自: https://medium.com/ai-in-plain-english/a-crash-course-in-machine-learning-8f75ea6a9ed5

    机器学习速成课程

    展开全文
  • 机器学习速成课程资料,内容不多,仅供参考学习,
  • 谷歌官方-机器学习速成课程,视频教程+个人学习整理,帮助数万谷歌工程师学习人工智能的课程
  • 谷歌官方发布的机器学习速成课程中文视频(太大了分4部分上传) 1.机器学习简介.mp4 2.问题构建.mp4 3.深入了解机器学习.mp4 4.降低损失.mp4 5.使用 TensorFlow 的基本步骤.mp4 6.泛化.mp4 7.训练集和测试集.mp4 8....
  • 机器学习速成教程

    千次阅读 2017-01-09 14:29:32
    原文: 机器学习速成教程 作者: Carlos E. Perez 译者: KK4SBB 欢迎技术投稿、约稿、给文章纠错,请发送邮件至heyc@csdn.net 本文来自加州大学伯克利分校机器学习实验室。作者们用通俗易懂的语言讲解了什么...

    原文: 机器学习速成教程
    作者: Carlos E. Perez
    译者: KK4SBB
    欢迎技术投稿、约稿、给文章纠错,请发送邮件至heyc@csdn.net

    本文来自加州大学伯克利分校机器学习实验室。作者们用通俗易懂的语言讲解了什么是机器学习、回归与分类的概念、损失函数的类型以及梯度下降方法,希望读者能够理解最基础的机器学习算法,并将其应用于实际项目中。

    什么是机器学习?

    机器学习并不是一个深奥的概念。实际上,大部分机器学习的算法都仅仅在做一项任务:划线。换句话说,机器学习的本质就是画一条线来区分样本数据。什么意思呢?作者举了几个例子。

    分类

    假设我们有一堆苹果和橘子的图片。我们可以从图片中获取水果的颜色和大小信息,我们想根据这些信息将图片分为苹果和橘子两类。大多数机器学习算法的第一步是获取标记过的训练数据。在这个例子中,我们需要先收集大量已经被标记过的图片,每张图片属于苹果或者橘子。然后,从这些图片中抽取出颜色和尺寸信息,寻找它们与苹果或者橘子的联系。这些信息在二维平面上的表示如图所示:

    上图中,红色的X表示苹果,橙色的X表示橘子。或许你已经从数据中发现了某些模式。表示苹果的X多位于坐标轴的左侧方向,因为大多数的苹果是红色,而表示橘子的X多位于坐标轴的右侧方向,因为大多数的橘子是橙色。因此,希望我们的算法也能学到这种模式。

    针对上述问题,我们的目标是让算法在两组X点数据之间画一条线,称为决策边界。下图所示即为一条决策边界线:

    就是这么简单的一条直线。然而,更复杂的算法最终可能得到一条更复杂的边界线,比如:

    我们假设按照已标记的训练数据画出的分界线也能区分其它图片中的水果的种类。换句话说,若我们让算法从样本数据中学会了区分苹果和橘子,那么此经验就能得到泛化,可以区分从未出现过的图片中的水果是苹果还是橘子。比如,若现在有一张含有水果的图片,即下图中的蓝色X点,按照决策边界的划分,这个水果属于橘子:

    这就是机器学习算法的威力。首先获取一批训练数据,然后跑一个机器学习算法生成决策边界,然后根据学到的模式来预测新的数据。

    当然,区分苹果和橘子实在是太容易了。我们可以把这种策略套用在更复杂的问题上,比如预测肿瘤是良性还是恶性,判断邮件是否属于垃圾邮件,或者说分析安全系统的指纹。以上问题都属于机器学习问题的一个子领域,归为分类问题,都是用线条来区分数据。机器学习还有一类子问题称作回归问题,它是画若干线条来描述数据。

    回归

    假设我们已有了标记过的训练数据。举个具体的例子,我们有很多房屋面积与房价的数据。若把这些数据画在图上,它们的分布是这样的:

    图上的每个X点表示一套房屋。尽管数据有一些扰动(即呈散点状分布),我们还是能观察到某些模式:随着房屋面积增大,房价也越来越贵。因此,我们希望让算法能够根据房屋的面积来预测房屋的价格。

    通过观察数据,我们从直觉上可以发现数据点分布在一条斜线的附近。于是,我们就假设所有房屋的价格和面积都会落在这条斜线的附近。比如,某套房屋处于图上绿色X点的概率会远大于处于图上红色X点的概率。

    现在,我们就可以按照房屋的面积,预测任意一套房屋的大致价格了。画一条穿过所有数据点的直线,它与其它点的距离尽可能接近。这条线就是一个预测器,根据房屋面积预测房价。我们可以认为这条线表示了相同面积的房屋的均价。

    图片描述
    预测器并不一定是线性的。它可以是任意类型的函数或者模型,比如二次函数、正弦函数等等。不过,模型并不是越复杂越好,不同的模型适用于不同的问题。

    在回过头来看房价预测的问题,我们不禁要问,为何只能输入一个变量?我们可以把尽可能多的信息引入模型中,比如城市的物价水平、房屋质量、建筑材料等等。若引入了当地物价水平,三个变量可以在三维空间中如此表示:

    图片描述

    同样,我们还是能训练一个预测器。只是这个预测器不再是一条直线,而是一个平面,因为输入的变量由一个变成了两个。

    图片描述

    至此,已经介绍了一个和两个变量的预测器。在实际的机器学习问题中,变量的个数往往达到成百上千。虽然我们无法想象超过三维空间的场景,但这并不妨碍我们训练预测器。

    预测器

    我们之前提到了,预测器的种类有许多种。房价预测的例子用的是线性模型。线性预测器的数学公式如下所示:

    图片描述

    各个x表示一维不同的输入变量,比如房屋面积或是物价水平,c则表示对应维度的权重值。某个权重值越大,说明该维特征越重要。我们假设房屋面积是预测房价的重要指标,那么算法就会增加面积这一维度的权重系数。相反,如果训练数据的某个维度表示房屋内插座的数量,那这个维度的权重值相对来说会比较低,因为插座的数量对房价的影响不会太大。

    我们在预测房价时只用到了房屋面积这一个变量,所以用公式表示为:y(x)=c1x+c0

    换种形式表示:y=mx+b

    y(x)是输出结果,也就是房价,x表示特征,即房屋的面积。c0是y轴的截距,即房屋的基础价格。

    那么,机器学习的算法是如何确定c2和c1的取值呢?

    损失函数

    训练参数的关键在于如何刻画预测器预测结果的“好坏”。这里我们用到了损失函数。损失函数的返回值越小,说明预测器的预测准确率越高。我们需要找到使得损失值最小的预测器。下图展示了三种不同的预测器:

    预测器a和c的预测准确率并不高,因此损失函数应当返回较大的值。预测器b对数据的拟合程度很好,损失函数的返回值也应该相应的减小。

    损失函数究竟长得什么样呢?损失函数的种类非常多,我们这里选用一种非常常见的类型,称作均方误差

    把“均方误差”这四个字一一拆解。“误差”的含义就是数据点到预测器直线的垂直距离,即(xi−yi)。如下图所示,每段红色虚线的长度表示该点的误差值。

    对于点 (xi,yi)和预测器y(x),xi表示房屋的面积,yi表示房屋的价格,平方误差等于:

    e=(y(xi)−yi)2

    然后,我们将所有点的误差值相加,然后求出平均平方误差,得到所谓的均方误差:

    图片描述

    梯度下降

    若是在空间内画出损失函数的图形,则类似下图所示:

    图片描述

    损失函数的最小值点显而易见。但是,目前我们只用到了房屋面积这一维特征。实际上,几乎所有的机器学习算法使用的特征都不只一维。在某些情况下,用到的特征会高达上亿维度,根本没办法用图表示一亿维的空间!

    为了求解高维损失函数的最小值,我们用到了梯度下降的算法。梯度下降法是求解无约束优化问题最简单和最古老的方法之一。它是用负梯度方向为搜索方向的,最速下降法越接近目标值,步长越小,前进越慢。它适用于求解任何维度的损失函数的最小值。当找到了损失函数的最小值,也就意味着找到了预测器的参数值。

    小结

    读完上文,相信你对机器学习能找到了一点感觉。希望它没有你想象的那么难。只要记住机器学习本质上就是用一条线划分训练数据。在分类问题里,这条线就是决策边界,在回归问题里,这条线就是预测器。而这条线又是用梯度下降法寻找损失函数的最小值得到的。

    事实上,机器学习的本质就是模式识别。机器学习算法通过划分训练数据来学习模式,然后把这些模式泛化到新的数据上。那么问题来了,机器学习真的是在“学习”吗?


    【CSDN_AI】热衷分享 扫码关注获得更多业内领先案例
    图片描述

    展开全文
  • 机器学习书:《机器学习宝典》包含:谷歌机器学习速成课程(招式)+机器学习术语表(口诀)+机器学习规则(心得)+机器学习中的常识性问题(内功)。该资源适用于机器学习,深度学习研究人员和爱好者参考!
  • 速成课笔记均转自谷歌机器学习速成课,为了方便自己的阅读与复习而整理,谷歌这次真的是做了一件惠及全人类的好事,通过15小时的课程让大家可以对机器学习的相关知识有所入门~原课程链接 ...但是,为了能够理解课程中...

    速成课笔记均转自谷歌机器学习速成课,为了方便自己的阅读与复习而整理,谷歌这次真的是做了一件惠及全人类的好事,通过15小时的课程让大家可以对机器学习的相关知识有所入门~原课程链接 

    https://developers.google.com/machine-learning/crash-course/


    前提条件

    机器学习速成课程并不会假定或要求您预先掌握机器学习方面的任何知识。但是,为了能够理解课程中介绍的概念并完成练习,您最好满足以下前提条件:

    • 掌握入门级代数知识。 您应该了解变量和系数、线性方程式、函数图和直方图(熟悉对数和导数等更高级的数学概念会有帮助,但不是必需条件)。

    • 熟练掌握编程基础知识,并且具有一些使用 Python 进行编码的经验。 机器学习速成课程中的编程练习是通过 TensorFlow 并使用 Python 进行编码的。您无需拥有使用 TensorFlow 的任何经验,但应该能够熟练阅读和编写包含基础编程结构(例如,函数定义/调用、列表和字典、循环和条件表达式)的 Python 代码。


    机器学习主要术语

    什么是(监督式)机器学习?简单来说,它的定义如下:

    • 机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。

    下面我们来了解一下机器学习的基本术语。

    标签

    在简单线性回归中,标签是我们要预测的事物,即 y 变量。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。

    特征

    在简单线性回归中,特征是输入变量,即 x 变量。简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征,按如下方式指定:

    {x1,x2,...xN}

    {x1,x2,...xN}

    在垃圾邮件检测器示例中,特征可能包括:

    • 电子邮件文本中的字词
    • 发件人的地址
    • 发送电子邮件的时段
    • 电子邮件中包含“一种奇怪的把戏”这样的短语。

    样本

    样本是指数据的特定实例:x。(我们采用粗体 x 表示它是一个矢量。)我们将样本分为以下两类:

    • 有标签样本
    • 无标签样本

    有标签样本同时包含特征和标签。即:

    
     
      labeled examples: {features, label}: (x, y)

    我们使用有标签样本来训练模型。在我们的垃圾邮件检测器示例中,有标签样本是用户明确标记为“垃圾邮件”或“非垃圾邮件”的各个电子邮件。

    例如,下表显示了从包含加利福尼亚州房价信息的数据集中抽取的 5 个有标签样本:

    housingMedianAge
    (特征)
    totalRooms
    (特征)
    totalBedrooms
    (特征)
    medianHouseValue
    (标签)
    155612128366900
    197650190180100
    1772017485700
    14150133773400
    20145432665500

    无标签样本包含特征,但不包含标签。即:

    
     
      unlabeled examples: {features, ?}: (x, ?)

    在使用有标签样本训练了我们的模型之后,我们会使用该模型来预测无标签样本的标签。在垃圾邮件检测器示例中,无标签样本是用户尚未添加标签的新电子邮件。

    模型

    模型定义了特征与标签之间的关系。例如,垃圾邮件检测模型可能会将某些特征与“垃圾邮件”紧密联系起来。我们来重点介绍一下模型生命周期的两个阶段:

    • 训练表示创建或学习模型。也就是说,您向模型展示有标签样本,让模型逐渐学习特征与标签之间的关系。

    • 推断表示将训练后的模型应用于无标签样本。也就是说,您使用训练后的模型来做出有用的预测 (y')。例如,在推断期间,您可以针对新的无标签样本预测 medianHouseValue

    回归与分类

    回归模型可预测连续值。例如,回归模型做出的预测可回答如下问题:

    • 加利福尼亚州一栋房产的价值是多少?

    • 用户点击此广告的概率是多少?

    分类模型可预测离散值。例如,分类模型做出的预测可回答如下问题:

    • 某个指定电子邮件是垃圾邮件还是非垃圾邮件?

    • 这是一张狗、猫还是仓鼠图片?

    展开全文
  • 而今天谷歌上线了基于 TensorFlow 的机器学习速成课程,它包含 40 多项练习、25 节课程以及 15 个小时的紧凑学习内容。 谷歌官方描述为机器学习热爱者的自学指南,且课程资料都是中文书写,课程视频都由机器学习...

        随着机器学习越来越受到公众的关注,很多初学者希望能快速了解机器学习及前沿技术。

    而今天谷歌上线了基于 TensorFlow 的机器学习速成课程,它包含 40 多项练习、25 节课程以及 15 个小时的紧凑学习内容。

    谷歌官方描述为机器学习热爱者的自学指南,且课程资料都是中文书写,课程视频都由机器学习技术转述为中文音频。

    这对于中文读者来说将会有很大的帮助,当然我们也能选择英文语音以更精确地学习内容。

    此外,据了解,这曾是谷歌内部培训工程师的课程,有近万名谷歌员工参与并将学到的东西用在产品的优化和增强上。

     

     

    课程地址:https://developers.google.cn/machine-learning/crash-course/

     

     

     

     

    展开全文
  • 机器学习速成课程-笔记 机器学习速成课程,Google开发者项目的一个机器学习课程,建议想要深入了解机器学习的筒子们静下心来好好学一下。 前置技能 Math python 安装MLCC的本地编程练习 关于virtualenv的介绍可以...
  • 机器学习速成课程: https://developers.google.cn/machine-learning/crash-course 目录 训练参数: 线性回归 泛化 (Generalization):过拟合的风险 训练集和(验证集)测试集 特征工程 特征组合 正则化(降低过...
  • 谷歌机器学习速成课程中文视频(第三部分) 17.多类别神经网络.mp4 18.嵌入.mp4
  • 机器学习入门 - Google机器学习速成课程 - 笔记汇总 机器学习入门 - Google机器学习速成课程 https://www.cnblogs.com/anliven/p/6107783.html MLCC简介 前提条件和准备工作 完成课程的下一步 机器学习入门01 - ...
  • 机器学习课程的编程实现,使用python语言。
  • 机器学习速成课程】学习总结(上)
  • 在开始机器学习速成课程之前,请先阅读下面的前提条件和准备工作部分,以确保您已做好完成所有单元所需的准备工作。 前提条件 机器学习速成课程并不会假定或要求您预先掌握机器学习方面的任何知识。但是,为了能够...
  • 机器学习速成课程】学习总结(中)
  • 机器学习速成课程】学习总结(下)
  • 谷歌机器学习速成课程中文视频(第四部分) 16.训练神经网络.mp4 19.生产机器学习系统.mp4 20.静态训练与动态训练.mp4 21.静态推理与动态推理.mp4 22.数据依赖关系.mp4 23.癌症预测.mp4 24.18 世纪文学.mp4 25.现实...
  • 谷歌机器学习速成课程中文视频(第二部分) 11.简化正则化.mp4 12.逻辑回归.mp4 13.评估分类模型.mp4 14.稀疏性正则化.mp4 15.神经网络简介.mp4
  • 机器学习速成课程You have nearly finished your project, and only one feature is left. You implement the last one, but bugs appear in different parts of the system. You fix them, but another one pops up...
  • 谷歌机器学习速成课程学习笔记 谷歌机器学习速成课程学习笔记 framing 深入了解 tensorflow pandas tensorFlow基本步骤 泛化 数据集划分 表示:特征工程 良好的特征: 清理数据 特征缩放 处理极端离群值 分箱 ...
  • 1 - MLCC ...Google的机器学习速成课程(MLCC,machine-learning crash-course):https://developers.google.com/machine-learning/crash-course/ 支持多语言,共25节课程,包含40多项练习,有...
  • 机器学习速成课程 使用 TensorFlow API网址:https://developers.google.cn/machine-learning/crash-course/目录简介:前提条件和准备工作机器学习概念:框架处理(15 分钟)机器学习中的监督学习深入了解机器学习...
  • 机器学习速成课程 是 Google 在 google.cn 推出的一些了机器学习课程,针对初学者,只要有一些基础的数学以及 python 知识,就可以开始快速入门。
  • 最近看了一下google的机器学习速成课程,其中有一个预测房价的例子,我觉得挺有意思,我之前也写过一篇预测房价的博客,但是google的这个例子中他们的特征工程做的比较细致,这其中有很多值得学习的地方,所以我想和...
  • 谷歌机器学习速成

    2018-03-04 16:00:57
    谷歌开放了机器学习速成课,对于不能上外网而又求知若渴的同学,感谢量子位提供了以下链接来方便大家原地址:https://developers.google.cn/machine-learning/crash-course/量子位:...amp;mid=2247495096&...
  • 学习google 机器学习速成课程 笔记2 特征工程 从原始数据中提取特征的过程 如果原始数据为字符串,可以使用One-Hot编码将其转换成特征向量。特征一般为浮点数表示。 将字符串值映射到浮点数 1. 首先,为要表示...
  • 学习谷歌的机器学习速成课程 标签:标签是我们要预测的事物,也就是y 特征:特征是输入变量,也就是x,按照如下方式指定{x1,x2,x3….,xN},合适的特征应该是具体可量化的,for example,喜欢不是可观察且可量化的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,056
精华内容 2,022
关键字:

机器学习速成