精华内容
下载资源
问答
  • 运动健身类App 用户的使用动机有哪些?今天选取的论文为《社交化、认同与在场感: 运动健身类App 用户的使用动机与行为研究》于2018年发表在《现代传播》。该论文基于使用与满足的理论框架,通过因子分析确定运动...

    运动健身类App 用户的使用动机都有哪些?

    今天选取的论文为《社交化、认同与在场感: 运动健身类App 用户的使用动机与行为研究》于2018年发表在《现代传播》。该论文基于使用与满足的理论框架,通过因子分析确定运动健身类APP用户的主要使用动机变量维度,以及使用动机与满足情况。

    一 研究背景&研究问题

    随着移动互联网的发展,运动健身类APP正在迅速发展,并直接影响到人们的生活方式。作为健康传播中的一种新手段,运动健身类APP具有传播的即时性、精准性等优势。

    研究者基于相关研究提出以下研究问题:

    Q1:都市人群使用运动健身类APP有哪些主要行为特征?

    Q2:都市人群使用运动健身类APP的主要动机有哪些维度?

    Q3:这些不同的动机维度在不同特征的人群中是否存在差别?

    Q4:运动健身类APP的不同使用动机与使用满足之间是否存在一致性?

    Q5:运动健身类APP用户特征以及不同使用动机与其使用行为(频率)之间有何相关性?

    二 研究方法

    作者采用问卷调查法和深度访谈法来探索运动健身类APP的使用动机与行为。

    关于问卷中的量表:

    问卷中包含两个量表:运动健身类APP的使用动机量表和运动健身类APP的使用满足量表

    运动健身类APP使用动机量表:研究者结合前人量表和深度访谈资料,设计题项进行测量。采用李克特五级量表,使用探索性因子分析得到五个公因子,删除不相符的语句后再次进行因子分析得到四个公因子,命名为:运动功能、社交互动、自我实现和娱乐消遣(即运动健身类APP使用动机的四个维度)。(——回答了Q2)

    Tips:因子分析是为了检验问卷的结构效度。

    问卷结构效度分析的常用方法有两种:探索性因子分析和验证性因子分析。

    探索性因子分析:当研究者结合文献设计出量表或者量表本身维度是未知的,需要用探索性因子分析。

    验证性因子分析:当研究者引用量表时,维度是已知的,需要验证量表数据情况,需要用验证性因子分析。

    量表的信效度检验:

    信度检验:

    对运动健身类APP使用动机量表的四个维度分别进行内部一致性检验(测量克隆巴赫系数),四个维度的克隆巴赫系数均大于0.800,该量表具有较高信度。

    对运动健身类APP使用满足量表也基于动机量表的四个维度分别进行内部一致性检验,四个维度的克隆巴赫系数均大于0.800。

    (信度分析的常用指标是内在一致性,通常用克隆巴赫系数表示。克隆巴赫系数的值在0和1之间。如果克隆巴赫系数不超过0.6,一般认为内部一致信度不足;达到0.7-0.8时表示量表具有相当的信度,达0.8-0.9时说明量表信度非常好。)

    效度检验:对两个量表进行结构效度的检验,分别对量表中各维度/各题项进行相关性检验。

    运动健身类APP用户使用动机量表中,各维度间的相关系数在0.499-0.768,各系数均显著(p<0.01),量表结构效度较好。

    使用动机与使用满足量表中,各维度间的相关系数在0.489-0.854,各系数均显著(p<0.01),使用动机与使用满足量表之间显著相关。

    7c1503b75803a0b8524c35e8f45df830.png

    结果显示,两个量表的信效度良好。

    Tips:信度与效度

    信度是指重复测量,产生相同结果的准确程度,测量结果的稳定性,可靠性,一致性。信度用信度系数来表示信度的大小。信度系数越大,测量的可信程度越大。一份信度系数好的量表最好在0.80以上,0.70~0.80为可接受范围。

    效度是检验设计的题项是否合理,能否测试出研究者想要的内容。一般效度分析分为内容效度、效标效度和结构效度。一般情况下,针对量表数据的效度分析,需使用探索性因子分析进行效度的验证,并配合内容效度进行说明。

    信度与效度二者的关系:

    信度低,效度不可能高。

    信度高,效度未必高。

    三 研究结果

    研究结果主要有四部分内容。

    1.运动健身类APP的使用行为分析(——回答了Q1)

    作者分析了用户使用运动健身类APP的使用时长、各类运动健身类APP的受欢迎程度、运动类APP各功能使用频率等内容。

    2.运动健身类APP用户使用行为与使用动机的关系(——回答了Q3)

    研究者对运动健身类APP使用频率与使用动机进行相关性分析。结果显示,用户使用频率仅与社交互动维度动机呈正相关关系(p<0.01)。

    86ae5c1a9a2395076ddb83ebeb2cfecf.png

    随后,研究者对运动健身类APP用户媒介使用频率与使用动机展开差异性分析。通过单因素方差分析不同使用频率的用户在用户使用动机四个维度上的差异。

    结果显示,不同频率使用群体仅在“运动功能”和“社交互动”两个维度上存在显著差异(p<0.05)。平均每周使用2-4次的用户将“运动功能”视为主要使用动机;平均每天2次或更多的用户将“社交互动”视为主要使用动机。

    3.运动健身类APP用户使用动机与满足之间的差别分析(——回答了Q4)

    研究者用相关分析检验运动健身类APP用户使用动机各维度与其相对应的使用满足各维度间的相关性。结果显示均呈正相关关系。

    b9be5c47240d9cb6e591c8878a4ba934.png

    随后,研究者通过配对样本T检验,对使用动机的各维度与其相应的使用满足各维度间的差异性。结果显示,“自我实现”和“娱乐消遣”两个维度的使用动机与其对应的使用满足存在显著。根据均值(表8中的均值),可以看出,在自我实现维度上,满足比动机显著下降;在娱乐消遣维度上,满足比动机显著上升。

    f55aae2098313e677c2f83ef7e404b53.png

    4.运动健身类APP使用频率作为因变量逐步回归分析(——回答了Q5)

    作者通过逐步回归分析发现,职业身份、社交互动、运动习惯对用户使用频率影响显著,调整后的R方为10.5%,解释力度尚可。在这三个变量中,从非标准化系数可以看到职业身份对因变量的影响最大。

    abae9ef69665b5e842edf45646e663f3.png

    Tips:逐步回归是一种常用的消除多重共线性、选取“最优”回归方程的方法。

    操作方式是逐个引入自变量,引入的条件是该自变量经F检验是显著的,每引入一个自变量后,对已选入的变量进行逐个检验,如果原来引入的变量由于后面变量的引入而变得不再显著,那么就将其剔除。引入一个变量或从回归方程中剔除一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新变量之前回归方程中只包含显著的变量。反复进行,直到没有不显著的自变量选入回归方程。

    四 研究讨论

    作者从用户使用动机、运动社交化趋势、社会认同和在场感、日常生活媒介化四方面来进行探讨与分析。在此,注重分享作者探讨的后两点。

    1.社会认同与在场感

    研究者发现很多受访者通过晒运动步数来证明存在感并获得认同。社交媒介时代,人与人之间的社交关系和交往方式正在重构,越来越多用户选择虚拟社交方式进行自我身份的建构。社会认同理论认为社会认同主要来自于群体成员身份或资格,人们努力追求或保持一种积极的社会认同,以此来增强他们的自尊,而且这种积极的社会认同主要来自于内群体与相关外群体之间进行的有利比较。运动健身类APP帮助用户加入新的群体,用户通过运动对自己的群体产生认同,并产生内群体偏好和外群体偏见。

    2.日常生活的媒介化与媒介依赖症

    随着社交媒介的不断发展,日常生活的媒介化正成为一种常态,并逐渐演变为一种生活方式。有些运动健身类APP重度用户,长时间、多频次刷APP等,具有社交媒介依赖症。虚拟社交行为逐渐削弱用户在现实日常生活中的交往行为,日常生活趋向媒介化。在日常生活媒介化后,用户在现实生活中的存在感削弱,“我在场”的状态帮助用户证明自身存在价值和生存空间。

    最后,希望大家在使用社交APP的时候,也多多关注自身现实生活哟~

    本次的分析仅供学习交流,版权归原作者所有,如有侵权,请联系删除,谢谢~

    7a0dfa81ae66e5adad1a6fbc22a882e7.png

    参考文献:

    [1]王茜.社交化、认同与在场感: 运动健身类App 用户的使用动机与行为研究[J].现代传播,2018(12).

    展开全文
  • 毕业论文答辩者的准备工作有哪些 下文是毕业论文答辩者的准备工作 答辩前的准备,最重要的是答辩者的准备。要保证论文答辩的质量和效果,关键在答辩者一边。论文作者要顺序通过答辩,在提交了论文之后,不要有松一...
  • 毕业论文答辩的程序及回答问题时需要注意的问题有哪些 学员答辩的程序为: 1、脱稿介绍本人论文,包括:选题动机、围绕选题所收集的资料、论文的主要内容。介绍时间不得少于10分钟,最好不要超过15分钟。 2、学员...
  • 【填空题】知识应用 学习过程中我们可能会这样的经历,当我们在宽松的环境下讨论一个... 提示:用叶克斯-多德森定律,双加工模型____及路径依赖等理论进行解释,说明动机对行为的影响。 比如,根据叶克斯-多德森定律...

    【填空题】知识应用 学习过程中我们可能会有这样的经历,当我们在宽松的环境下讨论一个问题时总是能广开思路,从不同的角度对问题进行发散式的思考和阐述;但是当坐在考场上对某个论述题进行作答的时候,思维却很狭隘,不管怎样绞尽脑汁理不清头绪。如何解释动机影响个体行为表现的不对称现象? 提示:用叶克斯-多德森定律,双加工模型____及路径依赖等理论进行解释,说明动机对行为的影响。 比如,根据叶克斯-多德森定律____,动机对工作效率的影响是不对称的,并不是动机越高越好也不是越低越好,而是存在一个最佳动机水平。而且,任务难度也会影响最佳动机水平。提示,生活中调整恰当的动机水平对完成任务非常有必要。

    【单选题】yuanzu1 = ( ' abcd ' , 123 , 4.56 , ' efg ' , 5.86 ) yuanzu2 = ( ' rfgh’ , ' 888 ' ) print ( yuanzu1 + yuanzu2 ) 以上程序运行结果是( )

    【判断题】Python 语言支持逻辑运算符,逻辑运算符有 and 、 or 、 not

    【单选题】The young policeman asked ——— her name was. (1.5分)

    【单选题】This song is very with __young people. (1.5分)

    【判断题】Python 中 if 语句的一般形式中 , 每个条件后面要使用冒号 :

    【简答题】名词解释 1.需要:个体指向外部事物的一种内部状态,旨在获得某种生理上的平衡与心理上的满足。 2.内驱力:内驱力是在需要的基础上产生的一种内部唤醒状态或紧张状态,表现为推动有机体活动以达到满足需要的内部动力。 3.本能:生物体趋向于某一特定行为的内在倾向。其固定的行为模式非学习得来,也不是继承而来。

    【单选题】假设变量 a 为 2 ,变量 b 为 5 , (a > b) 返回结果为( )

    【填空题】柱脚中靴梁的主要作用是 。

    【单选题】David has decided ______football at the end of this season. (1.5分)

    【判断题】yuanzu1 = (123,) 表示一个只有一个元素的元组,逗号可以省略。

    【判断题】Python 中 else : 后面没有条件。

    【判断题】元组中的元素类型也可以不相同。

    【其它】

    【单选题】The family——at a small hotel for the night. (1.5分)

    【单选题】假设变量 a 为 2 ,变量 b 为 5 , (a >= b) 返回结果为( )

    【单选题】"We can't go out in this weather, "said Bob,——out of the window. (1.5分)

    【单选题】假设变量 a 为 2 ,变量 b 为 5 , (a == b) 返回结果为( )

    【单选题】假设变量 a 为 2 ,变量 b 为 5 , (a < b) 返回结果为( )

    【单选题】a = 2 b = 6 list = [ 1 , 2 , 3 , 4 , 5 ] ; if ( a in list ) : print ( " 变量 a 在列表 list 中 " ) else : print (“ 变量 a 不在列表 list 中 ” ) 以上程序运行 结果是( )

    【判断题】b **= a 等效于 b= b ** a

    【判断题】b += a 等效于 b = b + a

    【单选题】轴心受压柱的柱脚底板厚度是按底板( )。

    【单选题】假设变量 a 为 5 ,变量 b 为 2 , a**b 输出结果为( )

    【单选题】指挥信息系统的一体化方向不包括以下哪个方向?()

    【单选题】__________arriving home she found her oldfriend already there. (1.5分)

    【单选题】yuanzu1 = ( ' abcd ' , 123 , 4.56 , ' efg ' , 5.86 ) yuanzu2 = ( ' rfgh’ , ' 888 ' ) print ( yuanzu1 [ 1 ]) 以上程序运行结果是( )

    【单选题】Johnson willphone his mother as soon as he———in Kunming. (1.5分)

    【判断题】Python 还支持成员运算符, in 和 not in 属于成员运算符

    【判断题】b *= a 等效于 a =a* b

    【填空题】在轴心压力一定的前提下 , 轴压柱脚底板的面积是由 决定的。

    【简答题】论述题 1.什么是内部动机与外部动机,并举例说明内部动机与外部诱因是如何相互作用影响我们的行为的。 有两种观点分别认为:(1)外部诱因必须通过个体的主观评价才能成为支配行为的内部动机,也就是说个体自身在动机产生中具有主导地位。如一本好书只有对于热爱知识的人才具有强烈的诱惑。(2)外部强化物在一定程度上直接影响我们的行为倾向,这种过程甚至可能是不被意识到的。如,教师的暗示和鼓励可能在不经意间影响一个学生对某门学科的兴趣。

    【单选题】yuanzu1 = ( ' abcd ' , 123 , 4.56 , ' efg ' , 5.86 ) yuanzu2 = ( ' rfgh’ , ' 888 ' ) print ( yuanzu2 * 2 ) 以上程序运行结果是( )

    【单选题】yuanzu1 = ( ' abcd ' , 123 , 4.56 , ' efg ' , 5.86 ) yuanzu2 = ( ' rfgh’ , ' 888 ' ) print ( yuanzu1 ) 以上程序运行结果是( )

    【单选题】假设变量 a 为 5 ,变量 b 为 11 , b / a 的输出结果为( )

    【单选题】a = 2 b = 6 list = [ 1 , 2 , 3 , 4 , 5 ] ; if ( a in list ) : print ( " 变量 a 在列表 list 中 " ) else : print ( 变量 a 不在列表 list 中 " ) 以上程序中 if ( a in list ) : 返回结果是( )

    【判断题】元组写在小括号 () 里,元素之间用顿号隔开。

    【单选题】We got to the cinema late_______ the heavy traffic. (1.5分)

    【单选题】yuanzu1 = ( ' abcd ' , 123 , 4.56 , ' efg ' , 5.86 ) yuanzu2 = ( ' rfgh’ , ' 888 ' ) print ( yuanzu1 [ 0 : 3 ]) 以上程序运行结果是( )

    【单选题】yuanzu1 = ( ' abcd ' , 123 , 4.56 , ' efg ' , 5.86 ) yuanzu2 = ( ' rfgh’ , ' 888 ' ) print ( yuanzu1 [ 3 : ]) 以上程序运行结果是( )

    【判断题】yuanzu1 = () 表示一个空元组

    【单选题】假设变量 a 为 2 ,变量 b 为 5 , (a <= b) 返回结果为( )

    【单选题】I chose this coat in the end because____ ones were all too expensive. (1.5分)

    【单选题】Clearly,________object of the game is to improve__________children' s math skills. (1.5分)

    【判断题】c //= a 等效于 c = c // a

    【单选题】假设变量 a 为 2 ,变量 b 为 11 , b // a 输出结果为( )

    【填空题】轴压柱的柱脚中锚栓直径应 确定。

    【单选题】假设变量 a 为 5 ,变量 b 为 11 , b % a 输出结果为( )

    【单选题】假设变量 a 为 2 ,变量 b 为 5 , (a != b) 返回结果为( )

    【判断题】使用缩进来划分语句块,相同缩进数的语句在一起组成一个语句块。

    展开全文
  • 机器学习是近几年炙手可热的话题。...为了掌握它们背后的动机理论必要回顾并建立所有基本推理知识体系,包括统计、概率和微积分。 下面先从一些基本的统计概念开始。 1.3.1 统计学——不确定

    机器学习是近几年炙手可热的话题。每天都有新的应用和模型进入人们的视野。世界各地的研究人员每天所公布的实验结果都显示了机器学习领域所取得的巨大进步。

    技术工作者参加各类课程、搜集各种资料,希望使用这些新技术改进他们的应用。但在很多情形下,要理解机器学习需要深厚的数学功底。这就为那些虽然具有良好的算法技能,但数学概念欠佳的程序员们设置了较高的门槛。

    为了掌握它们背后的动机和理论,有必要回顾并建立所有基本推理知识体系,包括统计、概率和微积分。

    下面先从一些基本的统计概念开始。

    1.3.1 统计学——不确定性建模的基本支柱

    统计学可以定义为使用数据样本,提取和支持关于更大样本数据结论的学科。考虑到机器学习是研究数据属性和数据赋值的重要组成部分,本书将使用许多统计概念来定义和证明不同的方法。

    描述性统计学——主要操作

    接下来将从定义统计学的基本操作和措施入手,并将基本概念作为起点。

    (1)平均值(Mean)

    这是统计学中直观、常用的概念。给定一组数字,该集合的平均值是所有元素之和除以集合中元素的数量。

    平均值的公式如下。

    机器学习需要哪些数学基础?

     

    虽然这是一个非常简单的概念,但本书还是提供了一个Python代码示例。在这个示例中,我们将创建样本集,并用线图表示它,将整个集合的平均值标记为线,这条线应该位于样本的加权中心。它既可以作为Python语法的介绍,也可以当作Jupyter Notebook的实验。代码如下。

    import matplotlib.pyplot as plt #Import the plot library
    
    def mean(sampleset):  #Definition header for the mean function
        total=0
        for element in sampleset:
            total=total+element
        return total/len(sampleset)
    
    myset=[2.,10.,3.,6.,4.,6.,10.] #We create the data set
    mymean=mean(myset) #Call the mean funcion
    plt.plot(myset)  #Plot the dataset
    plt.plot([mymean] * 7)  #Plot a line of 7 points located on the mean

    该程序将输出数据集元素的时间序列,然后在平均高度上绘制一条线。

    如图1.6所示,平均值是描述样本集趋势的一种简洁(单值)的方式。

    机器学习需要哪些数学基础?

     

    图1.6 用平均值描述样本集趋势

    因为在第一个例子中,我们使用了一个非常均匀的样本集,所以均值能够有效地反映这些样本值。

    下面再尝试用一个非常分散的样本集(鼓励读者使用这些值)来进行实验,如图1.7所示。

    机器学习需要哪些数学基础?

     

    图1.7 分散样本集的趋势

    (2)方差(Variance)

    正如前面的例子所示,平均值不足以描述非均匀或非常分散的样本数据。

    为了使用一个唯一的值来描述样本值的分散程度,需要介绍方差的概念。它需要将样本集的平均值作为起点,然后对样本值到平均值的距离取平均值。方差越大,样本集越分散。

    方差的规范定义如下。

    机器学习需要哪些数学基础?

     

    下面采用以前使用的库,编写示例代码来说明这个概念。为了清楚起见,这里重复mean函数的声明。代码如下。

    import math #This library is needed for the power operation
    def mean(sampleset):  #Definition header for the mean function
        total=0
        for element in sampleset:
            total=total+element
        return total/len(sampleset)
    
    def variance(sampleset):  #Definition header for the mean function
        total=0
        setmean=mean(sampleset)
        for element in sampleset:
            total=total+(math.pow(element-setmean,2))
        return total/len(sampleset)
    
    myset1=[2.,10.,3.,6.,4.,6.,10.]  #We create the data set
    myset2=[1.,-100.,15.,-100.,21.]
    print "Variance of first set:" + str(variance(myset1))
    print "Variance of second set:" + str(variance(myset2))

    前面的代码将输出以下结果。

    Variance of first set:8.69387755102
    Variance of second set:3070.64

    正如上面的结果所示,当样本值非常分散时,第二组的方差要高得多。因为计算距离平方的均值是一个二次运算,它有助于表示出它们之间的差异。

    (3)标准差(Standard Deviation)

    标准差只是对方差中使用的均方值的平方性质进行正则化的一种手段。它有效地将该项线性化。这个方法可以用于其他更复杂的操作。

    以下是标准差的表示形式。

    机器学习需要哪些数学基础?

     

    1.3.2 概率与随机变量

    概率与随机变量对于理解本书所涉概念极为重要。

    概率(Probability)是一门数学学科,它的主要目标就是研究随机事件。从实际的角度讲,概率试图从可能发生的所有事件中量化事件发生的确定性(或者不确定性)。

    1.事件

    为了理解概率,我们首先对事件进行定义。在给定的实验中,执行确定的动作可能出现不同的结果。事件就是该实验中所有可能结果的子集。

    关于事件的一个例子就是摇骰子时出现的特定数字,或者装配线上出现的某种产品缺陷。

    (1)概率

    按照前面的定义,概率是事件发生的可能性。概率被量化为0~1之间的实数。当事件发生的可能性增加时,概率P也按照接近于1的趋势增加。事件发生概率的数学表达式是P(E)。

    (2)随机变量和分布

    在分配事件概率时,可以尝试覆盖整个样本,并为样本空间中的每个可能分配一个概率值。

    这个过程具有函数的所有特征。对于每一个随机变量,都会为其可能的事件结果进行赋值。这个函数称为随机函数。

    这些变量有以下两种类型。

    • 离散(Discrete):结果的数量是有限的或可数无穷的。
    • 连续(Continuous):结果集属于连续区间。

    这个概率函数也称为概率分布(Probability Distribution)

    2.常用概率分布

    在多种可能的概率分布中,有些函数由于其特殊的性质或它们所代表问题的普遍性而被研究和分析。

    本书将描述那些常见的概率分布。它们对机器学习的发展具有特殊的影响。

    (1)伯努利分布(Bernoulli Distribution)

    从一个简单的分布开始:像抛硬币一样,它具有二分类结果(binary outcome)。

    这个分布表示单个事件。该事件中1(正面)的概率为p,0(反面)的概率为1−p。

    为了实现可视化,可以使用np(NumPy库)生成大量伯努利分布的事件,并绘制该分布的趋势。它有以下两种可能的结果。代码如下。

    plt.figure()
    distro = np.random.binomial(1, .6, 10000)/0.5
    plt.hist(distro, 2 , normed=1)

    下面通过图1.8中的直方图显示二项分布(Binomial Distribution),可以看出结果概率的互补性质。

    机器学习需要哪些数学基础?

     

    图1.8 二项分布

    可能结果的概率互补趋势非常明显。现在用更多的可能结果来补充模型。当结果的数目大于2时,采用多项式分布(Multinomial Distribution)。代码如下。

    plt.figure()
    distro = np.random.binomial(100, .6, 10000)/0.01
    plt.hist(distro, 100 , normed=1)
    plt.show()

    结果如图1.9所示。

    机器学习需要哪些数学基础?

     

    图1.9 100种可能结果的多项式分布

    (2)均匀分布(Uniform Distribution)

    这种非常常见的分布是本书出现的第一个连续分布。顾名思义,对于域的任何区间,它都有一个恒定的概率值。

    a和b是函数的极值,为了使函数积分为1,这个概率值为1/(b−a)。

    下面用一个非常规则的直方图生成样本均匀分布的图。代码如下。

    plt.figure()
    uniform_low=0.25
    uniform_high=0.8
    plt.hist(uniform, 50, normed=1)
    plt.show()

    结果如图1.10所示。

    机器学习需要哪些数学基础?

     

    图1.10 均匀分布

    (3)正态分布(Normal Distribution)

    这是一种常见的连续随机函数,也称作高斯函数(Gaussian Function)。虽然表达式有些复杂,但它只需要用均值和方差来定义。

    这是函数的标准形式。

    机器学习需要哪些数学基础?

     

    查看下面的代码。

    import matplotlib.pyplot as plt #Import the plot library
    import numpy as np
    mu=0.
    sigma=2.
    distro = np.random.normal(mu, sigma, 10000)
    plt.hist(distro, 100, normed=True)
    plt.show()

    图1.11所示为生成的分布直方图。

    机器学习需要哪些数学基础?

     

    图1.11 正态分布

    (4)Logistic分布(Logistic Distribution)

    它类似于正态分布,但在形态上与正态分布存在较大差异,其具有细长的尾部。它的重要性在于积累分布函数(Cumulative Distribution Function,CDF),下面的章节中将会使用到它,读者会觉得它看起来很熟悉。

    下面这段代码表示了它的基本分布。

    import matplotlib.pyplot as plt #Import the plot library
    import numpy as np
    mu=0.5
    sigma=0.5
    distro2 = np.random.logistic(mu, sigma, 10000)
    plt.hist(distro2, 50, normed=True)
    distro = np.random.normal(mu, sigma, 10000)
    plt.hist(distro, 50, normed=True)
    plt.show()

    结果如图1.12所示。

    机器学习需要哪些数学基础?

     

    图1.12 Logistic分布(绿)和正态分布(蓝)[1]

    如前所述,计算Logistic分布的积累分布函数时,读者将看到一个非常熟悉的图形,即Sigmoid曲线。后面在回顾神经网络激活函数时,还将再次看到它。代码如下。

    plt.figure()
    logistic_cumulative = np.random.logistic(mu, sigma, 10000)/0.02
    plt.hist(logistic_cumulative, 50, normed=1, cumulative=True)
    plt.show()

    结果如图1.13所示。

    机器学习需要哪些数学基础?

     

    图1.13 逆Logistic分布

    1.3.3 概率函数的统计度量

    这一节中,将看到概率中常见的统计度量。首先是均值和方差,其定义与前面在统计学中看到的定义没有区别。

    1.偏度(Skewness)

    它表示了一个概率分布的横向偏差,即偏离中心的程度或对称性(非对称性)。一般来说,如果偏度为负,则表示向右偏离;如果为正,则表示向左偏离。

    机器学习需要哪些数学基础?

     

    图1.14描绘了偏度的统计分布。

    机器学习需要哪些数学基础?

     

    图1.14 分布形状对偏度的影响

    2.峰度(Kurtosis)

    峰度显示了分布的中心聚集程度。它定义了中心区域的锐度,也可以反过来理解,就是函数尾部的分布方式。

    峰度的表达式如下。

    机器学习需要哪些数学基础?

     

    由图1.15可以直观地理解这些新的度量。

    机器学习需要哪些数学基础?

     

    图1.15 分布形状对峰度的影响

    1.3.4 微分基础

    为了覆盖机器学习的基础知识,尤其是像梯度下降(Gradient Descent)这样的学习算法,本书将介绍微分学所涉及的概念。

    1.3.5 预备知识

    介绍覆盖梯度下降理论所必需的微积分术语需要很多章节,因此我们假设读者已经理解连续函数的概念,如线性二次对数指数,以及极限的概念。

    为了清楚起见,我们将从一元函数的概念开始,然后简单地涉及多元函数。

    1.变化分析——导数

    在前一节中介绍了函数的概念。除了在整个域中定义的常值函数之外,所有函数的值都是动态的。这意味着在x确定的情况下,f(x1)与f(x2)的值是不同的。

    微分学的目的是衡量变化。对于这个特定的任务,17世纪的许多数学家(莱布尼兹和牛顿是杰出的倡导者)努力寻找一个简单的模型来衡量和预测符号定义的函数如何随时间变化。

    这项研究将引出一个奇妙的概念—— 一个具有象征性的结果,在一定条件下,表示在某个点上函数变化的程度,以及变化的方向。这就是导数的概念。

    在斜线上滑动

    如果想测量函数随时间的变化,首先要取一个函数值,在其后的点上测量函数。第一个值减去第二个值,就得到函数随时间变化的程度。代码如下。

    import matplotlib.pyplot as plt
    import numpy as np
     %matplotlib inline
    def quadratic(var):
        return 2* pow(var,2)
    x=np.arange(0,.5,.1)
    plt.plot(x,quadratic(x))
    plt.plot([1,4], [quadratic(1), quadratic(4)], linewidth=2.0)
    plt.plot([1,4], [quadratic(1), quadratic(1)], linewidth=3.0,
    label="Change in x")
    plt.plot([4,4], [quadratic(1), quadratic(4)], linewidth=3.0,
    label="Change in y")
    plt.legend()
    plt.plot (x, 10*x -8 )
    plt.plot()

    前面的代码示例首先定义了一个二次方程(2×x2),然后定义arange函数的域(0~0.5,步长0.1)。

    定义一个区间,测量y随x的变化,并画出测量的直线,如图1.16所示。

    机器学习需要哪些数学基础?

     

    图1.16 求导操作起始设置的初始描述

    在x=1和x=4处测量函数,并定义这个区间的变化率。

    机器学习需要哪些数学基础?

     

    根据公式,示例程序的运行结果是(36−0)/3=12。

    这个方法可以用来近似测量,但它太依赖于测量的点,并且必须在每个时间间隔都进行测量。

    为了更好地理解函数的动态变化,需要能够定义和测量函数域中每个点的瞬时变化率。因为是测量瞬时变化,所以需要减少域x值之间的距离,使各点之间的距离尽量缩短。我们使用初始值x和后续值x + Δx来表示这个方法。

    机器学习需要哪些数学基础?

     

    下面的代码中,通过逐步减小Δx来逼近差分值。代码如下。

    initial_delta = .1
    x1 = 1
    for power in range (1,6):
        delta = pow (initial_delta, power)
        derivative_aprox= (quadratic(x1+delta) - quadratic (x1) )/
        ((x1+delta) - x1 )
        print "del    ta: " + str(delta) + ", estimated derivative: " +
        str(derivative_aprox)

    在上面的代码中,首先定义了初始增量Δ,从而获得初始近似值。然后在差分函数中,对0.1进行乘方运算,幂逐步增大,Δ的值逐步减小,得到如下结果。

    delta: 0.1, estimated derivative: 4.2
    delta: 0.01, estimated derivative: 4.02
    delta: 0.001, estimated derivative: 4.002
    delta: 0.0001, estimated derivative: 4.0002
    delta: 1e-05, estimated derivative: 4.00002

    随着Δ值的逐步减小,变化率将稳定在4左右。但这个过程什么时候停止呢?事实上,这个过程可以是无限的,至少在数值意义上是这样。

    这就引出了极限的概念。在定义极限的过程中,使 Δ 无限小,得到的结果称之为f(x)的导数或f ' (x),公式如下。

    机器学习需要哪些数学基础?

     

    但是数学家们并没有停止烦琐的计算。他们进行了大量的数值运算(大多是在17世纪手工完成的),并希望进一步简化这些操作。

    现在构造一个函数,它可以通过替换x的值来得到相应的导数。对于不同的函数族,从抛物线(y=x2+b)开始,出现了更复杂的函数(见图1.17),这一巨大的进步发生在17世纪。

    机器学习需要哪些数学基础?

     

    图1.17 复杂函数

    2.链式法则

    在函数导数符号确定后,一个非常重要的结果就是链式法则。莱布尼茨在1676年的一篇论文中首次提到这个公式。它可以通过非常简单优雅的方式求解复合函数的导数,从而简化复杂函数的求解。

    为了定义链式法则,假设有一个函数f,F=f (g(x)),那么导数可以定义如下。

    机器学习需要哪些数学基础?

     

    链式法则允许对输入值为另一个函数的方程求导。这与搜索函数之间关联的变化率是一样的。链式法则是神经网络训练阶段的主要理论概念之一。因为在这些分层结构中,第一层神经元的输出将是下一层的输入。在大多数情况下,复合函数包含了一层以上的嵌套。

    偏导数(Partial Derivative)

    到目前为止,本书一直使用单变量函数。但是从现在开始,将主要介绍多变量函数。因为数据集将不止包含一个列,并且它们中的每一列将代表不同的变量。

    在许多情况下,需要知道函数在一个维度中的变化情况,这将涉及数据集的一列如何对函数的变化产生影响。

    偏导数的计算包括将已知的推导规则应用到多变量函数,并把未被求导的变量作为常数导出。

    看一看下面的幂函数求导法则。

    f(x, y) = 2x3y

    当这个函数对x求导时,y作为常量。可以将它重写为3 ∙ 2 y x2,并将导数应用到变量x,得到以下结果。

    d/dx(f(x, y)) = 6y * x2

    使用这些方法,可以处理更复杂的多变量函数。这些函数将是特征集的一部分,通常由两个以上的变量组成。

    本文摘自:《机器学习开发者指南》

    机器学习需要哪些数学基础?

     

    本书的目标读者是那些期望掌握机器学习的相关内容、理解主要的基本概念、使用算法思想并能掌握正式数学定义的开发人员。本书使用Python实现了代码概念,Python语言接口的简洁性,以及其提供的方便且丰富的工具,将有助于我们处理这些代码,而有其他编程语言经验的程序员也能理解书中的代码。

    读者将学会使用不同类型的算法来解决自己的机器学习相关问题,并了解如何使用这些算法优化模型以得到最佳的结果。如果想要了解现在的机器学习知识和一门友好的编程语言,并且真正走进机器学习的世界,那么这本书一定能对读者有所帮助。

    本书主要关注机器学习的相关概念,并使用Python语言(版本3)作为编码工具。本书通过Python 3和Jupyter Notebook来构建工作环境,可以通过编辑和运行它们来更好地理解这些概念。我们专注于如何以最佳方式,利用各种Python库来构建实际的应用程序。本着这种精神,我们尽力使所有代码保持友好性和可读性,使读者能够轻松地理解代码并在不同的场景中使用它们。

    展开全文
  • 要理解机器学习需要深厚的...但是,为了掌握它们背后的动机理论必要回顾并建立所有基本推理知识体系,包括统计、概率和微积分。下面先从一些基本的统计概念开始。1.3.1 统计学——不确定性建模的基本支柱统...

    要理解机器学习需要深厚的数学功底。这就为那些虽然具有良好的算法技能,但数学概念欠佳的程序员们设置了较高的门槛。那么基础数学需要学什么呢?来看下文:

    基本数学概念

    正如前文所述,本书主要的目标读者是希望理解机器学习算法的开发人员。但是,为了掌握它们背后的动机和理论,有必要回顾并建立所有基本推理知识体系,包括统计、概率和微积分。

    下面先从一些基本的统计概念开始。

    1.3.1 统计学——不确定性建模的基本支柱

    统计学可以定义为使用数据样本,提取和支持关于更大样本数据结论的学科。考虑到机器学习是研究数据属性和数据赋值的重要组成部分,本书将使用许多统计概念来定义和证明不同的方法。

    描述性统计学——主要操作

    接下来将从定义统计学的基本操作和措施入手,并将基本概念作为起点。

    (1)平均值(Mean)

    这是统计学中直观、常用的概念。给定一组数字,该集合的平均值是所有元素之和除以集合中元素的数量。

    平均值的公式如下。

    虽然这是一个非常简单的概念,但本书还是提供了一个Python代码示例。在这个示例中,我们将创建样本集,并用线图表示它,将整个集合的平均值标记为线,这条线应该位于样本的加权中心。它既可以作为Python语法的介绍,也可以当作Jupyter Notebook的实验。代码如下。

    import matplotlib.pyplot as plt #Import the plot library

    def mean(sampleset): #Definition header for the mean function

    total=0

    for element in sampleset:

    total=total+element

    return total/len(sampleset)

    myset=[2.,10.,3.,6.,4.,6.,10.] #We create the data set

    mymean=mean(myset) #Call the mean funcion

    plt.plot(myset) #Plot the dataset

    plt.plot([mymean] * 7) #Plot a line of 7 points located on the mean

    该程序将输出数据集元素的时间序列,然后在平均高度上绘制一条线。

    如图1.6所示,平均值是描述样本集趋势的一种简洁(单值)的方式。

    图1.6 用平均值描述样本集趋势

    因为在第一个例子中,我们使用了一个非常均匀的样本集,所以均值能够有效地反映这些样本值。

    下面再尝试用一个非常分散的样本集(鼓励读者使用这些值)来进行实验,如图1.7所示。

    图1.7 分散样本集的趋势

    (2)方差(Variance)

    正如前面的例子所示,平均值不足以描述非均匀或非常分散的样本数据。

    为了使用一个唯一的值来描述样本值的分散程度,需要介绍方差的概念。它需要将样本集的平均值作为起点,然后对样本值到平均值的距离取平均值。方差越大,样本集越分散。

    方差的规范定义如下。

    下面采用以前使用的库,编写示例代码来说明这个概念。为了清楚起见,这里重复mean函数的声明。代码如下。

    import math #This library is needed for the power operation

    def mean(sampleset): #Definition header for the mean function

    total=0

    for element in sampleset:

    total=total+element

    return total/len(sampleset)

    def variance(sampleset): #Definition header for the mean function

    total=0

    setmean=mean(sampleset)

    for element in sampleset:

    total=total+(math.pow(element-setmean,2))

    return total/len(sampleset)

    myset1=[2.,10.,3.,6.,4.,6.,10.] #We create the data set

    myset2=[1.,-100.,15.,-100.,21.]

    print "Variance of first set:" + str(variance(myset1))

    print "Variance of second set:" + str(variance(myset2))

    前面的代码将输出以下结果。

    Variance of first set:8.69387755102

    Variance of second set:3070.64

    正如上面的结果所示,当样本值非常分散时,第二组的方差要高得多。因为计算距离平方的均值是一个二次运算,它有助于表示出它们之间的差异。

    (3)标准差(Standard Deviation)

    标准差只是对方差中使用的均方值的平方性质进行正则化的一种手段。它有效地将该项线性化。这个方法可以用于其他更复杂的操作。

    以下是标准差的表示形式。

    1.3.2 概率与随机变量

    概率与随机变量对于理解本书所涉概念极为重要。

    概率(Probability)是一门数学学科,它的主要目标就是研究随机事件。从实际的角度讲,概率试图从可能发生的所有事件中量化事件发生的确定性(或者不确定性)。

    1.事件

    为了理解概率,我们首先对事件进行定义。在给定的实验中,执行确定的动作可能出现不同的结果。事件就是该实验中所有可能结果的子集。

    关于事件的一个例子就是摇骰子时出现的特定数字,或者装配线上出现的某种产品缺陷。

    (1)概率

    按照前面的定义,概率是事件发生的可能性。概率被量化为0~1之间的实数。当事件发生的可能性增加时,概率P也按照接近于1的趋势增加。事件发生概率的数学表达式是P(E)。

    (2)随机变量和分布

    在分配事件概率时,可以尝试覆盖整个样本,并为样本空间中的每个可能分配一个概率值。

    这个过程具有函数的所有特征。对于每一个随机变量,都会为其可能的事件结果进行赋值。这个函数称为随机函数。

    这些变量有以下两种类型。离散(Discrete):结果的数量是有限的或可数无穷的。

    连续(Continuous):结果集属于连续区间。

    这个概率函数也称为概率分布(Probability Distribution)。

    2.常用概率分布

    在多种可能的概率分布中,有些函数由于其特殊的性质或它们所代表问题的普遍性而被研究和分析。

    本书将描述那些常见的概率分布。它们对机器学习的发展具有特殊的影响。

    (1)伯努利分布(Bernoulli Distribution)

    从一个简单的分布开始:像抛硬币一样,它具有二分类结果(binary outcome)。

    这个分布表示单个事件。该事件中1(正面)的概率为p,0(反面)的概率为1−p。

    为了实现可视化,可以使用np(NumPy库)生成大量伯努利分布的事件,并绘制该分布的趋势。它有以下两种可能的结果。代码如下。

    plt.figure()

    distro = np.random.binomial(1, .6, 10000)/0.5

    plt.hist(distro, 2 , normed=1)

    下面通过图1.8中的直方图显示二项分布(Binomial Distribution),可以看出结果概率的互补性质。

    图1.8 二项分布

    可能结果的概率互补趋势非常明显。现在用更多的可能结果来补充模型。当结果的数目大于2时,采用多项式分布(Multinomial Distribution)。代码如下。

    plt.figure()

    distro = np.random.binomial(100, .6, 10000)/0.01

    plt.hist(distro, 100 , normed=1)

    plt.show()

    结果如图1.9所示。

    图1.9 100种可能结果的多项式分布

    (2)均匀分布(Uniform Distribution)

    这种非常常见的分布是本书出现的第一个连续分布。顾名思义,对于域的任何区间,它都有一个恒定的概率值。

    a和b是函数的极值,为了使函数积分为1,这个概率值为1/(b−a)。

    下面用一个非常规则的直方图生成样本均匀分布的图。代码如下。

    plt.figure()

    uniform_low=0.25

    uniform_high=0.8

    plt.hist(uniform, 50, normed=1)

    plt.show()

    结果如图1.10所示。

    图1.10 均匀分布

    (3)正态分布(Normal Distribution)

    这是一种常见的连续随机函数,也称作高斯函数(Gaussian Function)。虽然表达式有些复杂,但它只需要用均值和方差来定义。

    这是函数的标准形式。

    查看下面的代码。

    import matplotlib.pyplot as plt #Import the plot library

    import numpy as np

    mu=0.

    sigma=2.

    distro = np.random.normal(mu, sigma, 10000)

    plt.hist(distro, 100, normed=True)

    plt.show()

    图1.11所示为生成的分布直方图。

    图1.11 正态分布

    (4)Logistic分布(Logistic Distribution)

    它类似于正态分布,但在形态上与正态分布存在较大差异,其具有细长的尾部。它的重要性在于积累分布函数(Cumulative Distribution Function,CDF),下面的章节中将会使用到它,读者会觉得它看起来很熟悉。

    下面这段代码表示了它的基本分布。

    import matplotlib.pyplot as plt #Import the plot library

    import numpy as np

    mu=0.5

    sigma=0.5

    distro2 = np.random.logistic(mu, sigma, 10000)

    plt.hist(distro2, 50, normed=True)

    distro = np.random.normal(mu, sigma, 10000)

    plt.hist(distro, 50, normed=True)

    plt.show()

    结果如图1.12所示。

    图1.12 Logistic分布(绿)和正态分布(蓝)[1]

    如前所述,计算Logistic分布的积累分布函数时,读者将看到一个非常熟悉的图形,即Sigmoid曲线。后面在回顾神经网络激活函数时,还将再次看到它。代码如下。

    plt.figure()

    logistic_cumulative = np.random.logistic(mu, sigma, 10000)/0.02

    plt.hist(logistic_cumulative, 50, normed=1, cumulative=True)

    plt.show()

    结果如图1.13所示。

    图1.13 逆Logistic分布

    1.3.3 概率函数的统计度量

    这一节中,将看到概率中常见的统计度量。首先是均值和方差,其定义与前面在统计学中看到的定义没有区别。

    1.偏度(Skewness)

    它表示了一个概率分布的横向偏差,即偏离中心的程度或对称性(非对称性)。一般来说,如果偏度为负,则表示向右偏离;如果为正,则表示向左偏离。

    图1.14描绘了偏度的统计分布。

    图1.14 分布形状对偏度的影响

    2.峰度(Kurtosis)

    峰度显示了分布的中心聚集程度。它定义了中心区域的锐度,也可以反过来理解,就是函数尾部的分布方式。

    峰度的表达式如下。

    由图1.15可以直观地理解这些新的度量。

    图1.15 分布形状对峰度的影响

    1.3.4 微分基础

    为了覆盖机器学习的基础知识,尤其是像梯度下降(Gradient Descent)这样的学习算法,本书将介绍微分学所涉及的概念。

    1.3.5 预备知识

    介绍覆盖梯度下降理论所必需的微积分术语需要很多章节,因此我们假设读者已经理解连续函数的概念,如线性、二次、对数和指数,以及极限的概念。

    为了清楚起见,我们将从一元函数的概念开始,然后简单地涉及多元函数。

    1.变化分析——导数

    在前一节中介绍了函数的概念。除了在整个域中定义的常值函数之外,所有函数的值都是动态的。这意味着在x确定的情况下,f(x1)与f(x2)的值是不同的。

    微分学的目的是衡量变化。对于这个特定的任务,17世纪的许多数学家(莱布尼兹和牛顿是杰出的倡导者)努力寻找一个简单的模型来衡量和预测符号定义的函数如何随时间变化。

    这项研究将引出一个奇妙的概念—— 一个具有象征性的结果,在一定条件下,表示在某个点上函数变化的程度,以及变化的方向。这就是导数的概念。

    在斜线上滑动

    如果想测量函数随时间的变化,首先要取一个函数值,在其后的点上测量函数。第一个值减去第二个值,就得到函数随时间变化的程度。代码如下。

    import matplotlib.pyplot as plt

    import numpy as np

    %matplotlib inline

    def quadratic(var):

    return 2* pow(var,2)

    x=np.arange(0,.5,.1)

    plt.plot(x,quadratic(x))

    plt.plot([1,4], [quadratic(1), quadratic(4)], linewidth=2.0)

    plt.plot([1,4], [quadratic(1), quadratic(1)], linewidth=3.0,

    label="Change in x")

    plt.plot([4,4], [quadratic(1), quadratic(4)], linewidth=3.0,

    label="Change in y")

    plt.legend()

    plt.plot (x, 10*x -8 )

    plt.plot()

    前面的代码示例首先定义了一个二次方程(2×x2),然后定义arange函数的域(0~0.5,步长0.1)。

    定义一个区间,测量y随x的变化,并画出测量的直线,如图1.16所示。

    图1.16 求导操作起始设置的初始描述

    在x=1和x=4处测量函数,并定义这个区间的变化率。

    根据公式,示例程序的运行结果是(36−0)/3=12。

    这个方法可以用来近似测量,但它太依赖于测量的点,并且必须在每个时间间隔都进行测量。

    为了更好地理解函数的动态变化,需要能够定义和测量函数域中每个点的瞬时变化率。因为是测量瞬时变化,所以需要减少域x值之间的距离,使各点之间的距离尽量缩短。我们使用初始值x和后续值x + Δx来表示这个方法。

    下面的代码中,通过逐步减小Δx来逼近差分值。代码如下。

    initial_delta = .1

    x1 = 1

    for power in range (1,6):

    delta = pow (initial_delta, power)

    derivative_aprox= (quadratic(x1+delta) - quadratic (x1) )/

    ((x1+delta) - x1 )

    print "del ta: " + str(delta) + ", estimated derivative: " +

    str(derivative_aprox)

    在上面的代码中,首先定义了初始增量Δ,从而获得初始近似值。然后在差分函数中,对0.1进行乘方运算,幂逐步增大,Δ的值逐步减小,得到如下结果。

    delta: 0.1, estimated derivative: 4.2

    delta: 0.01, estimated derivative: 4.02

    delta: 0.001, estimated derivative: 4.002

    delta: 0.0001, estimated derivative: 4.0002

    delta: 1e-05, estimated derivative: 4.00002

    随着Δ值的逐步减小,变化率将稳定在4左右。但这个过程什么时候停止呢?事实上,这个过程可以是无限的,至少在数值意义上是这样。

    这就引出了极限的概念。在定义极限的过程中,使 Δ 无限小,得到的结果称之为f(x)的导数或f ' (x),公式如下。

    但是数学家们并没有停止烦琐的计算。他们进行了大量的数值运算(大多是在17世纪手工完成的),并希望进一步简化这些操作。

    现在构造一个函数,它可以通过替换x的值来得到相应的导数。对于不同的函数族,从抛物线(y=x2+b)开始,出现了更复杂的函数(见图1.17),这一巨大的进步发生在17世纪。

    图1.17 复杂函数

    2.链式法则

    在函数导数符号确定后,一个非常重要的结果就是链式法则。莱布尼茨在1676年的一篇论文中首次提到这个公式。它可以通过非常简单优雅的方式求解复合函数的导数,从而简化复杂函数的求解。

    为了定义链式法则,假设有一个函数f,F=f (g(x)),那么导数可以定义如下。

    链式法则允许对输入值为另一个函数的方程求导。这与搜索函数之间关联的变化率是一样的。链式法则是神经网络训练阶段的主要理论概念之一。因为在这些分层结构中,第一层神经元的输出将是下一层的输入。在大多数情况下,复合函数包含了一层以上的嵌套。

    偏导数(Partial Derivative)

    到目前为止,本书一直使用单变量函数。但是从现在开始,将主要介绍多变量函数。因为数据集将不止包含一个列,并且它们中的每一列将代表不同的变量。

    在许多情况下,需要知道函数在一个维度中的变化情况,这将涉及数据集的一列如何对函数的变化产生影响。

    偏导数的计算包括将已知的推导规则应用到多变量函数,并把未被求导的变量作为常数导出。

    看一看下面的幂函数求导法则。

    f(x, y) = 2x3y

    当这个函数对x求导时,y作为常量。可以将它重写为3 ∙ 2 y x2,并将导数应用到变量x,得到以下结果。

    d/dx(f(x, y)) = 6y * x2

    使用这些方法,可以处理更复杂的多变量函数。这些函数将是特征集的一部分,通常由两个以上的变量组成。

    本书的目标读者是那些期望掌握机器学习的相关内容、理解主要的基本概念、使用算法思想并能掌握正式数学定义的开发人员。本书使用Python实现了代码概念,Python语言接口的简洁性,以及其提供的方便且丰富的工具,将有助于我们处理这些代码,而有其他编程语言经验的程序员也能理解书中的代码。

    读者将学会使用不同类型的算法来解决自己的机器学习相关问题,并了解如何使用这些算法优化模型以得到最佳的结果。如果想要了解现在的机器学习知识和一门友好的编程语言,并且真正走进机器学习的世界,那么这本书一定能对读者有所帮助。

    展开全文
  • 理论基础:将理论理解作为确定追求哪些性能或者忽略哪些性能的基础。 以应用为动机 各种语言的动机: 语言 动机 Lisp 符号计算 C Unix操作系统 Simula 仿真 PL/1 试图解决所有编程问题:并不成功...
  • 论文答辩稿的准备.doc

    2021-01-15 15:42:46
    如自己所研究的这个论题学术界的研究已经达到了什么程度目前,存在着哪些争议有几种代表性观点各有哪些代表性著作和*自己倾向哪种观点及理由;重要引文的出处和版本;论证材料的****渠道等等。 论文还有哪些应该涉及...
  • 了解开题报告的基本组成部分 *是开题报告的基本组成部分 1、毕业论文题目 论文题目用中英文撰写,汉语在前,英语在后。...国内外有哪些论文、论著涉及到本选题的内容? 4、研究本选题的动机及意义 提出...
  • 大学毕业论文开题报告格式 1、毕业论文题目 论文题目用中英文撰写,汉语在前,英语在后。...国内外有哪些论文、论著涉及到本选题的内容? 4、研究本选题的动机及意义 提出本选题的根据是什么?为什么提出这个...
  •  首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。 其次,要熟悉自己所写论文的全文,尤其是要熟悉主?....
  • 那么,答辩者在答辩之前应该从哪些方面去准备呢 首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。...
  • 视频编码的研究动机,是压缩数字视频中的冗余,这是本书的论述重 点。提到视频编码,人们很容提出如下问题: 1、为什么数字视频是可以压缩的,数字视频中的冗余是如何产生的? 2、视频编码对视频数据压缩的理论...
  • 怎样准备论文答辩.doc

    2021-01-15 18:22:13
     首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。 其次,要熟悉自己所写论文的全文,尤其是要熟悉主体...
  •  首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。 其次,要熟悉自己所写论文的全文,尤其是要熟悉主体...
  •  首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。 其次,要熟悉自己所写论文的全文,尤其是要熟悉主体...
  • 简述梅奥人际关系学说的主要内容 梅奥在人际关系学说中,表明了哪些主要内容?下面是小编搜集整理的一些梅奥人际关系学说的主要内容,希望对你帮助。梅奥人际关系学说的主要内容:工人是“社会人”而不是“经济人”...
  • 那么,答辩者在答辩之前应该从哪些方面去准备呢 首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。...
  •  首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。 其次,要熟悉自己所写论文的全文,尤其是要熟悉主体...
  •  首先,要写好毕业论文的简介,主要内容应包括论文的题目,指导教师姓名,选择该题目的动机,论文的主要论点、论据和写作体会以及本议题的理论意义和实践意义。 其次,要熟悉自己所写论文的全文,尤其是要熟悉主体...
  • 3、一流研究机构有哪些? 机构名 Logo 官网 简介 DeepMind Access DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。 ...
  • 神经网络提取特征的方式有哪些 介绍下你了解的轻量级CNN模型 网络模型压缩方面的剪枝,量化和二值化编码 基于视频的C3D三维网络模型有听说过嘛 2.5D卷积呢 什么是空洞卷积,什么是反卷积,作用是什么 如何...
  • 不仅微观理论与宏观理论彼此关联,而且列举的每门应用课程皆其微观方面与宏观方面。此外,这程本身也多多少少有所重叠:如计量经济学所提供的一套通用性分析方法,可应用于其他门课程。同样,在能够制订出重要规范...
  • 3.6 局部敏感函数理论 3.6.1 局部敏感函数 3.6.2 面向Jaccard距离的局部敏感函数族 3.6.3 局部敏感函数族的放大处理 3.6.4 习题 3.7 面向其他距离测度的LSH函数族 3.7.1 面向海明距离的LSH函数族 3.7.2 随机...
  • 3.6 局部敏感函数理论 3.6.1 局部敏感函数 3.6.2 面向Jaccard距离的局部敏感函数族 3.6.3 局部敏感函数族的放大处理 3.6.4 习题 3.7 面向其他距离测度的LSH函数族 3.7.1 面向海明距离的LSH函数族 3.7.2 随机...

空空如也

空空如也

1 2
收藏数 25
精华内容 10
关键字:

动机理论有哪些