精华内容
下载资源
问答
  • 参数空间与假设空间

    千次阅读 2019-02-18 09:15:39
    假设空间:是指所有可能的模型组成的一个空间,一般无穷多个 参数空间:模型一般有参数决定,所有参数可能的取值组合 因此,我们在从假设空间中找出来一个最佳的模型实际上就是从参数空间中找出来最佳的一个参数 ...

    假设空间:是指所有可能的模型组成的一个空间,一般无穷多个
    参数空间:模型一般有参数决定,所有参数可能的取值组合
    因此,我们在从假设空间中找出来一个最佳的模型实际上就是从参数空间中找出来最佳的一个参数
    PS:版本空间:与已知数据集一致的所有假设的子集集合

    在这里插入图片描述
    绿色加号代表正类样本,红色小圈代表负类样本,GB与SB之间所围成的区域就是版本空间

    展开全文
  • 样本空间与假设空间

    2019-07-24 16:00:50
    20个属性每个属性有10个可能取值,样本空间是10的20次方 我怎么感觉10的20次方是假设空间? 节选自《西瓜书》

    20个属性每个属性有10个可能取值,样本空间是10的20次方
    我怎么感觉10的20次方是假设空间?
    在这里插入图片描述
    节选自《西瓜书》

    展开全文
  • 输入空间、输出空间、特征空间与假设空间是监督学习中的基本概念,我把它们放到一起方便记忆。 输入空间(input space):输入所有可能取值的集合 输出空间(output space):输出所有可能取值的集合 输入与输出空间...

    输入空间、输出空间、特征空间与假设空间是监督学习中的基本概念,我把它们放到一起方便记忆。


    • 输入空间(input space):输入所有可能取值的集合
    • 输出空间(output space):输出所有可能取值的集合
      输入与输出空间可以是有限元素的集合,也可以是整个欧式空间(定义了內积的实线性空间),它们可以是同一个空间,也可以是不同的空间,通常,输出空间远远小于输入空间。
    • 特征空间(feature space):所有特征向量存在的空间。每个具体的输入是一个实例,通常由特征向量表示。
      例如:输入实例x的特征向量记作 x=(x(1),x(2),,x(i),,x(n))Tx=(x^{(1)},x^{(2)},…,x^{(i)},…,x^{(n)})^T
      其中,x(i)表示x的第i个特征向量,通常用xi表示多个输入变量中的第i个,多个这样的特征向量组成的空间就叫特征空间。
    • 假设空间(hypothesis space):输入空间到输出空间映射的集合。这一映射由模型来表示,换句话说,这是学习模型的集合
    展开全文
  • 机器学习#假设空间与版本空间

    千次阅读 2017-11-24 15:06:30
    读周志华的机器学习,卡在假设空间和版本空间这一块了,写一下自己的理解: 假设空间:所有属性的可能性(可能取值)组合形成的假设(假设*,*,*为好瓜),组成假设空间,以西瓜问题假设为例。色泽属性可取(青绿,...

    读周志华的机器学习,卡在假设空间和版本空间这一块了,写一下自己的理解:

    假设空间:所有属性的可能性(可能取值)组合形成的假设(假设*,*,*为好瓜),组成假设空间,以西瓜问题假设为例。色泽属性可取(青绿,乌黑,浅白,*),根蒂属性可取(蜷缩,稍蜷,硬挺,*),敲声属性可取(浊响,清脆,沉闷,*),以及好瓜假设不存在。即西瓜问题的假设空间大小为(4*4*4+1=65)

    有了假设空间之后,要根据已获取的信息(数据集)来对假设空间进行剪枝。即要找到一个与训练集匹配的假设空间子集。

    版本空间:书中定义为:与训练集匹配的假设空间子集称为版本空间。


    前文提到的匹配有必要着重解释下:我们的假设空间写出来为,色泽青绿,根蒂蜷缩,敲声浊响的瓜是好瓜把上文列举的64种可能性组合(不包含空集)去替换红色字迹部分蓝色字迹部分不变,总共写成64+1行,这是假设空间的真面目!!!然而,这些都是假设,接下来要做的是根据训练集去筛选这些假设。筛选规则书中有说:删除与正例不一致的假设和与反例一致的假设(即删除那些错误的假设)。这个过程就是假设空间与训练集匹配。最终得到的假设组成版本空间。


    下面继续说:删除与正例不一致的假设和与反例一致的假设这一过程。(当初以为把数据集中所有的正实例写出来,把反实例剔除就行了,too young too naive!!)

                                                           

    以西瓜问题的数据集,表1.1为例。色泽青绿,根蒂蜷缩,敲声浊响的瓜是好瓜,这句话没问题。但是,若它作为一种假设,则需要被剔除,因为若它成立,则色泽非青绿,根蒂非蜷缩,敲声非浊响的瓜都为坏瓜,这就与编号2的实例矛盾了。(没考虑到假设的排他性,我理解为话不能说的太满大笑当然也有例外的情况)。再比如说,色泽=*,根蒂=*,敲声=浊响的瓜是好瓜,如果我们做出这种假设,对于表中的4种训练样本,在这种假设下都能做出正确的判断。对于色泽是乌黑,根蒂蜷缩,敲声浊响的瓜,根据这种假设,我们也能做出是好瓜的判断。同理色泽=*,根蒂=青绿,敲声=*的瓜是好瓜这条假设也匹配,这样,就能得出与表1.1训练集相匹配的版本空间。

    版本空间的求取看到这就可以结束了,真正在做的时候可能需要把所有的假设全部列出来,再进行匹配(虽然可能会很复杂,但求版本空间的题目意义在于让大家理解下文的概念,所以就算有类似的题,要与之匹配的数据集也不会太大,可以把所有假设列出来再进行匹配)

    我觉得版本空间的概念是为了让大家理解接下来的意思:上面求出来了西瓜问题的版本空间,但可以看到版本空间不是很确定,包含有*的假设可能会得到正确的判断,也可能得到错误的判断(这句话是针对实际问题,如果针对表1.1的训练集,那当然不会有错误的判断)。因此,要想判断的正确,就要全面、大量的训练,以排除更多假设空间中的错误假设。错误假设越少,剩下的假设越少,就越有可能是正确假设,我们判断的结果的正确概率越大。因为最终的假设会随着版本(数据集)变化而变化,所以叫做版本空间。

    也就是说,训练样本的这些假设只是版本空间的一个子集。这就是所谓的“泛化”。泛化的意思也就是,根据某些偏好,我们选择了版本空间里的一种假设作为判断好

    瓜坏瓜的决策准则,我能对训练集中的样本做出正确的判断,对于训练集中没有训练到的样本,我们也可以做出判断,但是判断结果可能是错误的。

    文章参考:http://blog.csdn.net/qq_20936739/article/details/77982056


    展开全文
  • 在机器学习中,有两个知识点比较重要,分别是假设空间(hypothesis space)和版本空间(version space)。 本文借用周志华《机器学习》一书中的实例向大家介绍这两个概念。 文章目录数据集介绍假设空间版本空间 数据...
  • 《机器学习》中的假设空间和版本空间

    万次阅读 多人点赞 2018-03-26 18:15:40
    初看周志华老师的《机器学习》,搞清楚假设空间和版本空间的概念还是非常必要的。假设空间:监督学习(supervised learning)的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出 一 个好的预测...
  • 假设空间:所有属性的可能取值所组成的集合, 比如西瓜:色泽属性可取(青绿,乌黑,浅白,*),根蒂属性可取(蜷缩,稍蜷,硬挺,*),敲声属性可取(浊响,清脆,沉闷,*),以及好瓜假设不存在。即西瓜问题的...
  • 西瓜书填坑【一】假设空间与版本空间

    千次阅读 多人点赞 2019-02-13 16:39:54
    ①写出假设空间:先列出所有可能的样本点(即特征向量)(即每个属性都取到所有的属性值) ②对应着给出的已知数据集,将与正样本不一致的、与负样本一致的假设删除。 即可得出与训练集一致的假设集合,也就是版本...
  • 假设空间的一个简单计算

    千次阅读 2017-12-19 21:05:16
    假设空间上一篇提到过,先做一个简单的介绍吧。 我们可以把学习过程看作一个假设(hypothesis)所组成的空间中进行搜索的过程,搜索目标是找到于训练集“匹配”(fit)的假设,假设一旦表示确定,假设空间以及...
  • 从根本上理解 假设空间:数据(包括未知数据)所有可能性的集合 版本空间:符合训练集(原数据集)的集合
  • 这儿主要归纳一下,样本空间、假设空间、版本空间的定义,三者的联系与区别。 西瓜数据集编号色泽根蒂敲声好瓜1青绿蜷缩浊响是2乌黑蜷缩浊响是3青绿硬挺清脆否4乌黑稍蜷沉闷否一:样本空间 上表中给出了四种实际...
  • 周志华西瓜书笔记 1.3 假设空间

    千次阅读 2020-02-05 21:14:07
    1.2 假设空间   归纳(induction)是从特殊到一般的 “泛化”(generalization)过程, 即从具体的事实归结出一般性规律; 演绎(deduction)是从一般到特殊的 “特化”(specialization)过程, 即从基础原理推演出具体状况....
  • 【笔记】西瓜书第一章 假设空间和版本空间

    千次阅读 多人点赞 2017-09-14 16:29:21
    一开始看到这一节的时候被搞晕了,要搞清楚这个问题,必须要理解假设空间和版本空间的意义。 对于一个瓜是不是好瓜,要有一个判定条件,这个判定条件就是一个假设。比如说,我们的假设是:色泽青绿 、根蒂蜷缩 、敲...
  • 假设空间 版本空间&查全率 查准率

    千次阅读 2017-05-07 22:03:16
    一、假设空间 版本空间根据P4表1.1和P5图1.1得, 假设空间为: 1 色泽=*, 根蒂=*, 敲声=*2 色泽=青绿, 根蒂=*, 敲声=*3 色泽=乌黑, 根蒂=*, 敲声=*4 色泽=*, 根蒂=蜷缩,敲声=*5 色泽...
  • 一,假设空间 学习过程是一个在所有假设组成的空间,即假设空间中进行搜索的过程。搜索目标是找到与训练集“匹配”的假设。 举个例子: 这里要学习的目标是“好瓜”。暂且假设“好瓜”可由色泽,根蒂,敲声这三...
  • 可以是有限个元素的集合,也可以是整个欧式空间(欧几里得发明的一个特别的度量空间)。 二、输出空间 同理,这肯定是与输入空间相对应的。就是输出所有可能取值的集合。同样也是:可以是有限个元素的集合,也可以...
  • 特征空间有时候与输入空间相同,有时候不同(例如word embbeding),不同的情况是输入空间通过某种映射生成了特征空间。 联合概率分布: 两个以上随机变量所组成的随机向量的概率分布称作是联合概率分布。 根据对象...
  • ) ,假设每个属性有三个值,比如色泽(青绿、乌黑、浅白),那么有四种可能(青绿、乌黑、浅白+任何色泽都不影响),则一共有444+1=65中可能性,即假设空间。+1是指根本不存在好瓜的概念。 其实就是概率的交集计算理念...
  • 一:输入空间/特征空间/属性空间 这三个概念都是指的X,都是指的输入量 二:标记空间/输出空间 指的是Y,指的是输出量。(有时候,X-Y的所有映射也被当作Y,概念上有点混乱) 一:样本空间 样本空间的标准定义是...
  • 而我们的假设空间则包含所有可能性。 这里我们可以从两个角度得到最终结果65。 一、分别考虑 现在我们一共有3个特征,如果我们只需要从3个特征中选取一个特征中作为最终的结果(这意味着剩余两个特征无关紧要),...
  • 假设空间是指所有可能的能满足样本输入和输出的假设函数h(x)的集合。注意,假设函数一定是一个无穷大的集合。也就是说,如果样本是一串有穷的离散点(xi,yi),i属于1到N,那么能够拟合这这些点的无穷多个函数都是...
  • 一、假设空间   归纳(induction)与演绎(deduction)是科学推理的两个大基本手段。前者是从特殊到一半的泛化(generalization)过程,即从具体的事实归结出一半性规律;后者则是从一般到特殊的“特化”...
  • 例子,给出西瓜数据集,根据某个西瓜三个属性的描述,判断瓜的好坏 编号 色泽 根蒂 敲声 好瓜 1 青绿 蜷缩 浊响 ...样本空间 ...以样本的属性为坐标轴张成的多维空间,也叫属性空间、输...
  • 西瓜书《机器学习》阅读笔记1——Chapter1_假设空间

    千次阅读 多人点赞 2017-08-29 20:03:21
    假设西瓜有三个属性:色泽、根蒂、敲声。其中色泽有青绿、乌黑、浅白三种可能取值,根蒂有硬挺、稍蜷、蜷缩三种可能取值,敲声有清脆、浊响、沉闷三种可能取值。并且为每种属性考虑通配情况,即取任一属性值都行,...
  • https://blog.csdn.net/anqijiayou/article/details/79697900
  • 机器学习笔记(二)假设空间

    千次阅读 2017-05-08 11:21:31
    这里的三种属性可以分别区不同的值,加上假设没有好瓜这种空集,假设空间的规模大小为4*4*4+1=65.在对这个假设空间进行搜索时,不断删除与正例不一致或与反例一致的假设,最终将会获得与训练集一致的假设,即对所有...
  • 目录 归纳和演绎  归纳学习分为广义和狭义: ... 概念学习、概念形成最基本的是布尔...假设空间就是基于数据集形成的所有情况的假设集合,对每种情况根据数据集分析得到概率情况,以便后期对未知情况进行判断
  • 本文介绍版本空间,假设空间的概念并举例求解。另外介绍和简单证明“没有免费的午餐定理”,是说针对某一域的所有问题,所有算法的期望性能是相同的。即该域的有些问题上算法 A 比 B 好,则其余问题则有 B 比 A 好。...
  • 新版白话空间统计(10):空间统计中的零假设

    千次阅读 多人点赞 2020-04-23 18:03:07
    上一节挖了个大坑——PZ值,不同软件里面,计算方法和表达方法是有所不同的,因为我们主要讲空间统计,所以我在这里会扣着ArcGIS来讲。在讲PZ之前,我们还是先再来看看一个统计学里面的基础...
  • 白话空间统计十三:零假设(补记)

    千次阅读 多人点赞 2015-08-24 14:21:45
    我的设想是对空间统计进行科普型的描述,结果写到后面,特别是这几章(准确说是从填中位数中心的算法坑开始),幸好有吴道长果断提醒,说我偏离方向了,我才豁然省悟。再次友情感谢吴道长(PS:吴道长是GIS圈子里面古...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 679,660
精华内容 271,864
关键字:

假设空间