精华内容
下载资源
问答
  • 算法笔记整理3 - 模型 & 常用术语

    千次阅读 2019-01-12 11:08:17
    1. 模型标准定义: 输入模型的数据,我们称为训练数据。通过不断的进行训练,最终得到一个合适的模型,从而可以对未知的数据进行预测。而这个过程,是与我们人类学习的过程是相似的。只不过人的认知与判断是通过...

    tips:

    • attribute is features
    • every data is every sample
    • value for the features is feature value
    • space( sample & feature) is sample space or feature space

    一、模型

    1. 标准定义

    输入模型的数据,我们称为训练数据。通过不断的进行训练,最终得到一个合适的模型,从而可以对未知的数据进行预测。而这个过程,是与我们人类学习的过程是相似的。只不过人的认知与判断是通过经验得到的,而机器的认知与判断是通过数据得到的。

    我们可以将模型理解为一个函数(一种映射规则)。由训练数据来确定函数的参数,当参数确定好之后,我们就可以利用该模型(函数)对未知的数据(非训练时使用的数据)进行求值,也就是进行预测。

    2. 深入解释,模型是什么?

    模型可以认为是一个黑盒子给它输入,它有输出
    将训练数据传进机器中,然后执行任务,对未知数据进行预测。

    机器“吃”训练数据,然后建立一个模型。
    eg. 模型执行预测性别的任务,把未知的数据送到模型之中,身高,体重,血型送到模型里面,模型就可以输出一个结果,就会输出性别是什么。

    在这里插入图片描述

    再举个例子:
    eg. 榨汁机也是模型,给苹果,榨苹果汁;给西瓜,榨西瓜汁。

    从机器学习的角度,模型实现的就是一种映射,可以体现为数据上的送进来5,就可以产生16。
    在这里插入图片描述

    机器学习所学习的,就是这个函数,通过函数得到我们的输出。

    3. 历史数据,供我们学习的话,一定要有最终的结果**

    就像做模拟题一定要知道什么是对的,错的。
    一定要对应的性别是设么,就是结果。

    所以,我们的历史数据必须要有结果。
    光给属性没有用,机器也不知道对错。

    这个结果是什么?就是输出。所以这里的输入和输出都是训练数据。
    就像模拟题和答案,就像输入的男和女,输出就是性别。

    一起送到机器学习中,机器学习就会基于我们这个历史的数据,然后进行预测。机器就是通过历史的数据,建立模型。靠的就是已知的历史的数据。

    黑盒子就是映射的法则,就是函数。
    我们现在通过历史的输入输出,建立函数,也就是建立了映射法则。

    模型如何预测?

    通过历史数据建立函数,建立映射法则,然后输出y,实现了预测。

    eg. 模拟题吃之后,建立了思路,解决问题的手段(映射法则),而我们把未知的题放入机器学习之中,就能得到结果。

    所以机器学习最核心的就是 y=f(x),只要这里面确定下来,就能解决。
    在这里插入图片描述

    二、机器学习的常用术语:

    1. 数据集

        - 训练集Training Set
      		 把历史数据送入机器学习中,这个历史数据就是训练数据。
        - 测试集Test Set
        - 交叉验证集Cross-Validation Set, CV Set
    

    2. 样本

        用于训练模型的每条数据,我们称为一个**样本**
    

    3. 属性或特征

        对于每个样本,具有一些“属性”(**Attribute**)或者说“特征”(**Features**),特征所具体取的值就被称为“特征值”(**Feature Value**)。
        特征和样本所组成的空间被称为“特征空间”(**Feature Space**)和“样本空间”(**Sample Space**),可以把它们简单地理解为特征和样本“可能存在的空间”。
        样本中的每个属性,我们称为**特征**
    

    4. 标签或类别(目标值)

        ‘“标签空间”(Label Space)
        每个样本的**目标输出值**,我们称为**标签**(监督学习)
    

    机器学习的常用术语:样本 & 特征 & 标签(目标值)

    其中,用于训练模型的每条数据,我们称为一个样本,而样本中的每个属性,我们称为特征。每个样本的目标输出值,我们称为标签(监督学习)。特征习惯使用x表示,标签习惯使用y表示。这与函数的定义y=f(x)y = f(x)相符。

    进一步解释,这个历史数据不可能只有一条,可能有很多条,每一条训练数据就是样本。样本也就是这一个人的数据,这一个事物的数据。样本里面,有性别,姓名,年龄身高,这样一个属性,一个列,就是特征。

    训练数据
    把历史数据送入机器学习中,这个历史数据就是训练数据。

    每一个样本有一个答案,就是目标值,就是标签;对应的就是最终的y值,数学上 y=f(x)y=f(x)

    用来输入的就是x输出的就是y。所以,习惯上,x就是输入,y就是输出。

    这个x是一个向量,是一个矢量,不是一个标量
    不是 x1 x2 x3

    假设当前具有如下已知的样本数据(含有标签):

    在这里插入图片描述

    我们不难找出x与y之间的关系,因此,很容易确定模型:
    y=x+1y=x+1

    这样,当产生新的未知数据时(没有标签的数据),我们就可以使用该模型进行预测了。

    现在通过训练数据,来建立模型:
    Y=f(x)Y=f(x)
    Y=x+1Y=x+1
    这样就可以对未知的数据进行预测,7, 8, 9 都可以传到模型中:
    在这里插入图片描述

    总之
    真实的场景不会这么简单,需要靠机器学习的算法来建立模型。
    现实中的数据不可能像上例中那么简单,模型也不可能总是通过肉眼就能观察出来的,这就需要我们通过机器学习算法来进行建模了。

    展开全文
  • 关系模型的基本术语

    千次阅读 2015-11-15 23:56:40
    关系模型的基本术语关系:整个二维表 关系名:表格名称 元组:行数据(记录) 属性:列数据(字段,分量) 属性名:列名称(字段名) 主键:唯一确定元组的属性组(关键字) 域:属性的取值范围 关系模式:...

    关系模型的基本术语

    关系:整个二维表
    关系名:表格名称
    元组:行数据(记录)
    属性:列数据(字段/分量)
    属性名:列名称(字段名)
    主键:唯一确定元组的属性组(关键字)
    域:属性的取值范围
    关系模式:关系的描述,表示为:关系名(属性列表)
    例如:学生(学号,姓名,性别,年龄,系别)
    关系的约束:域完整性约束,实体完整性约束,参照完整性约束

    展开全文
  • 浅谈关系数据库、关系模型及相关术语 关系数据库是目前各类数据库中最重要、最流行的数据库,它应用数学方法来处理数据库数据,关系数据库系统是支持关系模型的数据库系统。关系模型由关系数据结构、关系操作集合和...

    浅谈关系数据库、关系模型及相关术语

      关系数据库是目前各类数据库中最重要、最流行的数据库,它应用数学方法来处理数据库数据,关系数据库系统是支持关系模型的数据库系统。关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。关系模型的数据结构非常单一,现实世界的各种联系均用关系来表示,关系操作采用集合操作方式,并提供了丰富的完整性控制机制。

    一、关系模型

    理解关系模式的先行概念:

    (1)二维表:在日常生活中人们都非常熟悉像花名册、工资表、成绩单等表格,这些实际上就是二维表。

    (2)实体:客观存在并可相互区别的事物称为实体,简单说就是具体的人、事、物,当然也可以是抽象的概念或者关系,例如,一个学生,一个老师,学生的一次选课等等。

    (3)实体集:实体集是在实体的基础上定义的,同一类型实体的集合称为实体集。例如,全体学生,全体老师等都是一个实体集。

    现在在来解释关系模型:

    关系模型的主要特征是用二维表结构表示实体集。关系模型比较简单,容易被接受。关系模型是由若干个关系模式组成的集合。关系模式相当于记录类型,它的实例称为关系,每个关系实际上就是一张二维表格,即用二维表结构表示实体,用来表示实体的关系。二维表格也可用于表示实体之间的联系。

    、关系模型的相关术语:

    (1)关系:一个关系就是一个二维表,每个关系有一个关系名。SQL Server中,一个关系可以存储为一个表,并为其定义一个独立的表名。一般的,一个数据库可能包含若干个表。

    (2)元组:在二维表中,水平方向的一行称为一个元组,对应表中的一条记录。例如(2016145002 陈好 男 20 软件工程 计算机学院)这就是一个元组。

    (3)属性:二维表中垂直方向的列称为属性,每个属性有一个属性名,也就是实体的属性。

    (4)域:属性的取值范围称为域。

    (5)关键字:关键字是二维表中某一个属性或者某几个属性的组合,它的值可以唯一地标识一个元组。关键字又称为键,主关键字又称为主键。

    (6)外部关键字:如果表中的一个关键字不是本表的主关键字,而是另外一个表的主关键字或者候选关键字,则这个关键字(属性)就称为外部关键字。

    (7)分量:分量是元组中的一个属性值。







    展开全文
  • 关系模型的相关术语

    千次阅读 2019-03-22 22:38:55
    基本术语 关系:整个二维表 关系名:表格名称 元组:行数据(记录) 属性:列数据(字段/分量) 属性名:列名称(字段名) 主键:唯一确定元组的属性组(关键字) 域:属性的取值范围 关系模式:关系的描述,表示...

    基本术语

    • 关系:整个二维表
    • 关系名:表格名称
    • 元组:行数据(记录)
    • 属性:列数据(字段/分量)
    • 属性名:列名称(字段名)
    • 主键:唯一确定元组的属性组(关键字)
    • 域:属性的取值范围
    • 关系模式:关系的描述,表示为:关系名(属性列表)

      • 例如:学生(学号,姓名,性别,年龄,系别
    • 关系的约束:域完整性约束,
    • 实体完整性约束,参照完整性约束

    一、关系依赖

    • 函数依赖:X—>Y,即X函数决定Y,或Y函数依赖于X。

      • 例:学号—>姓名      #学号决定姓名
    • 平凡函数依赖:X—>Y,但X包含Y (Y包含于X)。

      • 例:(学号,课号)—>课号  #课号存在于 (学号,课号) 之中。
    • 非平凡函数依赖: X—>Y,但X不包含Y。

      • 例:(学号,课号)—>成绩  #成绩不存在于 (学号,课号) 之中。
    • 完全函数依赖:X—>Y,对于X的任意一个真子集X'都有X'不能函数决定Y。

      • 例:(学号,课号)—>成绩  #只有学号或姓名无法决定成绩,二者缺一不可。
    • 部分函数依赖:X—>Y,存在X的某一个真子集X'能够函数决定Y。

      • 例:(学号,课号)—>姓名  #只有学号就能决定姓名,课号为冗余项。
    • 传递函数依赖:X—>Y,X不包含Y,Y不函数决定X,Y—>Z,即Z对X传递函数依赖。

      • 例:学号—>系号,(系号不函数决定学号) ,系号—>系主任,则系主任传递函数依赖于学号。
    • 多值依赖:X—>—>Y,设R(U)是属性集U上的一个关系模式。X,Y,Z是U的子集,并且Z=U-X-Y,关系模式R(U)中多值依赖X—>—>Y成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值有一组Y的值,这组值仅仅决定于x值而与z值无关。

      • 例:关系模式R(仓库,管理员,物品)

        • 一个仓库有若干个管理员
        • 一个仓库可以存放多个物品
        • 一个管理员管理一个仓库中的所有物品
        • 一种物品只能放在一个仓库里
      • 则:仓库—>—>物品,仓库—>—>管理员
      • 表中,R = 仓库+管理员+物品,(仓库,管理员)确定一组物品,但是物品其实与管理员无关,仅由仓库确定,所以:仓库—>—>物品。又因为(R-仓库-物品)不是空集,所以 仓库—>—>物品为非平凡多值依赖。
      • 表中,R = 仓库+管理员+物品,(仓库,物品)确定一组管理员,但是管理员其实与物品无关,仅由仓库确定,所以:仓库—>—>管理员。又因为(R-仓库管理员)不是空集,所以 仓库—>—>管理员为非平凡多值依赖。
    • 平凡的多值依赖:若X—>—>Y, 并且X,Y,Z是U的子集,Z=U-X-Y,而Z为空集,则称X—>—>Y为平凡的多值依赖;
    • 非平凡的多值依赖:若X—>—>Y, 并且X,Y,Z是U的子集,Z=U-X-Y,若Z不为空,则称X—>—>Y为非平凡的多值依赖。
    • 连接依赖:为提高规范化程度,都是通过把低一级的关系模式分解为若干个高一级的关系模式来实现的,在此过程中,应该保证分解后产生的关系模式与原来的模式等价。常用的等价标准有两种:要求分解具有无损连接性和要求分解保持函数依赖。
    • 无损连接性的判别:将关系模式R<U,F>分解为关系模式R1<U1,F1>,R2<U2,F2>。如果(U1 ∩ U2 —>U1)∈F+(F的闭包,即F所蕴含的函数依赖的全体),或(U1 ∩ U2 —>U2)∈F+ ,即U1 ∩ U2 是R1的候选码或是R2的候选码,则这个分解一定是具有无损连接性的。

    二、关系模式的规范化

    • 满足第一范式条件的关系模式(1NF):关系模式 R的每一个属性都是原子域,元组的每一个分量都是不可分割的数据项。
    • 满足第二范式条件的关系模式(2NF):关系模式 R∈1NF ,每一个非主属性完全函数依赖于码,消除非主属性对码的部分函数依赖。
    • 满足第三范式条件的关系模式(3NF):关系模式 R∈2NF ,每一个非主属性不传递依赖于码,消除非主属性对码的传递函数依赖(对非主属性的函数依赖)。
    • 满足Boyce-Code范式条件的关系模式(BCNF):关系模式 R∈3NF ,对于每一个非平凡函数依赖X—>Y,都有X包含码,消除主属性对于码的部分函数依赖与传递函数依赖。(在函数依赖的范畴内,BCNF达到了最高的规范化程度)
    • 满足第四范式条件的关系模式(4NF):关系模式 R∈BCNF ,对于每一个非平凡的多值依赖X—>—>Y(Y⊄X),都有X包含码。(限制关系模式的属性之间不允许有非平凡且非函数依赖的多值依赖)
    • 满足第五范式条件的关系模式(5NF):关系模式 R∈4NF,消除属于4NF的关系模式中存在的连接依赖。
    • 规范程度层次:5NF⊂4NF⊂BCNF⊂3NF⊂2NF⊂1NF

    三、“好的”关系数据库系统应具有的特点

    • 适度减少数据冗余。
    • 关系明确,表与表之间主外键设置明确,表名称明确。

      • 对关系模式的属性间允许的数据依赖加以限制,减少表中非主属性间存在的函数依赖,避免更新异常问题。
      • 非主属性完全函数依赖于码,不允许有非主属性对码的部分函数依赖。
      • 非主属性不传递依赖于码。
    • 选择合理的数据库引擎,查询操作较多的与增删改操作较多的数据库分别使用不同的引擎。
    展开全文
  • 关系模型中的术语

    千次阅读 2015-12-28 17:11:13
    我们常说的关系型数据库指的是满足关系模型的数据库。 下表是在SQL中使用的名称和关系型模型中使用的名称的对应关系。 SQL Relational database database Description Row Tuple Data set with specific ...
  • 层次数据模型     定义:层次数据模型是用树状<层次>结构来组织数据的数据模型。     满足下面两个条件的基本层次联系的集合为层次模型     1. 有且只有一个结点没有双亲结点,这个结点称为根结点...
  • MySQL笔记——关系模型中的术语

    千次阅读 2017-07-13 14:31:43
    (1)关系(Relation):对应通常所说的一张表。 (2)元组(Tuple):表中的一行即为一个元组,可以用来标识实体集中的一个实体,表中任意两行(元组)不能相同。 (3)属性(Attribute):表中的一列即为一个属性...
  • 数据库领域中主要的逻辑数据模型有:层次模型、网状模型、关系模型、面向对象数据模型等,我们重点讲解了**层次模型、网状模型、关系模型**。 1.1 层次模型 层次数据库系统的典型代表是IBM公司的Information ...
  • 相机常用术语解释

    千次阅读 2017-05-25 13:53:46
    相机常用术语解释
  • 关系模型

    千次阅读 2016-12-23 10:06:00
    关系模型 用二维表来表示实体以及相互联系。 优点 ①建立在严格的数学概念基础上。 ②简单,表的概念直观,用户易理解。 ③概念单一,实体和实体之间的联系都用关系表示。 ④存取路径对用户透明,具有更高的...
  • SQL——关系模型

    千次阅读 2017-04-24 16:08:23
    这四种模型中,最为常用和流行的就是关系模型,SQL语言所支持的数据库产品就基于关系模型关系模型利用表的集合来表示数据和数据之间的关系。 关系数据库的结构 关系数据库由表(table)的集合构成,每张表有...
  • 算法常用术语中英对照

    万次阅读 2018-11-19 23:12:06
    算法常用术语中英对照 Data Structures 基本数据结构 Dictionaries 字典 Priority Queues 堆 Graph Data Structures 图 Set Data Structures 集合 Kd-Trees 线段树 Numerical Problems 数值问题 Solving Linear ...
  • 概念模型与关系模型和关系规范化

    万次阅读 2017-05-20 16:18:34
    》概念模型  概念模型用于信息世界的建模,是实现现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言,因此概念模型一方面具有较强的语义...
  • 计算机编程 常用术语英语词汇大全 记忆

    万次阅读 多人点赞 2017-04-14 15:13:21
    第一部分、计算机算法常用术语中英对照 Data Structures 基本数据结构 Dictionaries 字典 Priority Queues 堆 Graph Data Structures 图 Set Data Structures 集合 Kd-Trees 线段树 ...
  • Hyperledger Composer 常用术语

    千次阅读 2017-08-30 09:39:51
    ###Business Network Model-业务网络模型 业务网络模型描述业务网络中的资产,参与者和交易。该模型实际上是整个业务网络的静态对象结构。 ###Connection Profile-连接配置文件 连接配置文件是一个.json文件,它是...
  • 关系模型和关系运算

    千次阅读 2015-11-09 22:52:54
    一、关系模型 为什么学习关系模型? 我们可以通过关系模型这种简单的数据结构能够描述出现实世界的实体及实体间的各种联系。 什么是关系模型关系模型的基本假定是所有数据都表示为数学上的关系,就是以集合...
  • 数据库的常用术语

    千次阅读 2019-10-07 16:24:28
    数据模型:(Data model) 数据模型是数据库结构的基础,是用来描述数据的一组概念和定义,数据模型主要有三个要素:数据结构,数据操作,数据约束条件。 数据结构(表里面的字段): 对象类型的集合,是对静态属性...
  • 数据模型的概念2.两大类数据模型客观对象的抽象过程---两步抽象3.数据模型的组成要素(1)数据结构(2)数据操作(3)数据的完整性约束条件4.概念模型(1)用途与基本要求(2) 信息世界中的基本概念(3)两个实体型之间的联系①...
  • 机器学习常用术语

    千次阅读 2018-06-27 19:30:47
    机器学习术语表 本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (A/B testing) 一种统计方法,用于将两种或多种技术进行比较,通常是将当前采用的技术与新技术进行比较。A/B ...
  • ArcGIS开发常用术语

    千次阅读 2009-08-25 12:00:00
    ArcGIS开发常用术语抽象类(abstract class):对子类的一种规定,在对象模型图中可以经常看到,是对象模型图中三种类型的“类”之一。抽象类在类库中没有定义,也不能实例化。插件(add-in):一种可以执行自定义...
  • 程序员常用术语及工具

    千次阅读 2019-10-30 15:45:15
    1、常用术语如下: SDK:SDK(SoftwareDevelopment Kit,即软件开发工具包) 一般是一些被软件工程师用于为特定的软件包、软件框架、硬件平台、操作系统等 建立应用软件的开发工具的集合。 中间件:中间件是一种...
  • 周末无事水文章,期末备考的总结资料 ...在关系模型术语中,关系(relation)用来指代表,而元组(triple)用来指代行,属性(attribute)指代的是表中的列 2.2 数据库模式 数据库模式(sche...
  • NLP常用术语解析

    千次阅读 2016-09-25 15:08:22
    本文阐述了自然语言处理/NLP的相关术语及其简单的应用场景。包括:词性标注、分词、命名实体识别、句法分析、指代消解等问题结合例子做了解释。
  • 数据库基础:关系模型

    千次阅读 2017-09-25 23:46:39
    目前,数据库领域中最常用的数据模型有: ...一、关系模型的数据结构关系模型与以往的模型不同,它是建立在严格的数学概念的基础上。没给个关系的数据结构是一张规范的二维表。现在以学生登记表为
  • 推荐系统常用术语 [ACM暑校]

    万次阅读 多人点赞 2019-04-21 17:02:24
    它的主要原理是根据用户过去的行为(比如购买、评分、点击等)来建立用户兴趣模型,之后利用一定的推荐算法,把用户最可能感兴趣的内容推荐给用户,如下图: 召回(recall) 从海量(数千万)item中粗选出几百...
  • 关系数据库模型设计

    千次阅读 2020-05-19 17:13:17
    本文从现实世界-概念世界(信息世界)-机器世界(数据世界)逐级抽象,旨在以浅显易懂的语言描述关系数据库应该如何建模,最后用简单名了的描述给出关系模型的设计范式的含义。
  • 软件编程常用术语

    千次阅读 2007-04-28 19:08:00
    软件编程常用术语

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 76,061
精华内容 30,424
关键字:

关系模型常用的术语