精华内容
下载资源
问答
  • 数据库系统基础教程 (美)Jeffrey D. Ullman Jennifer Widom 著 岳丽华 龚育昌等译 机械工业出版社(2003年8月第1版) (原著:A FIRST COURSE IN DATABASE SYSTEMS SECOND EDITION) 数据是能够输入计算机并能...

    数据是能够输入计算机并能被计算机程序识别和处理的信息集合。 

    数据库是在数据库管理系统管理和控制之下,存放在存储介质上的数据集合

    数据库管理系统(DataBase Management    System)------DBMS

    DBMS是数据库系统中对数据进行统一管理和控制的软件系统。

    DBMS的功能:

    • 数据库定义功能
    • 数据库操纵功能
    • 数据库运行控制功能
    • 数据通信功能
    • 支持存取海量数据 

    数据可管理经理两个阶段:人工管理阶段,文件管理阶段

    两者的对比主要是从冗余性、完整性、独立性方面考虑。

      事务:一个事务是访问并可能更新数据库数据的一组数据库操作。具有原子性 ,即要么全做,要么全不做。

      事务管理器的任务维护日志(logging) 、并发控制(加锁Locking等技术)、故障恢复

     数据库的模式结构:

         内模式也称存贮模式或物理层。它描述数据的实际存贮方式。

         模式也称逻辑模式或逻辑层。它描述数据库所有数据及其联系。全局逻辑层

         外模式也称子模式、用户模式或视图层。局部逻辑层

    二级映像

        外模式/模式影像: 定义了各个外模式与模式之间的对应关系。   数据的逻辑独立性(局部逻辑结构独立于全局逻辑结构)

        模式/内模式影像: 定义了数据逻辑结构与存贮结构之间的对应关系。     数据的物理独立性(逻辑结构独立于物理结构)

    在某一层次上修改该层模式定义而不影响位于上一层模式的能力叫做数据独立性。

    计算模型

    C/S模型,B/S模型,多数据源结构

    熟练掌握:数据库、数据库管理系统和数据库系统的概念;数据库系统三层模式结构;数据(逻辑、物理)独立性概念。           

    根据  数据库系统基础教程    (美)Jeffrey  D. Ullman  Jennifer Widom  著      岳丽华  龚育昌等译        机械工业出版社(2003年8月第1版)(原著:A  FIRST  COURSE  IN  DATABASE   SYSTEMS    SECOND  EDITION)总结

    展开全文
  • 数据库系统原理 一、引言 1.数据模型:数据模型是数据库的基础。规定的模式统一描述方式的模型 2.数据:事实或客观的结果,对客观事务的逻辑归纳,以元组的形式存储于数据库中的信息 3.数据库:一系列互相关联的...

    数据库系统原理

    一、引言
    1.数据模型:数据模型是数据库的基础。规定的模式统一描述方式的模型
    2.数据:事实或客观的结果,对客观事务的逻辑归纳,以元组的形式存储于数据库中的信息
    3.数据库:一系列互相关联的数据的集合
    4.数据库系统:由一个互相关联的数据的集合和一组用以访问这些数据的程序组成
    5.视图:某一表现形式下表现出来的数据库中的数据,不一定真实存储于计算机中,但是通过查询可见的视图,提供了部分安全机制
    6.信息:通讯系统传输和处理的对象,用以消除不确定性的东西
    7.数据库管理系统(DBMS):操纵和管理数据库的大型软件,用于建立使用和维护数据库
    8.数据和信息的关系:数据和信息是相互联系的。数据是信息的具体表现形式,信息是数据的具体意义
    9.数据库应用系统:数据库系统,应用系统,用户
    10.视图的特性:视图的数据并不属于视图本身;视图不能被修改,表修改或删除后应该重建视图;视图可以被嵌套
    11.为什么使用视图:简化数据操作;着重于特定数据;视图提供了简单有效的安全机制,指定不同用户的访问权限;允许不同用户以不同的方式查询
    12.物化视图:若定义视图的实际关系表发生改变,则视图也跟着改变。保持物化视图的过程叫做物化视图的维护
    13.DBA的作用:模式定义,通过DDL建立最初的数据库模式;存储结构和存储方式的定义;模式及物理组织的修改;数据访问授权;日常维护,备份、磁盘空间管理、运行监视
    14.具有相同权限的用户叫做角色
    15.至今,由于研究数据库而获得图灵奖的科学家有四位,关系模型的提出者E.F.Codd是其中一位

    二、关系模型介绍
    1.主键的类型:自动增长型,手动增长型,unique identifier型,组合类型
    2.选择主键的标准:能够唯一表示一个记录的那些值极少或者从不改变的属性
    3.属性的可能取值成为域,要求域中的元素不可再分
    4.空值是一种特殊的值,表示值未知或者不存在,给数据库访问和更新带来很多困难
    5.关系中行列无关性:不考未知区分数据
    6.候选码:关系中的一组属性,能够唯一标识一个元组,若从该属性组中去掉任何一个属性,它就不能唯一标识一个元组,这样的属性组称为候选码
    7.主码:从候选码中选择出来,DBMS以主码为线索管理关系中的各个元组
    8.一致性约束:域约束;参照完整性;断言;授权
    9.DDL以一些语句输入,其输出存入数据字典中
    10.数据字典包含元数据(数据的数据)只由数据库系统本身方位和修改

    三、SQL语言
    1.授权grant:授权读取数据,插入数据,更新数据,删除数据:grant <权限列表> on <关系名或视图名> to <用户/角色>(此语句后加上with grant option表示被授权用户可以将权限授予其他用户)
    2.创建者自动授权关系的所有权限
    3.revoke是收回权限:revoke <权限列表> on <关系或视图名> from <用户/角色>
    4.存储过程的优点:增加SQL语句的功能和灵活性,可以使没有权限的用户在控制下间接的存取数据库以保证安全,可以使相关动作一起发生保证数据库的完整性
    5.游标:能从包括多条数据记录的结果集中每次提取一条记录的机制,充当指针的作用
    6.游标的作用:保存查询结果,以便以后使用
    7.游标的缺点:游标使用时会对行加锁,可能影响其他业务的正常运行,另外数据量大时其效率较低
    8.过程与函数的区别:函数必须有返回值,而过程没有;函数可以单独执行,而过程必须通过execute关键字执行;函数可以改嵌入到sql语句中执行,而过程不行

    四、形式化关系查询语言
    1.自然连接一定是等值连接,等值连接不一定是自然连接,等值连接要求相等的分量不一定是公共属性,而自然连接要求相等的分量必须是公共属性,等值连接不把重复属性删除,而自然连接则把公共属性去重复
    2.使用基本关系代数运算表示RnS—>R-(R-S)
    3.书写关系代数的思路:首先检索是否涉及多个表,如不涉及,可直接采用交、并、差、选择与投影。如果涉及多个表,则检查是否能使用自然连接将多个表连接起来,连接起来以后,可继续使用选择投影运算,这就是所谓的“选投联”操作

    五、数据库设计与E-R模型
    1.实体的完整性:要求实体对应的关系必须有主键,而作为主键的属性必须唯一且非空
    2.弱实体集:没有足够属性形成主码的实体集
    3.弱实体集的主码:由标识实体集的主码加上该弱实体集的分辨符构成
    4.关联弱实体集与标识性强实体集的联系以双菱形表示
    5.实体:现实世界中可区别于其他所有对象的一个事物或对象
    6.关系:表示数据与数据之间的联系,在关系模型的术语中,关系用来指代表
    7.E-R模型描述数据库的概念模式,反映现实世界
    8.E-R模型增强开发人员与客户之间的沟通能力,在需求开发阶段非常重要,是企业的业务运营方式到概念模式的映射

    六、关系数据库设计
    1.数据库设计过程:需求说明(规格文档),概念设计(描述数据),逻辑设计(将概念模式要用的数据库系统实现在数据模型上)物理设计(文件组织形式和存储)
    2.如果函数依赖的强制实施在计算上很困难,则这种设计不是保持依赖
    3.由于希望保持依赖,考虑比BCNF弱的一种范式——第三范式(允许保持依赖)
    4.具有函数依赖集下的关系模式R属于BCNF范式的条件是F+中的所有形如a–>b的函数依赖要么a–>b是平凡依赖,要么a是b的一个超码
    5.BCNF满足条件:(1.左侧包含右侧)(2.左侧是超码)[满足一个条件即可]
    6.3NF满足条件:(1.左侧包含右侧)(2.左侧是超码)(3.右侧是候选码的子集)[满足一个条件即可]
    7.求候选码的过程:首先将左部属性(左),右部属性(右),双部属性(双),没出现属性(无)一一写出来,左部属性和没出现属性一定在候选码中(先看左+无是否为候选码),若不是则从双部属性中选取可以组成候选码的属性
    8.3NF分解:(1.求候选码)(2.进行Fc正则覆盖)(3.将正则覆盖的结果加上任意一个候选码组成3NF分解的结果)
    9.无损连接:将R分解为R1与R2,如果R1 n R2是R1或R2的超码,则将R分解为R1与R2就是无损分解
    10.保持依赖的验证:写出分解得到的所有依赖,如果这些依赖能够退出所有依赖,则是保持依赖,否则不是

    七、事务管理
    1.严格的两阶段锁:事务提交之前不可释放排他锁
    2.强两阶段锁:事务提交之前不可释放任何锁
    3.引入事务是构成单一逻辑工作单元的操作的集合,保证数据库一致性和正确性
    4.事务的宏观性:一条或多条SQL语句的一次执行被看作一次事务
    5.事务的微观性:对数据库的一系列操作的一个整体性执行
    6.事务从宏观上看是并发执行的,但从微观上看基本读写操作则是可以交叉执行的
    7.封锁粒度:封锁数据对象的大小,当前DBMS在元组上进行封锁
    8.多粒度的锁:方便事务灵活的队不同数据库内容加锁控制,提高数据库能力
    9.排他锁:只有一个事务可以读其他事务不可以读
    10.共享锁:所有事务都可以读,但是任何事务都不能写
    11.更新锁:初始为读,之后可以升级为写
    12.事务ACID属性:原子性,要么全部成功提交要么全部失败回滚;一致性,数据库执行一个事务之后,从一个一致性状态到另一个一致性状态,不会产生不一致;隔离性:多个并发事务之间相互隔离;持久性:一个提交事务,则对数据库的改变是永久的
    13.事务开始和结束标志:任何一条DML语句都可以开启一个事务;事务提交COMMIT或ROLLBACK回滚来标识事务结束
    14.B/S(浏览器服务器模式):浏览器极少处理事务逻辑,事务主要在服务器端实现
    15.C/S(客户机服务器模式):客户机可以处理一些运算和业务逻辑
    16.两阶段封锁协议:增长阶段,事务可以获得锁,不能释放锁;缩减阶段,事务可以释放锁,不能获得锁
    17.当死锁发生时,系统必须回滚死锁事务中的某一个,一旦事务回滚,该事务锁住的数据项就被解锁,其他事务可以访问继续执行,从而解决死锁
    18.优先图用于冲突可串行化的判断,优先图无环则是冲突可串行化。(只有读读操作不产生冲突,其余都产生冲突)
    19.事务一定处于一下状态之一:(1.活动的:初始状态)(2.部分提交的:最后一条语句被执行后)(3.失败的:发现正常的执行不能继续)(4.终止的:事务回滚并且回复到事务开始执行之前的状态)(5.提交的:成功完成)
    20.不可重复读:两次查询结果不一致(由update造成)
    21.脏读:在一个事务中读取到另一个事务没有提交的数据
    22.幻读:两次查询不一致(由insert造成)
    23.死锁检测协议:等待图中有环则会发生死锁

    PS:平时很熟悉的概念没有在这里列出来,这里列出的是一些比较重要有点难度的概念和解题方法

    展开全文
  • 数据:符号记录下来的可以识别的信息,数据是信息的符号表示或载体,而信息则是数据...数据库系统(DBS):指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统、应用系统、数据库管理员和用户构成。
  • 数据库的简单概念以及SQL语句大致总结,适用于计算机行业的各类人群。
  • 数据库知识点总结(一)数据库系统原理一、事务1.概念2.ACID二、并发一致性问题1. 丢失修改2. 读脏数据3. 幻读4. 不可重复读三、封锁1. 封锁粒度2. 封锁类型3. 封锁协议4. MySQL隐式与显示锁定 数据库系统原理 一、...

    数据库系统原理

    一、事务

    1.概念

    事务指的是满足 ACID 特性的一组操作,可以通过 Commit 提交一个事务,也可以使用 Rollback 进行回滚。

    2.ACID

    (1)原子性(Atomicity)

    事务被视为不可分割的最小单元,事务的所有操作要么全部提交成功,要么全部失败回滚。回滚可以用回滚日志来实现,回滚日志记录着事务所执行的修改操作,在回滚时反向执行这些修改操作即可。

    (2)一致性(Consistency)

    数据库在事务执行前后都保持一致性状态。在一致性状态下,所有事务对一个数据的读取结果都是相同的。

    (3)隔离性(Isolation)

    多个事务并发访问时,事务之间是隔离的,一个事务不应该影响其它事务运行效果。在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。由并发事务所做的修改必须与任何其他并发事务所做的修改隔离。事务查看数据更新时,数据所处的状态要么是另一事务修改它之前的状态,要么是另一事务修改它之后的状态,事务不会查看到中间状态的数据。

    完全的隔离性是不现实的,完全的隔离性要求数据库同一时间只执行一条事务(串行),这样会严重影响性能。一般选择较弱的隔离级别,如读未提交(容易读到脏数据)、读已提交(容易引起幻读)和可重复读(容易引起不可重复读,即同一条数据前后读取不一致)等。

    (4)持久性(Durability)

    一旦事务提交,则其所做的修改将会永远保存到数据库中。即使系统发生崩溃,事务执行的结果也不能丢失。使用重做日志来保证持久性。

    总结

    • 只有满足一致性,事务的执行结果才是正确的;
    • 在无并发的情况下,事务串行执行,隔离性一定能够满足。此时只要能满足原子性,就一定能满足一致性;
    • 在并发的情况下,多个事务并行执行,事务不仅要满足原子性,还需要满足隔离性,才能满足一致性;
    • 事务满足持久化是为了能应对数据库崩溃的情况。

    二、并发一致性问题

    在并发环境下,事务的隔离性很难保证,因此会出现很多并发一致性问题。

    1. 丢失修改

    T1和T2两个事务都对一个数据进行修改,T1先修改,T2随后修改,T2的修改覆盖了 T1的修改。在这里插入图片描述

    2. 读脏数据

    T1 修改一个数据,T2 随后读取这个数据。如果 T1 撤销了这次修改,那么 T2 读取的数据是脏数据。在这里插入图片描述

    3. 幻影读

    T1 读取某个范围的数据,T2 在这个范围内插入新的数据,T1 再次读取这个范围的数据,此时读取的结果和和第一次读取的结果不同。在这里插入图片描述

    4. 不可重复读

    T2 读取一个数据,T1 对该数据做了修改。如果 T2 再次读取这个数据,此时读取的结果和第一次读取的结果不同。在这里插入图片描述
    产生并发不一致性问题主要原因是破坏了事务的隔离性,解决方法是通过并发控制来保证隔离性。并发控制可以通过封锁来实现,但是封锁操作需要用户自己控制,相当复杂。数据库管理系统提供了事务的隔离级别,让用户以一种更轻松的方式处理并发一致性问题

    三、封锁

    1. 封锁粒度

    MySQL中提供了两种封锁粒度:行级锁表级锁
    尽可能只锁定需要修改的那部分数据而不是全部资源 — 锁定的数据量越小,发生锁争用可能性降低,系统并发程度提高
    锁的各种操作如获取锁、释放锁以及检查锁状态等消耗资源 — 封锁粒度越小,系统开销越大
    — 封锁粒度的选择需要在 锁开销 和 并发程度 之间做权衡

    2. 封锁类型

    (1) 读写锁

    • 写锁/排它锁(Exclusive),简写为 X 锁。
    • 读锁/共享锁(Shared),简写为 S 锁。

    有以下两条规定:

    • 一个事务对数据对象A加了X锁,就可以对A进行读取和更新。加锁期间其他事务不能对A加任何锁;
    • 一个事务对数据对象A加了S锁,可以对A进行读取操作,但不能进行更新操作。加锁期间其它事务能对A加S锁,但不能加X锁。

    (2) 意向锁(Intention Locks)

    实现表锁和行锁的共存。意向锁在原来的 X/S 锁之上引入了 IX/IS,IX/IS 都是表锁,用来表示一个事务想要在表中的某个数据行上加 X 锁或 S锁。有以下两个规定:

    • 一个事务在获得某个数据行对象的 S 锁之前,必须先获得表的 IS 锁或者更强的锁;
    • 一个事务在获得某个数据行对象的 X 锁之前,必须先获得表的 IX 锁。

    在存在行级锁和表级锁的情况下,事务T想要对表A加X锁,就需要先检测是否有其它事务对表A或者表A中的任意一行加了锁,那么就需要对表A的每一行都检测一次,这是非常耗时的。

    通过引入意向锁,事务T想要对表A加X锁,只需要先检测是否有其它事务对表A加了 X/IX/S/IS 锁,如果加了就表示有其它事务正在使用这个表或者表中某一行的锁,因此事务T加X锁失败。

    各种锁的兼容关系:
    在这里插入图片描述
    注意:任意 IS/IX 锁之间都是兼容的,因为它们只是表示想要对表加锁,而不是真正加锁;S锁只与S锁和IS锁兼容,也就是说事务T想要对数据行加S锁,其它事务可以已经获得对表或者表中的行的S 锁。

    3. 封锁协议

    (1) 三级封锁协议

    • 一级封锁协议
      事务T要修改数据A时必须加X锁,直到T结束才释放锁。— 解决丢失修改问题.,因为不会同时有两个事务对同一个数据进行修改,事务的修改就不会被覆盖。

    • 二级封锁协议
      在一级的基础上,要求读取数据A时必须加S锁,读取完马上释放S锁。— 解决读脏数据问题,因为如果一个事务在对数据A进行修改,根据1级封锁协议,会加X锁,那么就不能再加S锁了,也就是不会读入数据。

    • 三级封锁协议
      在二级的基础上,要求读取数据 A 时必须加S锁,直到事务结束了才能释放S锁。— 解决不可重复读的问题,因为读A时,其它事务不能对A加X锁,从而避免了在读的期间数据发生改变。

    (2) 两段锁协议

    加锁和解锁分为两个阶段进行。
    可串行化调度:通过并发控制,使得并发执行的事务结果与某个串行执行的事务结果相同。
    事务遵循两段锁协议是保证可串行化调度的充分条件。例如以下操作满足两段锁协议,它是可串行化调度。

    lock-x(A)…lock-s(B)…lock-s©…unlock(A)…unlock©…unlock(B)

    但不是必要条件,例如以下操作不满足两段锁协议,但是它还是可串行化调度。

    lock-x(A)…unlock(A)…lock-s(B)…unlock(B)…lock-s©…unlock©

    4. MySQL隐式与显示锁定

    MySQL的InnoDB存储引擎采用两段锁协议,会根据隔离级别在需要的时候自动加锁,并且所有的锁都是在同一时刻被释放,这被称为隐式锁定。
    InnoDB也可以使用特定的语句进行显示锁定:

    SELECT … LOCK In SHARE MODE;
    SELECT … FOR UPDATE;

    四、隔离级别

    1. 未提交读(READ UNCOMMITTED)

    事务中的修改,即使没有提交,对其它事务也是可见的。

    2. 未提交读(提交读(READ COMMITTED)

    一个事务只能读取已经提交的事务所做的修改。换句话说,一个事务所做的修改在提交之前对其它事务是不可见的。

    3. 可重复读(REPEATABLE READ)

    保证在同一个事务中多次读取同样数据的结果是一样的。

    4. 可串行化(SERIALIZABLE)

    强制事务串行执行。需要加锁实现,而其它隔离级别通常不需要。在这里插入图片描述

    五、多版本并发控制

    多版本并发控制(Multi-Version Concurrency Control, MVCC)是 MySQL 的 InnoDB 存储引擎实现隔离级别的一种
    具体方式,用于实现提交读和可重复读这两种隔离级别。而未提交读隔离级别总是读取最新的数据行,无需使用
    MVCC。可串行化隔离级别需要对所有读取的行都加锁,单纯使用 MVCC 无法实现。

    1. 版本号

    • 系统版本号:是一个递增的数字,每开始一个新的事务,系统版本号就会自动递增。
    • 事务版本号:事务开始时的系统版本号。

    2. 隐藏的列

    MVCC 在每行记录后面都保存着两个隐藏的列,用来存储两个版本号:

    • 创建版本号:指示创建一个数据行的快照时的系统版本号。- 行的创建时间
    • 删除版本号:如果该快照的删除版本号大于当前事务版本号表示该快照有效,否则表示该快照已经被删除了。- 行的删除时间

    3. Undo日志

    MVCC 使用到的快照存储在Undo日志中,该日志通过回滚指针把一个数据行(Record)的所有快照连接起来。

    在这里插入图片描述

    4. 实现过程

    以下实现过程针对可重复读隔离级别。
    当开始一个事务时,该事务的版本号肯定大于当前所有数据行快照的创建版本号,理解这一点很关键。数据行快照的
    创建版本号是创建数据行快照时的系统版本号,系统版本号随着创建事务而递增,因此新创建一个事务时,这个事务
    的系统版本号比之前的系统版本号都大,也就是比所有数据行快照的创建版本号都大。

    (1) SELECT

    多个事务必须读取到同一个数据行的快照,并且这个快照是距离现在最近的一个有效快照。但是也有例外,如果有一
    个事务正在修改该数据行,那么它可以读取事务本身所做的修改,而不用和其它事务的读取结果一致。

    把没有对一个数据行做修改的事务称为 T,T所要读取的数据行快照的创建版本号必须小于T的版本号,因为如果大于或者等于 T的版本号,那么表示该数据行快照是其它事务的最新修改,因此不能去读取它。除此之外,T所要读取的数据行快照的删除版本号必须大于T的版本号,因为如果小于等于T的版本号,那么表示该数据行快照是已经被删除的,不应该去读取它。

    (2) INSERT

    将当前系统版本号作为数据行快照的创建版本号。

    (3) DELETE

    将当前系统版本号作为数据行快照的删除版本号。

    (4) UPDATE

    将当前系统版本号作为更新前的数据行快照的删除版本号,并将当前系统版本号作为更新后的数据行快照的创建版本
    号。可以理解为先执行 DELETE 后执行 INSERT。

    5. 快照读与当前读

    (1) 快照读

    使用 MVCC 读取的是快照中的数据,这样可以减少加锁所带来的开销。

    select * from table …;

    (2) 当前读

    读取的是最新的数据,需要加锁。以下第一个语句需要加 S 锁,其它都需要加 X 锁。

    select * from table where ? lock in share mode;
    select * from table where ? for update;
    insert;
    update;
    delete;

    六、Next-Key Locks

    Next-Key Locks 是 MySQL 的InnoDB存储引擎的一种锁实现。MVCC 不能解决幻影读问题,Next-Key Locks 就是为了解决这个问题而存在的。在可重复读(REPEATABLE READ)隔离级别下,使用 MVCC + Next-Key Locks 可以解决幻读问题。

    1. Record Locks

    锁定一个记录上的索引,而不是记录本身。如果表没有设置索引,InnoDB 会自动在主键上创建隐藏的聚簇索引,因此 Record Locks 依然可以使用。

    2. Gap Locks

    锁定索引之间的间隙,但是不包含索引本身。例如当一个事务执行以下语句,其它事务就不能在 t.c 中插入15。

    SELECT c FROM t WHERE c BETWEEN 10 and 20 FOR UPDATE;

    3. Next-Key Locks

    它是 Record Locks 和 Gap Locks 的结合,不仅锁定一个记录上的索引,也锁定索引之间的间隙。例如一个索引包含以下值:10, 11, 13, and 20,那么就需要锁定以下区间:

    (-∞, 10]
    (10, 11]
    (11, 13]
    (13, 20]
    (20, +∞)

    七、关系型数据库设计理论

    1. 函数依赖

    记 A->B 表示 A 函数决定 B,也可以说 B 函数依赖于 A。

    如果 {A1,A2,… ,An} 是关系的一个或多个属性的集合,该集合函数决定了关系的其它所有属性并且是最小的,那
    么该集合就称为键码

    对于 A->B,如果能找到 A 的真子集 A’,使得 A’-> B,那么 A->B 就是部分函数依赖,否则就是完全函数依赖。

    对于 A->B,B->C,则 A->C 是一个传递函数依赖。

    2. 异常

    以下的学生课程关系的函数依赖为 {Sno, Cname} -> {Sname, Sdept, Mname, Grade},键码为 {Sno, Cname}。也
    就是说,确定学生和课程之后,就能确定其它信息。在这里插入图片描述
    不符合范式的关系,会产生很多异常,主要有以下四种异常:

    • 冗余数据:例如 学生-2 出现了两次。
    • 修改异常:修改了一个记录中的信息,但是另一个记录中相同的信息却没有被修改。
    • 删除异常:删除一个信息,那么也会丢失其它信息。例如删除了 课程-1 需要删除第一行和第三行,那么 学生-1 的信息就会丢失。
    • 插入异常:例如想要插入一个学生的信息,如果这个学生还没选课,那么就无法插入。

    3. 范式

    范式理论是为了解决以上提到四种异常。高级别范式依赖于低级别的范式,1NF 是最低级别的范式。

    (1) 第一范式(1NF)

    属性不可分。

    (2) 第二范式(2NF)

    每个非主属性完全函数依赖于键码。可以通过分解来满足。
    分解前
    在这里插入图片描述
    以上学生课程关系中,{Sno, Cname} 为键码,有如下函数依赖:

    • Sno -> Sname, Sdept
    • Sdept -> Mname
    • Sno, Cname-> Grade

    Grade 完全函数依赖于键码,它没有任何冗余数据,每个学生的每门课都有特定的成绩。
    Sname, Sdept 和 Mname 都部分依赖于键码,当一个学生选修了多门课时,这些数据就会出现多次,造成大量冗余数据。
    分解后
    关系-1
    在这里插入图片描述
    有以下函数依赖:

    • Sno -> Sname, Sdept

    • Sdept -> Mname

      关系-2在这里插入图片描述
      有以下函数依赖:

    • Sno, Cname -> Grade

      (3) 第三范式(3NF)

    非主属性不传递函数依赖于键码。上面的 关系-1 中存在以下传递函数依赖:

    • Sno -> Sdept -> Mname 可以进行以下分解:

    关系-11
    在这里插入图片描述
    关系-12
    在这里插入图片描述

    八、ER图

    Entity-Relationship,有三个组成部分:实体、属性、联系。用来进行关系型数据库系统的概念设计。

    1. 实体(entity)

    数据模型中的数据对象,例如人、学生、音乐都可以作为一个数据对象,用长方体来表示,每个实体都有自己的实体成员(entity member)或者说实体对象(entity instance),例如学生实体里包括张三、李四等。

    2. 属性(attribute)

    数据对象所具有的属性(所具有的列),例如学生具有姓名、学号、年级等属性,用椭圆形表示,属性分为唯一属性(unique attribute)和非唯一属性,唯一属性(主键)指的是唯一可用来标识该实体实例或者成员的属性,用下划线表示,一般来讲实体都至少有一个唯一属性。

    3. 联系(relationship)

    用来表现数据对象与数据对象之间的联系,例如学生的实体和成绩表的实体之间有一定的联系,每个学生都有自己的成绩表,这就是一种关系,关系用菱形来表示。

    4. 实体的三种联系

    包含一对一,一对多,多对多三种。

    • 如果 A 到 B 是一对多关系,那么画个带箭头的线段指向 B;
    • 如果是一对一,画两个带箭头的线段;
    • 如果是多对多,画两个不带箭头的线段。
    展开全文
  • 关系数据库 文章目录关系数据库前言一、关系数据结构及形式化定义二、关系操作三、关系代数总结 前言 本章主要介绍了关系的一些概念,一定得弄清楚搞明白,重点是关系代数的几种运算,包括传统集合运算和专门关系...
  • 数据库系统原理与设计 1.1数据库系统 数据管理技术经历了人工管理、文件系统和数据库管理系统3个阶段。 1.人工管理的数据是面向应用程序的。 2.文件系统阶段已经有了操作系统,有专门的软件对数据进行统一管理。 3....
  • 数据库知识点数据库DB数据库系统DBS数据库管理系统DBMS软件架构SQL语句复杂查询语句主键和外键E-R图数据库软件字符集内连接和外连接JDBC 数据库DB 按照数据结构来组织、存储和管理数据的仓库。 用来存储和管理数据的...
  • 这是我之前找实习时整理的一些数据库系统原理和mysql的重要知识点,不是很完善,以后会不断更新,先分享给大家,希望能够对大家有所帮助。
  • 数据库原理 基础知识点

    千次阅读 2016-04-23 23:33:45
    3、数据库系统四个组成部分:用户、数据库应用程序、数据库管理系统(DBMS)和数据库 4、SQL:结构化查询语言,是处理关系数据库中表的国际语言 5、键:标识表中的一列或多列。键可以是唯一的,也可以不唯一。 ...
  • 绪论 一、数据库的四个基本概念 ...3、数据管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件。它的主要功能包括:数据定义功能、 数据操纵功能、数据组织、存储和管理、数据库的事物管理和运行管理、数据
  • 数据库系统概述 一、有关概念 1.数据 2.数据库(DB) 3.数据库管理系统(DBMS) Access 桌面DBMS VFP SQL Server Oracle 客户机/服务器型DBMS MySQL DB2 4.数据库系统(DBS) 数据库(DB) ...
  • 名词积累: 数据库(Database):存放和提供...数据库系统(Database System):包括数据库、DBMS、应用系统、数据库管理员(DBA) 主键(Primary Key):用于唯一的标识表中的某一条记录的属性或属性的集合。
  • 【教材:数据库系统概论(第五版)王珊】 目录 知识点 总结重点 基础篇 绪论 数据,数据库,数据库管理系统,数据库系统; 数据模型,概念,逻辑和物理,层次,网状,关系模型; 三级模式结构与二级映像(数据独立性...
  • 名词积累: 数据库(Database):存放和提供...数据库系统(Database System):包括数据库、DBMS、应用系统、数据库管理员(DBA) 主键(Primary Key):用于唯一的标识表中的某一条记录的属性或属性的集合。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 956
精华内容 382
关键字:

数据库系统原理知识点