精华内容
下载资源
问答
  • 在数据库系统中数据存取的最小单位
    千次阅读
    2022-03-11 11:18:04

    作业

    一、单选题

    1.在数据管理技术发展阶段中,下面哪个阶段可以实现数据共享?        C

    人工管理阶段

    文件管理阶段

    数据库管理阶段

    以上阶段都可以

    2.MySQL 数据库是属于下面哪种模型数据库?    D

    层次数据模型

    网状数据模型

    对象数据模型

    关系数据模型

    3.在数据库管理系统的层次结构中,下面哪个层次负责对数据文件进行操作访问?    D

    操作界面层

    语言翻译处理层

    数据存取层

    数据存储层

    根据处理对象的不同,数据库管理系统的层次结构由高级到低级依次为应用层、语言翻译处理层、数据存取层、数据存储层、操作系统。

      (1)应用层。应用层是DBMS与终端用户和应用程序的界面层,处理的对象是各种各样的数据库应用

      (2)语言翻译处理层。语言翻译处理层是对数据库语言的各类语句进行语法分析、视图转换、授权检查、完整性检查等。

      (3)数据存取层。数据存取层处理的对象是单个元组,它将上层的集合操作转换为单记录操作

      (4)数据存储层。数据存储层处理的对象是数据页和系统缓冲区

      (5)操作系统。操作系统是DBMS的基础。操作系统提供的存取原语和基本的存取方法通常是作为和DBMS存储层的接口。

    4.在数据库领域技术中,下面哪种技术可以实现数据集成?    B

    数据库技术

    数据仓库技术

    数据挖掘技术

    商业智能技术

    数据仓库 (Data Warehouse) 简称DW,存储大量数据的集成中心。

    数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support)。

    它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。

    数据仓库的输入方是各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。

    5.下面哪种数据库系统应用结构适合银行业务系统?    C

    集中式结构

    客户/服务器结构

    分布式结构

    以上结构都可以

    6.下面哪类数据库应用系统需要使用数据分析处理技术?    D

    业务处理系统

    办公管理系统

    管理信息系统

    决策支持系统

    7下面哪类数据库管理系统是对象-关系数据库系统?    D

    SQL Server

    MySQL

    Oracle Database

    PostgreSQL

    8.下面哪个程序实现PostgreSQL服务器起停控制?    B

    initdb

    pg_ctl

    postgres

    postmaster

    • 初始化数据库
      pg_ctl init[db]   [-D DATADIR] [-s] [-o OPTIONS]

    • 启动数据库
      pg_ctl start      [-D DATADIR] [-l FILENAME] [-W] [-t SECS] [-s] [-o OPTIONS] [-p PATH] [-c]

    • 关闭数据库
      pg_ctl stop       [-D DATADIR] [-m SHUTDOWN-MODE] [-W] [-t SECS] [-s]

    • 重启数据库
      pg_ctl restart    [-D DATADIR] [-m SHUTDOWN-MODE] [-W] [-t SECS] [-s] [-o OPTIONS] [-c]

    9.下面哪类数据库是功能最强大的数据库?    C

    MySQL

    PostgreSQL

    Oracle Database

    SQL Server

    10.下面哪类数据库可以在手机中运行?    D

    MySQL

    Postgre SQL

    Access

    SQLite

    二、判断题

    1. 用户程序可以直接访问数据库文件。    x
    2. 在数据库系统中,可以保证没有冗余数据。        x
    3. 数据表之间的约束在数据库中是一种元数据。    ✓
    4. 面向对象数据库可以支持复杂数据类型处理,它一定会取代关系数据库。     x
    5. NoSQL数据库可以管理非结构化数据。     ✓
    6. 数据库挖掘可建立在数据仓库基础上进行数据分析处理     ✓
    7. 为简化数据库开发,不需要数据模型设计,可直接定义数据库表。     x
    8. 所有业务处理系统都支持联机事务处理和脱机事务处理。     x
    9. 分布式数据库系统可实现数据分布和处理分布     ✓
    10. MySQL数据库系统是一种企业级DBMS。         x

    5.NoSQL数据库技术

    NoSQL理论基础:

        CAP理论:一致性、可用性、分区容忍性。
        BASE模型:基本可用、软状态、最终一致性。
        最终一致性理论:因果一致性、读一致性、会话一致性、单调读一致性、单调写一致性。

    NoSQL数据库分类:

        键值对存储方式:Redis
        列存储方式:HBase
        文档存储方式:MongoDB
        图形存储方式:Neo4j

    三、本章重点问题讨论

    答案非标准答案,仅供参考

    1.什么是元数据?它是如何产生的,存储在哪里?

    元数据是描述数据库结构的数据;

    在关系数据库中,各个关系表的表名称、列名称、列数据类型、数据约束规则等都是元数据;

    存储在数据库的系统表中。

    2.结构化数据与非结构化数据有何区别?

    结构化数据有规范的结构,便于处理和管理;

    非结构化数据没有固定的结构

    3.NoSQL数据库与NewSQL数据库有何区别?

    NoSQL数据库技术可以解决非结构化数据存储与大数据操作,

    具有良好的扩展性和灵活性,但它不支持广泛使用的结构化数据访问SQL,

    同时也不支持数据库事务的ACID(原子性、一致性、隔离性和持久性)操作。

    不同的NoSQL数据库技术都有格子的查询语言和数据模型,

    这使得开发者很难规范应用程序接口。

    NewSQL数据库技术是一种在NoSQL数据库技术基础上同时支持关系数据库访问的技术,

    具有NoSQL 对海量数据的分布式存储管理能力,

    还保持了兼容传统关系 数据库的ACID和SQL等特性。

    NewSQL数据库技术不但支持非结构化数据管理的大数据应用,

    也支持结构化数据管理的关系数据库应用。

    4.通用数据库与领域数据库有何区别?

    领域数据库在技术实现原理上与通用数据库没有多大的区别,

    但它们与特定应用领域相结合,加强了数据库系统对有关应用领域的支撑能力,

    尤其表现在数据模型、操作语言、数据访问方面对应用领域的紧密结合。

    5.大数据分析与数据挖掘有何区别?

    数据挖掘是一种建立在数据仓库基础上队大量数据进行模式或规律挖掘,从中发现有价值信息的技术。

    大数据分析处理技术是一种解决传统数据分析处理难以在规定时间完成大规模复杂数据分析处理的技术。

    传统的数据挖掘、商业智能技术虽然也能针对大规模数据集进行分析处理,

    但它们处理的数据类型有限,也不能快速处理海量的非结构化数据。

    6.数据库应用系统有哪些结构模式?各有什么适合的应用场景?

    1、单用户结构:在一些简单的业务服务系统中,数据库应用系统服务的对象为单个用户。

    2、集中式结构:在一些多终端业务服务系统中,应用程序、数据库及其DBMS安装在同一服务器上运行,而用户则使用自己的客户端计算机或智能手机通过网络连接访问服务器系统。

    3、客户/服务器结构:在一些多终端业务服务系统中,应用系统的处理逻辑分布在客户机和服务器中,各个计算机分担处理系统逻辑,如服务器运行数据库及其DBMS,客户及运行处理应用裸机程序。

    4、在大规模、跨地区的机构信息系统中,集中式数据库应用系统或客户/服务器数据库应用系统均难以满足业务处理要求,其系统必须采用分布式结构

    7.对象-关系数据库DBMS具有哪些特点?

    (1)支持标准SQL,内置丰富的数据类型,并允许用户扩展数据类型。

    (2)支持事务、子查询、多版本并行控制系统(MVCC)、数据完整性检查等特性。

    (3)采用经典的客户/服务器结构。

    (4)支持多种开发语言,如 C、 C++、Java、Perl、Tcl和 Python等。

    (5)跨多种操作系统平台,如 Linux、FreeBSD、OSX、Solaris 和 Microsoft Windows 等。

    (6)具有继承机制,可以创建数据库表,并从“父表”继承其特征

    (7)在数据库中,系统支持对象、类、继承等功能特性处理。

    8.PostgreSQL数据库软件与MySQL数据库软件比较,各有哪些技术特点?

    PostgreSQL数据库技术特点:

    (1)支持标准 SQL,内置丰富的数据类型,并允许用户扩展数据类型。

    (2)支持事务、子查询、多版本并行控制系统(MVCC)、数据完整性检查等特性。

    (3)采用经典的客户/服务器结构。

    (4)支持多种开发语言,如 C、C++、Java、Perl、Tcl和 Python 等。

    (5)跨多种操作系统平台,如 Linux、FreeBSD、OS X、Solaris 和 Microsoft、Windows 等。

    (6)具有继承机制,可以创建数据库表,并从“父表”继承其特征q4a0;S.E.1

    (7)在数据库中,系统支持对象、类、继承等功能特性处理。

    MySQL数据库技术特点:

     (1)代码使用 C和 C+编写,并使用了多种编译染进行测试,保证了源代码的可移植性。

    (2)支持 AIX、FireeBSD、HP-UX、Linux、macOS、NovellNetware、OpenBSD、OS/2 Wrap、Solaris、Windows 等多种操作系统。

    (3)为多种编程语言提供了 API。这些编程语言包括C、C++、Python、Java、Perl、PHP、Eiffel、Ruby、.NET和Tcl等。

    (4)支持多线程,充分利用 CPU 资源。

    (5)优化SQL 查询算法,有效地提高查询速度。

    (6)提供 TCP/IP、ODBC 和JDBC 等多种数据库连接途径。

    (7)提供用于管理、检查、优化数据库操作的管理工具。

    (8)支持大型的数据库管理能力,可以处理拥有上千万条记录的大型数据表。

    (9)MySQL是可以定制的,采用了GRL协议,可以修改源码来开发自己的MySQL系统。

    更多相关内容
  • 用户对不同的数据对象有不同的存取权限。 不同的用户对同一对象也有不同的权限。 用户还可以将其拥有的存取权限转授给其他用户。 强制存取控制(Mandatory Access Control 简称 MAC): B1级 每一个数据库对象被标以...
  • 因为在数据库系统中应用程序不必考虑数据的定义、存储和数据存取的具体路径,这些工作都由 DBMS 来完成。用一个通俗的比喻,使用了 DBMS 就如有了一个好参谋、好助手,许多具体的技术工作都由这个助手来完成。开发...
  • 四大基本概念(1)数据--Data① 数据的定义② 数据的种类③ 数据的特点④ 数据举例(2)数据库--Database① 数据库的定义② 数据库的基本特征(3)数据库管理系统--DataBase Management System① 什么是DBMS?...


    0.思维导图

    在这里插入图片描述

    1.四大基本概念

    (1)数据–Data

    • 数据(Data)是数据库中存储的基本对象

    ① 数据的定义

    描述事物的符号记录

    ② 数据的种类

    文本、图形、图像、音频、视频、学生的档案记录、货物的运输情况等

    ③ 数据的特点

    数据与其语义是不可分的

    ④ 数据举例

    • 数据的含义称为数据的语义,数据与其语义是不可分的。

    例如 93是一个数据
    语义1:学生某门课的成绩
    语义2:某人的体重
    语义3:计算机系2003级学生人数
    语义4:请同学给出。。。

    学生档案中的学生记录
    (李明,男,197205,江苏南京市,计算机系,1990)
    语义:学生姓名、性别、出生年月、籍贯、所在院系、
    入学时间
    解释:李明是个大学生,1972年5月出生,江苏南京市人,1990年考入计算机系

    (2)数据库–Database

    ① 数据库的定义

    数据库(Database,简称DB)是长期储存计算机内有组织可共享的大量数据集合

    ② 数据库的基本特征

    • 数据按一定的数据模型组织、描述和储存
    • 可为各种用户共享
    • 冗余度较小
    • 数据独立性较高
    • 易扩展

    (3)数据库管理系统–DataBase Management System

    ① 什么是DBMS?

    DBMS是位于用户与操作系统之间的一层数据管理软件。是基础软件,是一个大型复杂的软件系统

    ② DBMS的用途

    科学地组织和存储数据、高效地获取和维护数据

    ③ DBMS的主要功能

    • 数据定义功能
      提供数据定义语言(DDL)
      定义数据库中的数据对象

    • 数据组织、存储和管理
      分类组织、存储和管理各种数据
      确定组织数据的文件结构和存取方式
      实现数据之间的联系
      提供多种存取方法提高存取效率

    • 数据操纵功能
      提供数据操纵语言(DML)
      实现对数据库的基本操作 (查询、插入、删除和修改)

    • 数据库的事务管理和运行管理
      数据库在建立、运行和维护时由DBMS统一管理和控制
      保证数据的安全性、完整性、多用户对数据的并发使用
      发生故障后的系统恢复

    • 数据库的建立和维护功能(实用程序)
      数据库初始数据装载转换
      数据库转储
      介质故障恢复
      数据库的重组织
      性能监视分析等

    • 其它功能
      DBMS与网络中其它软件系统的通信
      两个DBMS系统的数据转换
      异构数据库之间的互访和互操作

    (4)数据库系统–Database System

    ① 什么是数据库系统(Database System,简称DBS)

    在计算机系统中引入数据库后的系统构成

    ② 数据库系统的构成

    • 数据库 Database
    • 数据库管理系统(及其开发工具)Database Management System
    • 应用系统
    • 数据库管理员 Database Administrator

    在这里插入图片描述

    ③ 数据库系统的特点

    ❶ 数据结构化
    • 整体数据的结构化是数据库的主要特征之一

    • 整体结构化
      不再仅仅针对某一个应用,而是面向全组织
      不仅数据内部结构化,整体是结构化的,数据之间具有联系

    • 数据库中实现的是数据的真正结构化
      数据的结构用数据模型描述,无需程序定义和解释
      数据可以变长
      数据的最小存取单位是数据项

    ❷ 数据的共享性高,冗余度低,易扩充
    • 数据库系统从整体角度看待和描述数据,数据面向整个系统,可以被多个用户、多个应用共享使用。
    • 数据共享的好处
      减少数据冗余,节约存储空间
      避免数据之间的不相容性与不一致性
      使系统易于扩充
    ❸ 数据独立性高
    • 物理独立性
      指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。
    • 逻辑独立性
      指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。
    • 数据独立性是由DBMS的二级映像功能来保证的
    ❹ 数据由DBMS统一管理和控制

    DBMS提供的数据控制功能

    • (1)·数据的安全性(Security)保护·
      保护数据,以防止不合法的使用造成的数据的泄密和破坏。
    • (2)数据的完整性(Integrity)检查
      将数据控制在有效的范围内,或保证数据之间满足一定的关系。
    • (3)并发(Concurrency)控制
      对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
    • (4)数据库恢复(Recovery)
      将数据库从错误状态恢复到某一已知的正确状态。
    ❺ 应用程序与数据的对应关系(数据库系统)

    在这里插入图片描述

    2.数据管理技术的产生和发展

    (1) 什么是数据管理

    • 对数据进行分类、组织、编码、存储、检索和维护
    • 数据处理的中心问题

    (2) 数据管理技术的发展过程

    • 人工管理阶段(20世纪40年代中–50年代中)
    • 文件系统阶段(20世纪50年代末–60年代中)
    • 数据库系统阶段(20世纪60年代末–现在)

    (3)时期

    • 20世纪60年代末以来

    (4) 产生的背景

    • 应用背景 大规模管理
    • 硬件背景 大容量磁盘、磁盘阵列
    • 软件背景 有数据库管理系统
    • 处理方式 联机实时处理,分布处理,批处理
    展开全文
  • 实时应用,事务运行前的操作逻辑(操作类型、顺序等)、数据集及其结构、行为以及时间的相关性等都是可预分析的。然而,对磁盘数据库而言,数据的I/O 是造成事务执行时间不确定、预报不准确的关键因素。为此,...
  • 摘要: 磁盘数据存取和传输到内存的速度一直是计算机系统的性能瓶颈。虽然现在磁盘转速和总线速度已经有了很大提高,但磁盘容量的大幅度增大又减缓了对其上数据存取速度。本文介绍了嵌入式内存数据库技术发展的...
  • 对于数据库系统概论的一个整理,适合考研复试,。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。...
  • 数据库系统的特点数据库系统的特点
  • 华建电子有限责任公司所研发的数据盾就是为了增强企业安全链最弱的一环: 数据库安全而设计的,其使用了强大的加密和访问控制技术,可以保护企业最有价值的数据资产远离任何威胁。数据盾具有对数据库应用程序透明的...
  •     数据库技术是应数据管理任务...    应用需求的推动下,计算机硬件、软件发展的基础上,数据管理技术经历了人工管理、文件系统数据库系统三个阶段。 数据管理三个阶段比较 人工...

        数据库技术是应数据管理任务的需要而产生的。数据管理是指对数据进行分类、组织、编码、存储、检索和维护,它是数据处理的中心问题。而数据的处理是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。
        在应用需求的推动下,在计算机硬件、软件发展的基础上,数据管理技术经历了人工管理、文件系统、数据库系统三个阶段。

    数据管理三个阶段比较
      人工管理阶段文件系统阶段数据库系统阶段
    背景应用背景科学计算科学计算、数据管理大规模数据管理
    硬件背景无直接存取存储设备磁盘、磁鼓大容量磁盘、磁盘阵列
    软件背景无操作系统有文件系统有数据管理系统
    处理方式批处理联机实时处理、批处理联机实时处理、分布处理、批处理
    特点数据的管理者用户(程序员)文件系统数据库管理系统
    数据面向的对象某一应用程序某一应用程序现实世界(部门、企业、组织等)
    数据的共享程度无共享,冗余度极大共享性差,冗余度大共享性高,冗余度低
    数据的独立性不独立,完全依赖程序独立性差具有高度的物理独立性和一定的逻辑独立性
    数据的结构化无结构记录内有结构,整体无结构整体结构化,用数据模型描述
    数据控制能力应用程序控制应用程序控制由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力

        1. 人工管理阶段
        20世纪50年代中期之前,计算机只用于科学计算,没有直接存取的存储设备,也没有操作系统和数据管理软件,处理方式还是批处理。
        人们把计算机当成一种计算工具,主要用于科学计算。这一时期就是我们说的数据的人工管理阶段。通常的办法是:用户针对某个特定的求解问题,首先确定求解的算法;然后利用计算机系统所提供的编程语言,直接编写相关的计算机程序;最后将程序和相关的数据通过输入设备送入计算机,计算机处理完之后输出用户所需的结果。不同的用户针对不同的求解问题,均要编写各自的求解程序,整理各自程序的所需的数据,数据的管理完全由用户负责。
        因此这个阶段的数据管理具有数据不保存、应用程序管理数据、数据不共享、数据不具有独立性等特点:
        1.数据不保存
        当时计算机主要用于科学计算,一般不需要将数据长期保存,只是计算某一课题时输入数据,用完就撤走。
        2.应用程序管理数据
        数据需要由应用程序自己设计、说明(定义)和管理,没有相应的软件系统负责数据的管理工作。应用程序中不仅要规定数据的逻辑结构,而且要设计物理结构(包括存储结构、存取方法、输入方式等),所以程序员负担很重。
        3.数据不共享
        数据是面向应用程序的,一组数据只能对应一个程序。多个应用程序涉及一些相同的数据时,只能各自定义,无法相互利用、参照,因此程序与程序间有大量冗余数据。
        4.数据不具有独立性
        数据的逻辑结构或物理结构发生变化后,必须相应地修改应用程序,因此加重了程序员的负担。
    人工管理阶段

        2.文件系统阶段
        20世纪50-60年代,这个时候已经出现了磁鼓、磁盘等直接存取存储设备,操作系统中出现了专门的数据管理软件,称为文件系统,在处理方式上,不仅有批处理,还出现了联机实时处理。
        计算机用于大量处理数据工作,大量的数据存储、检索和维护成为紧迫的需求。为了方便用户使用计算机,提高计算机系统的使用效率,产生了以操作系统为核心的系统软件,以有效的管理计算机资源。文件是操作系统管理的重要资源之一,而操作系统提供了文件系统的管理功能。在文件系统中,数据以文件形式组织与保存。文件是一组具有相同结构的记录的集合。记录是由某些相关数据项组成的。数据组织成文件以后,就可以处理与它的程序相分离而单独存在。数据按其内容、结构和用途的不同,可以组织成若干不同命名的文件。文件一般为某一用户(或用户组)所有,但也可供指定的其他用户共享。文件系统还为用户程序提供一组对文件管理与维护的操作或功能,包括对文件的建立、打开、读/写和关闭等。应用程序可以调用文件系统提供的操作命令来建立和访问文件,应用系统就成了用户程序与文件之间接口
        该阶段的文件系统数据管理具有数据可以长期保持、文件系统管理数据、数据共享性差,冗余度大、数据独立性差等特点:
        1.数据可以长期保存
        由于计算机大量用于数据处理,数据需要长时间保留在外存上反复进行查询、修改、插入和删除等操作。
        2.由文件系统管理数据
        由专门的软件即文件系统进行数据管理,文件系统把数据组织成相互独立的数据文件,利用“按文件名访问,按记录进行存取”的管理技术,可以对文件进行修改、插入和删除的操作。文件系统实现了记录内的结构性,但整体无结构(文件由记录构成,记录内部有某些结构(记录由若干属性组成),但记录之间没有联系)。程序和数据之间由文件系统提供存取方法进行转换,使应用程序和数据之间有了一定的独立性,程序员可以不必过多地考虑物理细节,将精力集中于算法。而且数据在存储上的改变不一定反映在程序上,大大节省了维护程序的工作量。
        3.数据共享性差,冗余度大
        在文件系统中,一个(或一组)文件基本上对应一个应用程序,即文件仍然是面向应用的。不同的应用程序具有部分相同的数据时,也必须建立各自的文件,而不能共享相同的数据,因此数据的冗余度(redundancy)大,浪费存储空间,而且由于重复存储、各自管理,容易造成数据不一致,增加了数据修改和维护的难度。
        4.数据独立性差
        文件系统中的文件为某一特定应用服务,文件的逻辑结构对该应用程序来说是优化的,所以要想对现有的数据再增加新的应用是很困难的,系统不易扩充。
        一旦数据的逻辑结构改变,必须修改相应程序,修改文件结构的定义。因此数据与程序之间仍然缺乏独立性。
        可见,文件系统仍然是一个不具有弹性的无结构的数据集合,即文件之间是孤立的,不能反映现实世界事物之间的内在联系。
    文件系统阶段

        3.数据库系统阶段
        从20世纪60年代后期开始,计算机应用于管理的规模更加庞大,需要计算机管理的数据急剧增长,对数据共享的要求也与日俱增。
        随着大容量磁盘系统的使用,计算机联机存取大量数据成为可能;软件价格相对上升,硬件价格相对下降,使独立开发系统和维护软件的成本增加,文件系统的管理方法已无法满足要求。为了解决独立性问题,实现数据统一管理,最大限度地实现数据共享,必须发展数据库技术。于是为了解决多用户、多应用共享数据的需求,使数据为尽可能多的应用服务,数据库技术应运而生,出现了统一管理数据的专门软件系统——数据库管理系统。
        数据库技术为数据管理提供了一种较完善的高级管理模式,它克服了文件系统方式下分散管理的缺点,对所有数据实行统一、集中管理,使数据的存储独立于它的程序,从而实现数据共享。
        相比于人工管理和文件系统,数据库系统具有明显的优点,其主要特点如下:
        1.数据结构化
        数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。“整体”结构化指在数据库中的数据不再仅仅针对某一应用,而是面向全组织;不仅数据内部是结构化的,而且整体也是结构化的,数据之间是有联系的,而文件系统只是内部有结构,但整体无结构,记录之间没有联系。
        在数据库系统中,不仅数据是整体结构化的,而且存取数据的方式也很灵活,可以存取数据库中的某一个数据项、一组数据项、一个记录或一组记录,而在文件系统中,数据的存取单位是记录,粒度不能细到数据项。
        2.数据的共享性高,冗余度低,易扩充
        数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,因此数据可以被多个用户、多个应用共享使用。数据共享可以大大减少数据冗余,节约存储空间,还能避免数据间的不相容性和不一致性。数据的不一致性指同一数据不同拷贝的值不一样。
        由于数据面向整个系统,是有结构的数据,不仅可以被多个应用共享使用,而且容易增加新的应用,这就使数据库系统弹性大、易于扩充。可以选取整体数据的各种子集用于不同的应用程序,当应用需求改变或增加时,只要重新选取不同的子集加上一部分数据,便可满足新需求。
        3.数据独立性高
        数据独立性包括数据的物理独立性和数据的逻辑独立性。
        物理独立性指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。数据在磁盘上的数据库中怎样存储是有DBMS管理的,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样当数据的物理存储改变时,应用程序不用改变。
        逻辑独立性指用户的应用程序与数据库的逻辑结构是相互独立的。当数据的逻辑结构发生改变,用户程序也可以不变。
        数据独立性是由DBMS的二级映像功能来保证的。
        数据与程序的独立,把数据的定义从程序中分离出去,加上存取数据的方法又由DBMS负责提供,从而简化了应用程序的编制,大大减少了应用程序的维护和修改。
        4.数据由DBMS统一管理和控制
        数据库的共享是并发的共享,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中同一个数据。
    为此DBMS还必须提供以下几方面的数据控制功能:
        (1)数据的安全性(Security)保护
        数据的安全性是指保护数据,以防止不合法的使用造成数据的泄密和破坏。使每个用户只能按规定对某些数据以某些方式进行使用和处理。
        (2)数据的完整性(Integrity)检查
        数据的完整性指数据的正确性、有效性、相容性。完整性检查将数据控制在有效的范围内,或保证数据之间满足一定的关系。
        (3)并发(Concurrency)控制
        当多个用户的并发进程同时存取、修改数据库时,可能会发生相互干扰而得到错误的结果或使数据库的完整性遭到破坏,因此必须对多用户的并发操作加以控制和协调。
        (4)数据恢复(Recovery)
        计算机系统的硬件故障、软件故障、操作员的失误以及故意的破坏也会影响数据库中数据的正确性,甚至造成数据库部分或全部数据的丢失。DBMS必须具有将数据库从错误状态恢复到某一已知的正确状态(也称为完整状态或一致状态)的功能,这就是数据库的恢复功能。
    数据库系统阶段

        综上所述,数据库是长期存储在计算机内有组织的大量的共享的数据集合。它可以供各种用户共享,具有最小冗余度和较高的数据独立性。DBMS在数据库建立、运用和维护时对数据库进行统一控制,以保证数据库的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
        数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段。这样既便于数据的集中管理,又有利于应用程序的研制和维护,提高了数据的利用率和相容性,提高了决策的可靠性。

    展开全文
  • 分布式数据库系统

    千次阅读 2022-03-16 02:54:15
    分布式数据库在结构上与集中式数据库存在差异。什么差异?集中式数据库是单机版,数据都放在一台机器里,而分布式数据库数据则散布于网络。这样的话,分布式数据库查询起来,很有可能需要考察多个节点的数据。...

    分布式数据库系统是数据库技术与网络技术相结合的产物,其基本思想是将传统的集中式数据库中的数据分布于网络上的多台计算机中。分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都有DBMS的一份完整的复制副本,并具有自己局部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。

    一、分布式数据库概述

    【定义】
    分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自治),可以执行局部应用;同时也能通过网络通信子系统执行全局应用。

    分布式数据库是在集中式数据库系统技术的基础上发展起来的,具有如下特点:

    1)数据独立性
    包括逻辑独立性、物理独立性和数据分布独立性(分布透明性)。

    2)集中与自治共享相结合的控制结构
    各局部DBMS可以独立地管理局部数据库,具有自治的功能。同时系统又设有集中控制机制,协调各局部DBMS的工作,执行全局应用。

    3)适当增加了数据冗余度
    在不同的场地存储同一数据的多个副本,提高了系统的可靠性和可用性,同时也提高了系统的性能。

    4)全局的一致性、可串行性和可恢复性

    【体系结构】

    分布式:
    在这里插入图片描述
    集中式:
    在这里插入图片描述
    对比集中式,分布式数据库系统的体系结构,是将外模式扩展成了【全局外模式 + 全局概念模式 + 全局分片模式 + 全局分布模式】。

    概念模式也叫逻辑模式,模式。全局概念模式,定义分布式数据库系统的整体逻辑结构,用户在这一层看来,数据就如同没有分布一样,如同传统的集中式数据库。

    分片模式。将一个关系模式分解成几个数据片。

    分布模式。定义数据片段(即分片模式的处理结果)的存放节点。分布模式的映射类型确定了分布式数据库是冗余还是非冗余。若映射是一对多的,即一个片段分配到多个节点存放,则是冗余的分布式数据库,否则是不冗余的分布式数据库。

    局部概念模式,局部数据库的概念模式。

    局部内模式,局部数据库的内模式。

    【分布式数据库的优点】
    分布式数据库的物理层面分布、逻辑层面统一的特色,让它具有一些集中式数据库所不可及的优势:

    1)分布式数据库可以解决企业部门分散而数据需要相互联系的问题。

    2)如果企业需要增加新部门,则分布式数据库可以在对当前机构影响最小的情况下进行扩充。

    3)分布式数据库可以满足负载均衡的需要,数据分片存放,避免单台服务器性能瓶颈

    4)当企业如果已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上地构成分布式数据库系统。

    5)由于有多个局部应用,多个副本,可靠性比较高。

    二、数据分片

    数据分片将数据库整体逻辑结构分解为合适的逻辑单位(片段),然后由分布模式来定义片段及其副本在各场地的物理分布,其主要目的是提高访问的局部性,有利于按照用户的需求,组织数据的分布和控制数据的冗余度。

    1、数据分片的分类
    分布式数据库的4种分片方式分别为:
    1)水平分片
    2)垂直分片
    3)混合分片
    4)导出分片
    详见 分布式数据库分片方式之导出分片

    2、数据分片的原则
    不管采用哪种分片方式,都应该遵循如下原则:

    1)完整性
    全局关系的所有数据都必须分配到各个片段中,不允许某些数据属于全局关系但不属于任何片段。

    2)重构性
    各个片段可以重构原来的全局关系。

    3)不相交性
    全局关系中的每个元组仅属于一个片段,不能在多个片段中重复出现。此规则不是必须的,因为冗余的分布式数据库系统中数据可能有多个副本。但部分元组重复会使数据更新操作变得复杂,所以一般片段之间是不相交的。

    3、分布透明性
    分布透明性是指用户不必关心数据的逻辑分片,也不必关心数据存储的物理位置,以及局部场地上数据库的数据模型。分布透明性包括:

    1)分片透明性
    分片透明性是分布透明性的最高层次。用户或应用程序只对全局关系进行操作,而不必考虑数据的分片。当分片模式改变时,只需改变全局概念模式到分片模式的映射,全局模式不变,应用程序不必修改。

    2)位置透明性
    用户或应用程序应当了解分片情况,但不必了解片段的存储场地。当存储场地改变时,只需改变分片模式到分布模式的映射,应用程序不受到影响。同时,片段的重复副本数目改变了,数据的冗余也将改变,但用户不必关心如何保持各副本的一致性,提供了重复副本的透明性。

    3)局部数据模型透明性
    用户或应用程序应当了解分片及各片段存储的场地,但不必了解局部场地上使用的是何种数据模型。模型转换和语言的转换均由分布模式到局部概念模式映射来完成。

    三、分布式数据库的查询模式

    分布式数据库中,从查询涉及的数据和查询处理过程中的通信模式来划分,可以分为局部查询、远程查询和全局查询三种类型:

    1)局部查询
    指用户查询所涉及的数据均在本地数据库中,可以使用集中式查询处理技术进行优化。

    2)远程查询
    查询只涉及网络中单个场地的数据,因此也可以使用集中式查询处理技术进行优化。但同时需要注意,数据可能在网络中的多个位置存在副本,就有一个副本选择问题。通常选择距离查询场地最近的副本。

    3)全局查询
    查询涉及多个场地的数据,查询处理和优化技术最为复杂。具体方法有全局查询树的变换、副本选择与多副本的更新策略、查询树分解、半连接和直接连接等。

    四、分布式数据库全局查询的优化

    1、全局查询树的变换
    目的就是将投影和选择提前,尽量减少连接时的数据量,提高连接速度。

    2、副本选择与多副本的更新策略
    如上所述,分布式数据库的数据常常设置多个副本。这样在查询时就有个副本选择问题。选择副本原则:
    1)尽可能提高访问的局部性,减少远距离访问
    2)尽可能减少通信开销,尤其要减少大量数据的传送
    3)适当考虑节点负载的平衡

    多副本可以提高访问的局部性和系统的可靠性,但在更新时,必须维持多副本的一致性。一般可采取如下策略:
    1)在事务提交前更新全部副本

    2)立即更新所有有效副本,失效节点的副本留待修复后更新

    3)主副本法。
    指定一个副本为主副本,事务提交前先更新它,其余副本在事务提交后根据主副本的广播内容进行更新。这种策略的副作用是可能存在不一致性。读取时如果读到主副本没有问题,如果读其他副本就可能读到不一致的数据。解决办法是每个副本附一个版本号,读取时与主副本的版本号进行比较。

    4)快照法
    只设置一个副本,然后多个数据快照分布在其他节点。读取数据时,可以读副本,也可以读快照,由用户自行决定。

    更新时,仅更新副本,快照周期性更新或用命令强制更新。快照在某些情况下是允许的,甚至是要求的。

    3、查询树分解
    后序遍历法查询树(查询树是个二叉树?),理论比较晦涩,主要作用是优化分布式数据库的连接策略。

    4、半连接和直接连接
    1)半连接
    半连接就是连接操作的时候,不将整个关系或片段的数据传送到对方,而是通过投影和选择,只传送匹配的元组(即数据行),以减少数据传输量。不过这样增加了连接次数,以及投影和选择操作。实际应用中,是否要采取半连接,需要经过权衡。

    半连接操作主要着眼于减少通信开销。

    2)直接连接
    直接连接操作相对于半连接操作而言更为重视局部处理代价,却较少考虑传输代价。简单而言,其思想是将所有片段都传递到一组站点中,由这些站点处理,并得出结果。

    【总结】
    降低通信代价是分布式数据库优化的关键

    五、分布式数据库VS集中式数据库

    分布式数据库在结构上与集中式数据库存在差异。什么差异?集中式数据库是单机版,数据都放在一台机器里,而分布式数据库的数据则散布于网络中。这样的话,分布式数据库查询起来,很有可能需要考察多个节点的数据。那么怎么优化呢?

    可以说,集中式数据库与分布式数据库查询优化的侧重点不一样。集中式数据库优化主要考虑CPU和IO;而分布式还需要考虑通信代价。相对于CPU和IO的处理速度而言,通信的效率最低,因此,降低通信代价是分布式数据库优化的关键。

    六、分布式数据库和分布式文件系统

    分布式文件系统存储的数据是无结构化的,如视频,照片,这些数据以对象方式存储,数据之间没有关系。 这样的数据称为Blob(Binary Large Object二进制大对象),系统内部按chunk(数据块)来组织这些数据,一个chunk包含多个Blob。 并将这些数据块分散到存储集群。分布式数据库,就是将数据库(如Mysql)分散到集群,数据间是有关系的。

    可以说,分布式文件系统和分布式数据库系统并没有什么直接的关系。但数据库系统也可以居于分布式文件系统进行存储,提高存储效率,可靠性等。

    分布式计算框架与分布式文件系统

    分布式文件系统GFS、HDFS的比较

    展开全文
  • [数据库]数据库系统概论复习提纲
  • 数据库系统原理.ppt

    2022-04-27 16:11:07
    数据库系统原理.ppt
  • 数据库系统-数据库设计

    千次阅读 2022-04-11 17:47:49
    数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求。 数据库设计的特点 数据库设计是一项涉及多学科的综合性技术,又是一项...
  • 本文是笔者结合相关资料整理的数据库系统概论核心知识点,非常适合数据库初学者、期末及考研或计算机等级考试的学习者!
  • 数据库技术是应数据管理任务的需求而产生的,应用需求的驱动下,计算机硬件,软件发展的基础上,数据管理技术经历了人工管理,文件系统数据库系统三个阶段。一.人工管理阶段20世纪50年代中期以前,计算机...
  • 第四章——数据库安全性

    千次阅读 2022-02-04 16:37:11
    2.数据库中重要或敏感的数据被泄露 3.安全环境的脆弱性 《可信计算机系统评估准则关于可信数据库系统的解释》(TCSEC/Trusted Database Interpretation,TCSEC/TDI,即紫皮书)从4个方面来描述安全级别划分指标,即...
  • 数据库系统概论-并发控制

    千次阅读 2022-04-07 00:10:05
    数据库系统概论之并发控制相关基础概念
  • 磁盘中存取信息的最小单位是?

    万次阅读 2017-05-24 15:36:19
    从操作系统对硬盘的存取管理来看,存取信息的最小单位是簇,簇是一个逻辑概念,一个簇可以是2、4、8、16、32或64个连续的扇区。一个簇只能被一个文件占用,哪怕是只有1个字节的文件,磁盘上存储时也要占用一个簇,...
  • 数据库系统期末考试常考简答题
  • 数据库系统教程习题及详解
  • 数据库系统

    千次阅读 2022-03-19 11:21:31
    数据的共享性高,冗余度低且易扩展 数据独立性高 数据由DBMS统一管理 数据库管理系统(DBMS):DBMS在数据库建立、运行和维护时对数据进行统一控制,以保证数据的完整性和安全性,并多用户同时使用数据库时进行...
  • 数据库1_1——数据库系统概述

    千次阅读 2020-04-15 10:16:32
    数据库系统概述1.1 数据库的四个基本概念1.1.1 数据(Data)1.1.2 数据库(Database)1.1.3 数据库管理系统(DBMS)1.1.3.1 定义与作用1.1.3.2 DBMS的主要功能:建存管改联a. 数据定义功能:b. 数据组织,存储和...
  • 数据库系统概论(第5版)自整理详细笔记——第1章(1.1数据库系统概论)。整理加制作了5个小时,希望这篇笔记能够帮助到你我。
  • 数据库系统中数据共享不能是无条件的共享。 数据库的安全性是指保护数据库以防止不合法使用所造成的数据泄露、更改或破坏。 系统安全保护措施是否有效是数据库系统主要的性能指标之一。 4.1数据库安全性描述 4.1.1...
  • 数据库系统的特点

    千次阅读 2022-04-07 15:14:54
    数据库是长期存储计算机内有组织的大量的...数据库管理系统在数据建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并多用户同时使用数据库时进行并发控制,发生故障后对数据库进行恢复。
  • 文件系统数据库系统的差别.doc
  • 数据库系统的安全

    2016-11-24 16:16:40
    数据库系统的安全

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 52,480
精华内容 20,992
关键字:

在数据库系统中数据存取的最小单位