精华内容
下载资源
问答
  • 、怎样建立数据库 建立数据库的方法有很多。用菜单建立数据库的步骤如下: 1.单击“文件(F)”、“新建(N)…”; 2.选择“数据库”文件类型,单击“新建文件”按钮,显示“创建”对话框。 3.选取保存位置和...

    一、怎样建立数据库

     

    建立数据库的方法有很多。用菜单建立数据库的步骤如下:

        1.单击“文件(F)”、“新建(N)…”;

        2.选择“数据库”文件类型,单击“新建文件”按钮,显示“创建”对话框。

        3.选取保存位置和保存类型(数据库),在数据库名文本框中,输入建立的数据库名称,如“销售库”,单击“保存”,此时,系统会显示数据库设计器。这时,建立的数据库里面没有任何内容,是一个空的数据库,在D盘“VFP实习”文件夹下可以浏览到多了三个文件——销售库.DBC、销售库.DCT、销售库.DCX 

     

    二、如何创建表

     

    在创建表时,可以在一个打开的数据库中创建,也可先建立一个自由表,然后再把它添加到数据库中。无论是数据库表还是自由表,既可用表设计器创建,也可用表向导创建。下面分别介绍创建这两种表的方法。

     

    1.创建数据库表

     

    在创建表之前,先打开需要建立表的数据库。 “销售库”,单击“文件(F)”、“打开(O)…”、选择D盘“VFP实习”文件夹下的“销售库.DBC”,文件类型为*.DBC、“确定”。

    启动表设计器

        在这里,我们先建立一个数据库表,如: 销售明细表。 用菜单的方法启动:

        单击“文件(F)”、“新建(N)”、弹出“新建”对话框、选择“表”文件类型、“新建文件”按钮、弹出“创建”对话框、在“输入表名”文本框中,输入建立的数据库表名称:“销售明细表”、单击“保存”按钮、弹出表设计器。此时, 创建的表会自动成为数据库的一部分。

    输入“销售明细表”各字段

        在“字段名”列中输入“销售日期”、按Tab键,光标跳到“类型”列、单击右边的箭头,选择“日期型”、自动显示出宽度为“8、再按Tab键,直到光标再次移到“字段名”列、输入第二个字段名“销售单编号”,依次按照表的结构全部输入完、最后按“确定”按钮。

    此时显示一个消息框。询问是否向表中输入记录。这时VFP已创建一个新表(“销售明细表”),其表结构已建好。  如果现在就要输入数据,则回答“Y”,否则回答“N”。 

    2.创建自由表

        为了说明问题,用创建自由表的方法来创建“库存明细表”。 

        关闭所有的数据库

        创建自由表之前,首先要关闭所有的数据库,以确保创建的是自由表,否则还是数据库表。方法为:在命令窗口输入:close database或者直接关闭数据库窗口。

        启动表向导

        选择“文件”下拉菜单的“新建”、在弹出的“新建”对话框中选择文件类型为“表”选项,再单击“新建文件”按钮。

    3.向数据库中添加自由表

        向数据库中添加自由表实际上是建立表文件与数据库容器的双向链接关系:在数据库中保存指向表文件的前链,在表中保存指向数据库容器的后链。下面我们就以“库存明细表”表为例,介绍如何将自由表添加到一个指定的数据库中。

         打开数据库。例如,打开“销售库”。

        选择系统菜单中的“数据库”选项下的“添加表”命令。这时出现一个“打开”对话框。

        在“打开”对话框中,选择要添加的自由表(即“库存明细表”),然后单击“确定”按钮,这时关闭“打开”对话框,并把选定的自由表添加到指定的数据库中。

        在执行上述步骤以后,从打开的“数据库设计器”中可以看出,库中增加了一个“库存明细表”表,且是“销售库”的数据库表。

    三、表建好了怎样输入表数据

     

    创建表只是创建了一个表结构,并没有完成添加数据的工作,这时表还只是一个空表,必须通过添加记录的操作才能在表中存储数据。将表文件结构存盘后,如果需立即输入数据,我们就单击输入记录数据对话框中的“是”按钮,输入部分记录。

     

    或者,打开已有的表,用下列方式之一输入表数据:

    1.选择菜单栏上的“显示(V)”下拉菜单中的“追加方式(A)”。

    2.在命令窗口输入append 命令。

    注意,数据输入的要点:

    1.表的数据可通过记录编辑窗口按记录逐个输入。若输入信息不足字段宽度,需按回车键或Tab键才能把光标移到下一个字段。

    2.逻辑型字段宽度为1,它只能接受TYFN4个字母之一(不论大小写)。而日期型数据必须与系统日期格式相符。若需设置系统日期格式为美国日期格式mm/dd/yy,只要在命令窗口中键入命令SET DATE MDY便可。

    3.当光标定位于备注型或通用型字段的“memo”或“gen”处时,若当前记录的该字段没有值要输入,按回车键便可跳过。

    4.一个记录输入完后,光标自动移到下一记录和开始位置等待输入。输入完数据后,可按CtrlW键或窗口的关闭按钮来保存,也可按CtrlQESC键放弃保存。备注型字段值被保存到与表文件同名而扩展名为FPT的备注文件中。

    其中,备注型字段的数据输入操作方法如下:

    1.把光标定位于“memo”或“gen”。

    2.CtrlPgDnCtrlPgUpCtrlHome等组合键中的一个或双击鼠标出现相应的编辑窗口。

    3.编辑、输入数据后,按CtrlW或按关闭按键储存数据并返回数据输入窗口;如果按CtrlQEsc键则放弃当前所输入的信息而返回。

    4.在备注型或通用型字段数据输入后,该记录的“memo”或“gen”中的第一个字母变为大写“Memo”或“Gen”。

     

     

    展开全文
  • 下面有个创建按钮,效果就是,点击一下按钮,下面创建出一个跟宽高参数对应的div盒子,并且可以自由移动,完了下面有个保存按钮,点击保存之后,刚刚新建的这个div要保存在数据库。请问各位大神,这种技术是如何实现...
  • 为什么我们说区块链系统其实是一个分布式数据库系统? ACID 传统的数据库都满足ACID原则。我们首先来看一个“事务”(transaction)的概念。事务是一个操作序列,是一个不可分割的基本工作单位。在一个传统的数据库...
    想知道更多关于区块链技术知识,请百度【链客区块链技术问答社区】
    
    链客,有问必答!
    

    在这里插入图片描述

    区块链系统和CAP、ACID和BASE

    为什么我们说区块链系统其实是一个分布式数据库系统?

    ACID

    传统的数据库都满足ACID原则。我们首先来看一个“事务”(transaction)的概念。事务是一个操作序列,是一个不可分割的基本工作单位。在一个传统的数据库管理系统(DBMS)中,事务应该具有四个特性:

    原子性(Atomicity)

    一致性(Consistency)

    隔离性(Isolation)

    持久性(Durability)

    取这四个英文单词的首字母缩写,我们得到的是ACID。

    原子性指事务是一个不可分割的最基本工作单位,事务中的操作要么都执行,要么都不执行;一致性是指数据库的完整性约束不会被任何事务的发生破坏,也就是说数据库的事务不能破坏数据的完整性;隔离性是说多个事务并发访问时,事务之间是被隔离开的,一个事务不应该影响其他事务的运行效果;持久性则意味着在事务完成以后,该事务所对数据库做的更改便被永久保存在数据库之中,即使系统本身发生了事故也不会更改。

    从ACID的四个特性来看,我们发现其实比特币区块链系统几乎具有这些特点:

    一个区块要么被全部记录进入区块链,要么不被认可,不可能有中间状态;

    一个区块在加入区块链之后,原本区块链的系统依然保持完整性;

    每次只有一个区块可以被加入到区块链中,所以隔离性是当然的;

    而在区块被写入链条之后,新的区块链会被复制到所有的区块链节点上,被永久保存。

    在区块链系统上有一个特殊情况,如果两个不同的节点差不多同时申请挖币的奖励,那么它们中会有一个节点计算出的区块在最终会被抛弃,因而ACID特性中的D(持久性)其实是不满足的。

    BASE

    因为区块链节点处于地球各处,而这些节点又是由不同用户维护的,所以其实我们并不能保证每次访问区块链的系统时都能获取到数据,而这恰恰又对应了互联网时代分布式数据系统的一个特性,可以称之为为BASE。BASE是一个很怪异的词语的缩写:Basically Available,Soft-state,Eventual Consistency(基本上是可访问的、软状态、最终一致性)。

    在BASE理念中,基本可用是指系统在出现不可预知的故障时,允许损失部分可用性;软状态是指允许系统中的数据存在中间状态,不过该中间状态的存在并不会影响系统的整体可用性;最终一致性指的是所有的数据副本,在经过一段时间的同步之后,最终都能够达到一致。

    和ACID概念的强一致性相比,BASE理念面向的是可扩展的分布式系统,BASE通过牺牲强一致性来获得可用性,并允许数据在一段时间内是不一致的。不过两者的共同点是最终会达到一致状态。我们可以认为区块链系统符合分布式数据系统的BASE理念。

    CAP

    我们再来看区块链系统和分布式数据系统上的CAP理论之间的关系。在分布式数据系统中,有三种重要的属性,分别是:

    一致性(Consistency):数据一致性,任何一个读操作总是能读取到之前完成的写操作结果,也就是在分布式环境中,多点的数据是一致的。

    可用性(Availability):好的响应性能,每一个操作总是能够在确定的时间内返回,也就是系统随时都是可用的。

    分区容忍性(Tolerance of network Partition):可靠性,在出现网络分区(比如断网)的情况下,分离的系统也能正常运行。

    CAP原理解释了关于这三种属性的关系。CAP原理的意思是:一个分布式系统不能同时满足一致性、可用性和分区容错性这三个需求,最多只能同时满足两个。CAP原理是由美Berkerly的Brewer教授提出。

    如图1所示,CAP原理指出一致性、可用性、分区容忍性不可三者兼顾。因此在进行分布式架构设计时,必须做出取舍。而对于分布式数据系统,分区容忍性是基本要求,否则就失去了价值。因此设计分布式数据系统,就是在一致性和可用性之间取一个平衡。

    牺牲一致性而换取高可用性,也是大多数分布式数据库产品的方向。

    笔者在比特币区块链系统中看到了“一致性”被牺牲的情况。当一个新的区块被部分节点接受时,如果用户访问的是还没有更新的节点,那么用户获取的数据是不一致的,所以从分布式数据系统的角度来看,比特币区块链系统其实是一个AP系统,也就是说,它保持了可用性和分区容忍性,不过放弃了一致性。

    区块链有哪些特征

    在区块链进入大家的视野之前,分布式数据系统也一直是学术界关注的一个方向。不过在区块链概念出现之后,大家发现原来分布式系统还可以有新的处理方式。

    基于区块链的数据系统特征

    去中心化或者多中心化(Distributed or Decentralized)

    区块链最大的特性就是使用分布式计算和存储,从而减少甚至消除中心化的硬件或管理机构。在区块链上,任意节点的权利和义务都是均等的,系统中的数据块由整个系统中具有维护功能的节点来共同维护。

    开放性(Open)

    系统是开放的,除了交易各方的私有信息被加密外,区块链的数据对所有人公开,任何(有权限的)人都可以通过公开的接口查询区块链数据和开发相关应用,因此整个系统信息高度透明。

    自治性(Autonomous)

    区块链采用基于协商一致的规范和协议(比如一套公开透明的算法)使得整个系统中的所有节点能够在去信任的环境自由安全地交换数据,使得对“人”的信任改成了对机器的信任,任何人为的干预都不起作用。

    信息不可篡改(Untemperable)

    一旦信息经过验证并添加至区块链,就会永久存储起来,单个节点上对数据库的修改是无效的,因此区块链的数据稳定性和可靠性极高。

    匿名性(Anonymous)

    由于节点之间的交换遵循固定的算法,其数据交互是无需信任的(区块链中的程序规则会自行判断活动是否有效),因此交易对手无须通过公开身份的方式让对方对自己产生信任。

    区块链的核心在于数据

    区块链和大数据是两个在过去几年中都得到飞速发展的技术。2016年第46届世界经济论坛达沃斯年会论坛的主题为“掌控第四次工业革命”,包括人工智能、无人驾驶、区块链、量子计算等在内的科技前沿领域在会议中被反复提及。

    目前区块链能够承载的信息数量是有限的,离我们要用“大数据”的标准来衡量的地步还差得很远,不过千里之行始于足下,要一步一步地来。

    如果要让区块链承载大数据,那么目前笔者所看到的这些区块链系统都还不具备这个能力。

    我们来看区块链系统三个和大数据有矛盾、需要改进的特点:

    分布式的

    有隐私的

    安全的

    区块链系统是分布式的,而大数据讲究的是可规模化的、可量化的数据;区块链系统是匿名的、有隐私的,而大数据在意的是个性化;区块链系统是安全的,信息是相对独立的,而大数据在意的是信息的整合分析。

    区块链系统本身就是一个数据库,而我们所说的大数据指的是对数据的深度分析和挖掘,也就是说,数据分析和数据挖掘需要构建在区块链系统之上,把数据的价值发挥出来。

    如果要做到以数据为基础来做决策,那么区块链的大数据化是区块链系统必须要完成的一个步骤。

    区块链系统的局限性和门槛

    微软亚洲研究院系统算法组首席研究员Thomas Moscibroda在2017首届科技金融国际峰会上提到了区块链的效率和隐私问题。在区块链中,每一个人都在分享自己的数据,而且每一个交易记录都需要被所有人核实、记录和存储。一方面,这个过程会使区块链对传统数据库而言更慢。另一方面,区块链双方的交易过程中第三方必须知晓,且会去核实这个交易的合法性和正当性,而每一个人都能知道交易双方的中间数据,这也带来了隐私问题。

    String Labs联合创始人Tom Ding认为区块链技术其实是一项有相当门槛的技术,在整个世界上可能也只有为数不多的团队有能力开发底层区块链系统。

    Alphabet的DeepMind Health部门已经宣布计划使用一种与分布式账本一样的系统来监视目前正在被使用的患者数据。他们的工具命名为Verifiable Date Audit(VDA)。Alphabet声称VDA并不是区块链,而是类区块链。VDA借鉴了很多来自比特币区块链的功能,包括不可更改性。同时还提供某种程度的透明度,所以第三方机构可以验证这些数据。

    R3的技术主管Richard Brown针对他们的产品Corda是这样评述的:“Corda是一个分布式账本平台,它很大程度上受到并吸取了区块链系统的优势,去掉了很多不适用于银行业场景的区块链设计。”

    笔者和包括Thomas在内的一些专家做过深入探讨,我们的共同观点是从架构上来看,在未来的3年甚至更长的时间内,包括比特币和以太坊区块链在内的主流区块链系统都无法有效提升技术应用到有高频数据录入需求的场景上。当然,如果一个区块链系统未来的场景在有足够大的用户和数据量的情况下每秒的交易量也不会到达千这个数量级的话,还有实现的可能。

    关于区块链数据库

    笔者一直坚持的观点是不以实际应用为目的的技术都是耍流氓,那么如何让区块链系统真正商用化?受到微软和Google各位同学的启发,我们认为如果要真正商用化区块链系统,唯一的出路就是区块链数据库(Blockchain DataBase)。

    我们在设计的区块链数据库兼有区块链系统和数据库系统两个系统的优势。

    正如笔者在前面说过,区块链系统是符合BASE理念的,不过并不满足ACID。所以我们可以选择一个不满足ACID,而符合BASE理念的数据库来做底层数据架构。对于了解数据库系统的同学而言,可以选择的数据库底层架构已经呼之欲出了。

    而与传统的数据库系统相比,区块链数据库将能够拥有原先系统所不具备的特性,也就是笔者在前文中所讲述的区块链系统的各种特性。

    区块链数据库中的数据

    比特币区块链的可扩展性是一个大问题。如果不提升数据块的大小,整体的交易量则无法提升,而如果提升了数据块的大小,因为每个客户端的节点都会有数据库的完整拷贝,数据存储会是一个非常头疼的事情。

    不同于传统的区块链系统,区块链数据库将会拥有数据库系统的可扩展性和性能:

    数据可以超过1TB,甚至到达PB的数量级

    并发写入的数量级可以达到10-30万笔/秒

    单条事务数据没有上限

    区块链数据库的共识模块

    区块链数据库中共识模块的作用是让系统中所有的数据节点都能够保持一致。如果一个节点的区块链上添加了一条新的交易,那么数据库中所有其他节点也会把同一个交易加入到各自的区块链上。

    共识模块的关键点就在于保持整个系统中所有交易顺序的一致性。

    共识算法在以太坊和比特币区块链中的达成是通过工作量证明(POW)或者权益证明(POS),而IBM Hyperledger和其他一些想要提升效率的区块链系统采用的是PBFT(Practical Byzantine Fault Tolerance)协议。后者的效率会高很多,不过网络传输的数据会根据节点数的上升而成倍增加。

    展开全文
  • 文章目录、 InnoDB存储引擎的空间二、 创建数据库表 、 InnoDB存储引擎的空间 查看数据库空间 利用如下命令可以查看数据库空间。 mysql> show variables like 'InnoDB_data%'; 空间有四...


    一、 InnoDB存储引擎的表空间

    1. 查看数据库的表空间

    利用如下命令可以查看数据库的表空间。

    	mysql> show variables like 'InnoDB_data%'; 
    

           (1)表空间有四个文件组成:ibdata1、ibdata2、ibdata3、ibdata4,每个文件的大小为10M,当每个文件都满了的时候,ibdata4会自动扩展;

           (2)如果用 autoextend 选项描述最后一个数据文件,当 InnoDB 用尽所有表自由空间后将会自动扩充最后一个数据文件,每次增量为 8 MB。

           (3)不管是共享表空间和独立表空间,都会存在InnoDB_data_file文件,因为这些文件不仅仅要存放数据,而且还要存储事务回滚(undo)信息。

    2. 共享表空间和独立表空间之间的转换

    (1)查看当前数据库的表空间管理类型。可以通过如下命令查看。

    mysql> show variables like "InnoDB_file_per_table";
    

    (2)修改数据库的表空间管理方式。
           修改InnoDB_file_per_table的参数值(InnoDB_file_per_table=1 为使用独占表空间,InnoDB_file_per_table=0 为使用共享表空间)即可,但是修改不能影响之前已经使用过的共享表空间和独立表空间;

    (3)共享表空间转化为独立表空间的方法(参数InnoDB_file _per_table=1需要设置)。

    (4)单个表的转换操作可以用如下命令实现:

    alter table  table_name  engine = innodb;
    

    二、 创建数据库表

    1. 创建表的语法结构

           表决定了数据库的结构, 表是存放数据的地方,一个库需要什么表,各数据库表中有什么样的列,都是要合理设计的。
    创建表的语法结构如下。

    create [temporary]table[if not exists]table_name
    [([column_definition], …|[index_definition])]
    [table_option][select_statement];

           其中,column_definition:字段的定义。包括指定字段名、数据类型、是否允许空值,指定默认值、主键约束、唯一性约束、注释字段名、是否为外键,以及字段类型的属性等。字段的定义具体格式描述如下:

    col_name type [not null | null] [default default_value]
    [auto_increment] [unique [key] | [primary] key] [comment ‘string’]
    [reference_definition]

    2. 利用SQL语句创建数据表(创建的数据表全部是引用的例子,方便观察)附:说明

    (1)打开教务管理数据库teaching,按照如下所示的学生信息表结构创建student表。

    列序号 字段名 类型 取值说明 列含义
    1 studentno char(11) 主键 学生学号
    2 sname char(8) 学生姓名
    3 sex enum (2) 性别
    4 birthdate date 出生日期
    5 entrance int(3) 入学成绩
    6 phone varchar(12) 电话
    7 Email varchar(20) 电子信箱

    添加代码:注意不能忘记括号和分号,可以写成一行,也可以写成多行,每一句用逗号隔开。分号为整个代码结束

    mysql> create table if not exists student 
    (
    studentno  char(11) not null comment'学号', 
    sname char(8) not null comment'姓名', 
    sex enum('男', '女') default '男' comment'性别', 
    birthdate date not null comment'出生日期', 
    entrance int(3)  null comment'入学成绩',		 
    phone varchar(12) not null comment'电话', 
    Email varchar(20) not null comment'电子信箱',
    primary key (studentno)
    );
    

    运行结果如图所示:
    在这里插入图片描述
    (2)利用create table命令建立建立课程信息表course.

    列序号 字段名 类型 取值说明 列含义
    1 courseno char(6) 主键 课程编号
    2 cname char(20) 课程名称
    3 type char(8) 类别
    4 period int(2) 总学时
    5 exp int(2) 实验学时
    6 term int(2) 开课学期

    添加代码:

    mysql> create table if not exists course 
    (
    courseno  char(6) not null, 
    cname  char(6) not null, 
    type char(8) not null,  
    period int(2) not null, 
    exp int(2) not null,
    term int(2) not null,
    primary key (courseno) ); 
    

    运行结果如图所示:
    在这里插入图片描述
    (3)利用create table命令建立学生分数表score。该表中主键由两个列构成

    列序号 字段名 类型 取值说明 列含义
    1 studentno char(11) 主键 学号
    2 courseno char(6) 主键 课程编号
    3 daily float(3,1) 平时成绩
    4 final float(3,1) 期末成绩

    添加代码:

    mysql> create table if not exists score
    (studentno  char(11) not null, 
    courseno  char(6) not null, 
    daily float(3,1) default 0, 
    final float(3,1) default 0,
    primary key (studentno , courseno) 
    ); 
    

    运行结果如图所示:
    在这里插入图片描述
    (4)利用create table命令建立教师信息表teacher.

    列序号 字段名 类型 取值说明 列含义
    1 teacherno char(6) 主键 教师编号
    2 tname char(8) 教师姓名
    3 major char(10) 专业
    4 prof char(10) 职称
    5 department char(16) 院系部门

    添加代码:

    mysql> create table if not exists teacher 
    (teacherno  char(6) not null comment '教师编号', 
    tname  char(8) not null comment'教师姓名', 
    major  char(10) not null comment '专业', 
    prof char(10) not null comment '职称',
    department char(16) not null comment '部门',
    primary key (teacherno)
    ); 
    

    运行结果如图所示:
    在这里插入图片描述
    (5)为了完善teaching数据库的表间联系,创建纽带表teach_course。

    列序号 字段名 类型 取值说明 列含义
    1 teacherno nchar(6) 主键 教师编号
    2 courseno nchar(6) 主键 课程编号

    添加代码:

    mysql> create table if not exists teach_course 
    (teacherno char(6) not null, 
    courseno  char(6) not null, 
    primary key (teacherno,courseno) );
    

    运行结果如图所示:
    在这里插入图片描述

    • 说明:
      (1)主键设置。primary key表示设置该字段为主键。
      (2)添加注释。comment’学号’表示对studentno字段增加注释为“学号”
      (3)字段类型的选择。sex enum(‘男’,‘女’)表示sex字段的字段类型是enum,取值范围为’男’和’女’。对于取值固定的字段可以设置数据类型为enum。例如,在course表的type字段表示的是课程的类型,一般是固定的几种类型。因此,也可以把该字段的定义写成:type enum (‘必修课’,’ 选修课’) default ‘必修课’。
      (4)默认值的设置。default’男’表示默认值为“男”。
      (5)设置精度。Score表中的daily float(3,1)表示精度为4 ,小数位1位。
      (6)如果没有指定是null或是not null,则列在创建时假定为null。

    3.设置表的属性值自动增加

           (1)在MySQL数据表中,一个整数列可以拥有一个附加属性auto_increment。其主要用于为表中插入的新记录自动生成唯一的序列编码

           (2)默认的情况下,该字段值是从1开始自增,也可自定义开始值。一个数据表只能有一个字段使用auto_increment约束,且该字段必须为主键的一部分。可以是任何整数类型(tinyint、samllint、int、bigint等)。

    设置属性值字段增加的基本语法规则如下:

    属性名 数据类型 auto_increment

    如:在teaching库中,创建选课表sc,选课号sc_no是自动增量,选课时间默认为当前时间,其他字段分别是学号、课程号和教师号。
    代码:

    mysql>create table sc
    (sc_no int(6) not null auto_increment, 
    studentno  char(11) not null, 
    courseno  char(6) not null, 
    teacherno char(6) not null,  
    sc_time timestamp not null default now(), 
    primary key (sc_no) );
    

    运行结果如图所示:
    在这里插入图片描述


    展开全文
  • 如何设计一个优秀的数据库

    千次阅读 2013-12-26 21:36:50
    一个成功的管理系统,是由:[50% 的业务 + 50% 的软件] 所组成,而 50% 的成功软件又有 [25% 的数据库 + 25% 的程序] 所组成,数据库设计的好坏是一个关键。如果把企业的数据比做生命所必需的血液,那么数据库的设计...

    一个成功的管理系统,是由:[50% 的业务 + 50% 的软件] 所组成,而 50% 的成功软件又有 [25% 的数据库 + 25% 的程序] 所组成,数据库设计的好坏是一个关键。如果把企业的数据比做生命所必需的血液,那么数据库的设计就是应用中最重要的一部分。

    有关数据库设计的材料汗牛充栋,大学学位课程里也有专门的讲述。不过,就如我们反复强调的那样,再好的老师也比不过经验的教诲。所以我归纳历年来所走的弯路及体会,并在网上找了些对数据库设计颇有造诣的专业人士给大家传授一些设计数据库的技巧和经验。精选了其中的 60 个最佳技巧,并把这些技巧编写成了本文,为了方便索引其内容划分为 5 个部分:

    • 第 1 部分 - 设计数据库之前:这一部分罗列了 12 个基本技巧,包括命名规范和明确业务需求等。
    • 第 2 部分 - 设计数据库表:总共 24 个指南性技巧,涵盖表内字段设计以及应该避免的常见问题等。
    • 第 3 部分 - 选择键:怎么选择键呢?这里有 10 个技巧专门涉及系统生成的主键的正确用法,还有何 时以及如何索引字段以获得最佳性能等。
    • 第 4 部分 - 保证数据完整性:讨论如何保持数据库的清晰和健壮,如何把有害数据降低到最小程度。
    • 第 5 部分 - 各种小技巧:不包括在以上 4 个部分中的其他技巧,五花八门,有了它们希望你的数据库开发工作会更轻松一些。

    第 1 部分 - 设计数据库之前

    考察现有环境

    在设计一个新数据库时,你不但应该仔细研究业务需求而且还要考察现有的系统。大多数数据库项目都不是从头开始建立的;通常,机构内总会存在用来满足特定需求的现有系统(可能没有实现自动计算)。显然,现有系统并不完美,否则你就不必再建立新系统了。但是对旧系统的研究可以让你发现一些可能会忽略的细微问题。一般来说,考察现有系统对你绝对有好处。

    定义标准的对象命名规范

    一定要定义数据库对象的命名规范。对数据库表来说,从项目一开始就要确定表名是采用复数还是单数形式。此外还要给表的别名定义简单规则(比方说,如果表名是一个单词,别名就取单词的前 4 个字母;如果表名是两个单词,就各取两个单词的前两个字母组成 4 个字母长的别名;如果表的名字由 3 个单词组成,你不妨从头两个单词中各取一个然后从最后一个单词中再取出两个字母,结果还是组成 4 字母长的别名,其余依次类推)对工作用表来说,表名可以加上前缀 WORK_ 后面附上采用该表的应用程序的名字。表内的列[字段]要针对键采用一整套设计规则。比如,如果键是数字类型,你可以用 _N 作为后缀;如果是字符类型则可以采用 _C 后缀。对列[字段]名应该采用标准的前缀和后缀。再如,假如你的表里有好多"money"字段,你不妨给每个列[字段]增加一个 _M 后缀。还有,日期列[字段]最好以 D_ 作为名字打头。

    检查表名、报表名和查询名之间的命名规范。你可能会很快就被这些不同的数据库要素的名称搞糊涂了。假如你坚持统一地命名这些数据库的不同组成部分,至少你应该在这些对象名字的开头用 Table、Query 或者 Report 等前缀加以区别。

    如果采用了 Microsoft Access,你可以用 qry、rpt、tbl 和 mod 等符号来标识对象(比如 tbl_Employees)。我在和 SQL Server 打交道的时候还用过 tbl 来索引表,但我用 sp_company (现在用 sp_feft_)标识存储过程,因为在有的时候如果我发现了更好的处理办法往往会保存好几个拷贝。我在实现 SQL Server 2000 时用 udf_ (或者类似的标记)标识我编写的函数。

    工欲善其事,必先利其器

    采用理想的数据库设计工具,比如:SyBase 公司的 PowerDesign,她支持 PB、VB、Delphe 等语言,通过 ODBC 可以连接市面上流行的 30 多个数据库,包括 dBase、FoxPro、VFP、SQL Server 等,今后有机会我将着重介绍 PowerDesign 的使用。

    获取数据模式资源手册

    正在寻求示例模式的人可以阅读《数据模式资源手册》一书,该书由 Len Silverston、W. H. Inmon 和 Kent Graziano 编写,是一本值得拥有的最佳数据建模图书。该书包括的章节涵盖多种数据领域,比如人员、机构和工作效能等。

    其他的你还可以参考:萨师煊 王珊著 数据库系统概论

    畅想未来,但不可忘了过去的教训

    我发现询问用户如何看待未来需求变化非常有用。这样做可以达到两个目的:首先,你可以清楚地了解应用设计在哪个地方应该更具灵活性以及如何避免性能瓶颈;其次,你知道发生事先没有确定的需求变更时用户将和你一样感到吃惊。

    一定要记住过去的经验教训!我们开发人员还应该通过分享自己的体会和经验互相帮助。即使用户认为他们再也不需要什么支持了,我们也应该对他们进行这方面的教育,我们都曾经面临过这样的时刻"当初要是这么做了该多好.."。

    在物理实践之前进行逻辑设计

    在深入物理设计之前要先进行逻辑设计。随着大量的 CASE 工具不断涌现出来,你的设计也可以达到相当高的逻辑水准,你通常可以从整体上更好地了解数据库设计所需要的方方面面。

    了解你的业务

    在你百分百地确定系统从客户角度满足其需求之前不要在你的 ER(实体关系)模式中加入哪怕一个数据表(怎么,你还没有模式?那请你参看技巧 9)。了解你的企业业务可以在以后的开发阶段节约大量的时间。一旦你明确了业务需求,你就可以自己做出许多决策了。

    一旦你认为你已经明确了业务内容,你最好同客户进行一次系统的交流。采用客户的术语并且向他们解释你所想到的和你所听到的。同时还应该用可能、将会和必须等词汇表达出系统的关系基数。这样你就可以让你的客户纠正你自己的理解然后做好下一步的 ER 设计。

    创建数据字典和 ER 图表

    一定要花点时间创建 ER 图表和数据字典。其中至少应该包含每个字段的数据类型和在每个表内的主外键。创建 ER 图表和数据字典确实有点费时但对其他开发人员要了解整个设计却是完全必要的。越早创建越能有助于避免今后面临的可能混乱,从而可以让任何了解数据库的人都明确如何从数据库中获得数据。

    有一份诸如 ER 图表等最新文档其重要性如何强调都不过分,这对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别名。对 SQL 表达式的文档化来说这是完全必要的。

    创建模式

    一张图表胜过千言万语:开发人员不仅要阅读和实现它,而且还要用它来帮助自己和用户对话。模式有助于提高协作效能,这样在先期的数据库设计中几乎不可能出现大的问题。模式不必弄的很复杂;甚至可以简单到手写在一张纸上就可以了。只是要保证其上的逻辑关系今后能产生效益。

    从输入输出下手

    在定义数据库表和字段需求(输入)时,首先应检查现有的或者已经设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。举个简单的例子:假如客户需要一个报表按照邮政编码排序、分段和求和,你要保证其中包括了单独的邮政编码字段而不要把邮政编码糅进地址字段里。

    报表技巧

    要了解用户通常是如何报告数据的:批处理还是在线提交报表?时间间隔是每天、每周、每月、每个季度还是每年?如果需要的话还可以考虑创建总结表。系统生成的主键在报表中很难管理。用户在具有系统生成主键的表内用副键进行检索往往会返回许多重复数据。这样的检索性能比较低而且容易引起混乱。

    理解客户需求

    看起来这应该是显而易见的事,但需求就是来自客户(这里要从内部和外部客户的角度考虑)。不要依赖用户写下来的需求,真正的需求在客户的脑袋里。你要让客户解释其需求,而且随着开发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。一个不变的真理是:"只有我看见了我才知道我想要的是什么"必然会导致大量的返工,因为数据库没有达到客户从来没有写下来的需求标准。而更糟的是你对他们需求的解释只属于你自己,而且可能是完全错误的。

    第 2 部分 - 设计表和字段

    检查各种变化

    我在设计数据库的时候会考虑到哪些数据字段将来可能会发生变更。比方说,姓氏就是如此(注意是西方人的姓氏,比如女性结婚后从夫姓等)。所以,在建立系统存储客户信息时,我倾向于在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止日等字段,这样就可以跟踪这一数据条目的变化。

    采用有意义的字段名

    有一回我参加开发过一个项目,其中有从其他程序员那里继承的程序,那个程序员喜欢用屏幕上显示数据指示用语命名字段,这也不赖,但不幸的是,她还喜欢用一些奇怪的命名法,其命名采用了匈牙利命名和控制序号的组合形式,比如 cbo1、txt2、txt2_b 等等。

    除非你在使用只面向你的缩写字段名的系统,否则请尽可能地把字段描述的清楚些。当然,也别做过头了,比如 Customer_Shipping_Address_Street_Line_1,虽然很富有说明性,但没人愿意键入这么长的名字,具体尺度就在你的把握中。

    采用前缀命名

    如果多个表里有好多同一类型的字段(比如 FirstName),你不妨用特定表的前缀(比如 CusLastName)来帮助你标识字段。

    时效性数据应包括"最近更新日期/时间"字段。时间标记对查找数据问题的原因、按日期重新处理/重载数据和清除旧数据特别有用。

    标准化和数据驱动

    数据的标准化不仅方便了自己而且也方便了其他人。比方说,假如你的用户界面要访问外部数据源(文件、XML 文档、其他数据库等),你不妨把相应的连接和路径信息存储在用户界面支持表里。还有,如果用户界面执行工作流之类的任务(发送邮件、打印信笺、修改记录状态等),那么产生工作流的数据也可以存放在数据库里。预先安排总需要付出努力,但如果这些过程采用数据驱动而非硬编码的方式,那么策略变更和维护都会方便得多。事实上,如果过程是数据驱动的,你就可以把相当大的责任推给用户,由用户来维护自己的工作流过程。

    标准化不能过头

    对那些不熟悉标准化一词(normalization)的人而言,标准化可以保证表内的字段都是最基础的要素,而这一措施有助于消除数据库中的数据冗余。标准化有好几种形式,但 Third Normal Form(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简单来说,3NF 规定:

    • 表内的每一个值都只能被表达一次。
    • 表内的每一行都应该被唯一的标识(有唯一键)。
    • 表内不应该存储依赖于其他键的非键信息。

    遵守 3NF 标准的数据库具有以下特点:有一组表专门存放通过键连接起来的关联数据。比方说,某个存放客户及其有关定单的 3NF 数据库就可能有两个表:Customer 和 Order。Order 表不包含定单关联客户的任何信息,但表内会存放一个键值,该键指向 Customer 表里包含该客户信息的那一行。

    更高层次的标准化也有,但更标准是否就一定更好呢?答案是不一定。事实上,对某些项目来说,甚至就连 3NF 都可能给数据库引入太高的复杂性。

    为了效率的缘故,对表不进行标准化有时也是必要的,这样的例子很多。曾经有个开发餐饮分析软件的活就是用非标准化表把查询时间从平均 40 秒降低到了两秒左右。虽然我不得不这么做,但我绝不把数据表的非标准化当作当然的设计理念。而具体的操作不过是一种派生。所以如果表出了问题重新产生非标准化的表是完全可能的。

    不活跃或者不采用的指示符

    增加一个字段表示所在记录是否在业务中不再活跃挺有用的。不管是客户、员工还是其他什么人,这样做都能有助于再运行查询的时候过滤活跃或者不活跃状态。同时还消除了新用户在采用数据时所面临的一些问题,比如,某些记录可能不再为他们所用,再删除的时候可以起到一定的防范作用。

    使用角色实体定义属于某类别的列[字段]

    在需要对属于特定类别或者具有特定角色的事物做定义时,可以用角色实体来创建特定的时间关联关系,从而可以实现自我文档化。

    这里的含义不是让 PERSON 实体带有 Title 字段,而是说,为什么不用 PERSON 实体和 PERSON_TYPE 实体来描述人员呢?比方说,当 John Smith, Engineer 提升为 John Smith, Director 乃至最后爬到 John Smith, CIO 的高位,而所有你要做的不过是改变两个表 PERSON 和 PERSON_TYPE 之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的 PERSON_TYPE 表就包含了所有 PERSON 的可能类型,比如 Associate、Engineer、Director、CIO 或者 CEO 等。

    还有个替代办法就是改变 PERSON 记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的具体时间。

    采用常用实体命名机构数据

    组织数据的最简单办法就是采用常用名字,比如:PERSON、ORGANIZATION、ADDRESS 和 PHONE 等等。当你把这些常用的一般名字组合起来或者创建特定的相应副实体时,你就得到了自己用的特殊版本。开始的时候采用一般术语的主要原因在于所有的具体用户都能对抽象事物具体化。

    有了这些抽象表示,你就可以在第 2 级标识中采用自己的特殊名称,比如,PERSON 可能是 Employee、Spouse、Patient、Client、Customer、Vendor 或者 Teacher 等。同样的,ORGANIZATION 也可能是 MyCompany、MyDepartment、Competitor、Hospital、Warehouse、Government 等。最后 ADDRESS 可以具体为 Site、Location、Home、Work、Client、Vendor、Corporate 和 FieldOffice 等。

    采用一般抽象术语来标识"事物"的类别可以让你在关联数据以满足业务要求方面获得巨大的灵活性,同时这样做还可以显著降低数据存储所需的冗余量。

    用户来自世界各地

    在设计用到网络或者具有其他国际特性的数据库时,一定要记住大多数国家都有不同的字段格式,比如邮政编码等,有些国家,比如新西兰就没有邮政编码一说。

    数据重复需要采用分立的数据表

    如果你发现自己在重复输入数据,请创建新表和新的关系。

    每个表中都应该添加的 3 个有用的字段

    • dRecordCreationDate,在 VB 下默认是 Now(),而在 SQL Server 下默认为 GETDATE()
    • sRecordCreator,在 SQL Server 下默认为 NOT NULL DEFAULT USER
    • nRecordVersion,记录的版本标记;有助于准确说明记录中出现 null 数据或者丢失数据的原因

    对地址和电话采用多个字段

    描述街道地址就短短一行记录是不够的。Address_Line1、Address_Line2 和 Address_Line3 可以提供更大的灵活性。还有,电话号码和邮件地址最好拥有自己的数据表,其间具有自身的类型和标记类别。

    过分标准化可要小心,这样做可能会导致性能上出现问题。虽然地址和电话表分离通常可以达到最佳状态,但是如果需要经常访问这类信息,或许在其父表中存放"首选"信息(比如 Customer 等)更为妥当些。非标准化和加速访问之间的妥协是有一定意义的。

    使用多个名称字段

    我觉得很吃惊,许多人在数据库里就给 name 留一个字段。我觉得只有刚入门的开发人员才会这么做,但实际上网上这种做法非常普遍。我建议应该把姓氏和名字当作两个字段来处理,然后在查询的时候再把他们组合起来。

    我最常用的是在同一表中创建一个计算列[字段],通过它可以自动地连接标准化后的字段,这样数据变动的时候它也跟着变。不过,这样做在采用建模软件时得很机灵才行。总之,采用连接字段的方式可以有效的隔离用户应用和开发人员界面。

    提防大小写混用的对象名和特殊字符

    过去最令我恼火的事情之一就是数据库里有大小写混用的对象名,比如 CustomerData。这一问题从 Access 到 Oracle 数据库都存在。我不喜欢采用这种大小写混用的对象命名方法,结果还不得不手工修改名字。想想看,这种数据库/应用程序能混到采用更强大数据库的那一天吗?采用全部大写而且包含下划符的名字具有更好的可读性(CUSTOMER_DATA),绝对不要在对象名的字符之间留空格。

    小心保留词

    要保证你的字段名没有和保留词、数据库系统或者常用访问方法冲突,比如,最近我编写的一个 ODBC 连接程序里有个表,其中就用了 DESC 作为说明字段名。后果可想而知!DESC 是 DESCENDING 缩写后的保留词。表里的一个 SELECT * 语句倒是能用,但我得到的却是一大堆毫无用处的信息。

    保持字段名和类型的一致性

    在命名字段并为其指定数据类型的时候一定要保证一致性。假如字段在某个表中叫做"agreement_number",你就别在另一个表里把名字改成"ref1"。假如数据类型在一个表里是整数,那在另一个表里可就别变成字符型了。记住,你干完自己的活了,其他人还要用你的数据库呢。

    仔细选择数字类型

    在 SQL 中使用 smallint 和 tinyint 类型要特别小心,比如,假如你想看看月销售总额,你的总额字段类型是 smallint,那么,如果总额超过了 $32,767 你就不能进行计算操作了。

    删除标记

    在表中包含一个"删除标记"字段,这样就可以把行标记为删除。在关系数据库里不要单独删除某一行;最好采用清除数据程序而且要仔细维护索引整体性。

    避免使用触发器

    触发器的功能通常可以用其他方式实现。在调试程序时触发器可能成为干扰。假如你确实需要采用触发器,你最好集中对它文档化。

    包含版本机制

    建议你在数据库中引入版本控制机制来确定使用中的数据库的版本。无论如何你都要实现这一要求。时间一长,用户的需求总是会改变的。最终可能会要求修改数据库结构。虽然你可以通过检查新字段或者索引来确定数据库结构的版本,但我发现把版本信息直接存放到数据库中不更为方便吗?

    给文本字段留足余量

    ID 类型的文本字段,比如客户 ID 或定单号等等都应该设置得比一般想象更大,因为时间不长你多半就会因为要添加额外的字符而难堪不已。比方说,假设你的客户 ID 为 10 位数长。那你应该把数据库表字段的长度设为 12 或者 13 个字符长。这算浪费空间吗?是有一点,但也没你想象的那么多:一个字段加长 3 个字符在有 1 百万条记录,再加上一点索引的情况下才不过让整个数据库多占据 3MB 的空间。但这额外占据的空间却无需将来重构整个数据库就可以实现数据库规模的增长了。身份证的号码从 15 位变成 18 位就是最好和最惨痛的例子。

    列[字段]命名技巧

    我们发现,假如你给每个表的列[字段]名都采用统一的前缀,那么在编写 SQL 表达式的时候会得到大大的简化。这样做也确实有缺点,比如破坏了自动表连接工具的作用,后者把公共列[字段]名同某些数据库联系起来,不过就连这些工具有时不也连接错误嘛。举个简单的例子,假设有两个表:

    Customer 和 Order。Customer 表的前缀是 cu_,所以该表内的子段名如下:cu_name_id、cu_surname、cu_initials 和cu_address 等。Order 表的前缀是 or_,所以子段名是:

    or_order_id、or_cust_name_id、or_quantity 和 or_description 等。

    这样从数据库中选出全部数据的 SQL 语句可以写成如下所示:

    1 Select From Customer, Order Where cu_surname = "MYNAME" ;
    2 and cu_name_id = or_cust_name_id and or_quantity = 1

    在没有这些前缀的情况下则写成这个样子(用别名来区分):

    1 Select From Customer, Order Where Customer.surname = "MYNAME" ;
    2 and Customer.name_id = Order.cust_name_id and Order.quantity = 1

    第 1 个 SQL 语句没少键入多少字符。但如果查询涉及到 5 个表乃至更多的列[字段]你就知道这个技巧多有用了。

    第 3 部分 - 选择键和索引

    数据采掘要预先计划

    我所在的某一客户部门一度要处理 8 万多份联系方式,同时填写每个客户的必要数据(这绝对不是小活)。我从中还要确定出一组客户作为市场目标。当我从最开始设计表和字段的时候,我试图不在主索引里增加太多的字段以便加快数据库的运行速度。然后我意识到特定的组查询和信息采掘既不准确速度也不快。结果只好在主索引中重建而且合并了数据字段。我发现有一个指示计划相当关键--当我想创建系统类型查找时为什么要采用号码作为主索引字段呢?我可以用传真号码进行检索,但是它几乎就象系统类型一样对我来说并不重要。采用后者作为主字段,数据库更新后重新索引和检索就快多了。

    可操作数据仓库(ODS)和数据仓库(DW)这两种环境下的数据索引是有差别的。在 DW 环境下,你要考虑销售部门是如何组织销售活动的。他们并不是数据库管理员,但是他们确定表内的键信息。这里设计人员或者数据库工作人员应该分析数据库结构从而确定出性能和正确输出之间的最佳条件。

    使用系统生成的主键

    这类同技巧 1,但我觉得有必要在这里重复提醒大家。假如你总是在设计数据库的时候采用系统生成的键作为主键,那么你实际控制了数据库的索引完整性。这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。

    采用系统生成键作为主键还有一个优点:当你拥有一致的键结构时,找到逻辑缺陷很容易。

    分解字段用于索引

    为了分离命名字段和包含字段以支持用户定义的报表,请考虑分解其他字段(甚至主键)为其组成要素以便用户可以对其进行索引。索引将加快 SQL 和报表生成器脚本的执行速度。比方说,我通常在必须使用 SQL LIKE 表达式的情况下创建报表,因为 case number 字段无法分解为 year、serial number、case type 和 defendant code 等要素。性能也会变坏。假如年度和类型字段可以分解为索引字段那么这些报表运行起来就会快多了。

    键设计 4 原则

    • 为关联字段创建外键。
    • 所有的键都必须唯一。
    • 避免使用复合键。
    • 外键总是关联唯一的键字段。

    别忘了索引

    索引是从数据库中获取数据的最高效方式之一。95% 的数据库性能问题都可以采用索引技术得到解决。作为一条规则,我通常对逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列[字段]采用非成组索引。不过,索引就象是盐,太多了菜就咸了。你得考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。

    大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。还有,不要索引 memo/note 字段,不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。

    不要索引常用的小型表

    不要为小型数据表设置任何键,假如它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。

    不要把社会保障号码(SSN)或身份证号码(ID)选作键

    永远都不要使用 SSN 或 ID 作为数据库的键。除了隐私原因以外,须知政府越来越趋向于不准许把 SSN 或 ID 用作除收入相关以外的其他目的,SSN 或 ID 需要手工输入。永远不要使用手工输入的键作为主键,因为一旦你输入错误,你唯一能做的就是删除整个记录然后从头开始。

    我在破解他人的程序时候,我看到很多人把 SSN 或 ID 还曾被用做系列号,当然尽管这么做是非法的。而且人们也都知道这是非法的,但他们已经习惯了。后来,随着盗取身份犯罪案件的增加,我现在的同行正痛苦地从一大摊子数据中把 SSN 或 ID 删除。

    不要用用户的键

    在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情况下不要选择用户可编辑的字段作为键。这样做会迫使你采取以下两个措施:

    • 在创建记录之后对用户编辑字段的行为施加限制。假如你这么做了,你可能会发现你的应用程序在商务需求突然发生变化,而用户需要编辑那些不可编辑的字段时缺乏足够的灵活性。当用户在输入数据之后直到保存记录才发现系统出了问题他们该怎么想?删除重建?假如记录不可重建是否让用户走开?
    • 提出一些检测和纠正键冲突的方法。通常,费点精力也就搞定了,但是从性能上来看这样做的代价就比较大了。还有,键的纠正可能会迫使你突破你的数据和商业/用户界面层之间的隔离。

    所以还是重提一句老话:你的设计要适应用户而不是让用户来适应你的设计。

    不让主键具有可更新性的原因是在关系模式下,主键实现了不同表之间的关联。比如,Customer 表有一个主键 CustomerID,而客户的定单则存放在另一个表里。Order 表的主键可能是 OrderNo 或者 OrderNo、CustomerID 和日期的组合。不管你选择哪种键设置,你都需要在 Order 表中存放 CustomerID 来保证你可以给下定单的用户找到其定单记录。

    假如你在 Customer 表里修改了 CustomerID,那么你必须找出 Order 表中的所有相关记录对其进行修改。否则,有些定单就会不属于任何客户--数据库的完整性就算完蛋了。

    如果索引完整性规则施加到表一级,那么在不编写大量代码和附加删除记录的情况下几乎不可能改变某一条记录的键和数据库内所有关联的记录。而这一过程往往错误丛生所以应该尽量避免。

    可选键(候选键)有时可做主键

    记住,查询数据的不是机器而是人。

    假如你有可选键,你可能进一步把它用做主键。那样的话,你就拥有了建立强大索引的能力。这样可以阻止使用数据库的人不得不连接数据库从而恰当的过滤数据。在严格控制域表的数据库上,这种负载是比较醒目的。如果可选键真正有用,那就是达到了主键的水准。

    我的看法是,假如你有可选键,比如国家表内的 state_code,你不要在现有不能变动的唯一键上创建后续的键。你要做的无非是创建毫无价值的数据。如你因为过度使用表的后续键[别名]建立这种表的关联,操作负载真得需要考虑一下了。

    别忘了外键

    大多数数据库索引自动创建的主键字段。但别忘了索引外键字段,它们在你想查询主表中的记录及其关联记录时每次都会用到。还有,不要索引 memo/notes 字段而且不要索引大型文本字段(许多字符),这样做会让你的索引占据大量的数据库空间。

    第 4 部分 - 保证数据的完整性

    用约束而非商务规则强制数据完整性

    如果你按照商务规则来处理需求,那么你应当检查商务层次/用户界面:如果商务规则以后发生变化,那么只需要进行更新即可。假如需求源于维护数据完整性的需要,那么在数据库层面上需要施加限制条件。如果你在数据层确实采用了约束,你要保证有办法把更新不能通过约束检查的原因采用用户理解的语言通知用户界面。除非你的字段命名很冗长,否则字段名本身还不够。

    只要有可能,请采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于商务层保证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。

    分布式数据系统

    对分布式系统而言,在你决定是否在各个站点复制所有数据还是把数据保存在一个地方之前应该估计一下未来 5 年或者 10 年的数据量。当你把数据传送到其他站点的时候,最好在数据库字段中设置一些标记。在目的站点收到你的数据之后更新你的标记。为了进行这种数据传输,请写下你自己的批处理或者调度程序以特定时间间隔运行而不要让用户在每天的工作后传输数据。本地拷贝你的维护数据,比如计算常数和利息率等,设置版本号保证数据在每个站点都完全一致。

    强制指示完整性(参照完整性?)

    没有好办法能在有害数据进入数据库之后消除它,所以你应该在它进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。

    如果两个实体之间存在多对一关系,而且还有可能转化为多对多关系,那么你最好一开始就设置成多对多关系。从现有的多对一关系转变为多对多关系比一开始就是多对多关系要难得多。

    采用视图

    为了在你的数据库和你的应用程序代码之间提供另一层抽象,你可以为你的应用程序建立专门的视图而不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你提供了更多的自由。

    给数据保有和恢复制定计划

    考虑数据保有策略并包含在设计过程中,预先设计你的数据恢复过程。采用可以发布给用户/开发人员的数据字典实现方便的数据识别同时保证对数据源文档化。编写在线更新来"更新查询"供以后万一数据丢失可以重新处理更新。

    用存储过程让系统做重活

    解决了许多麻烦来产生一个具有高度完整性的数据库解决方案之后,我决定封装一些关联表的功能组,提供一整套常规的存储过程来访问各组以便加快速度和简化客户程序代码的开发。数据库不只是一个存放数据的地方,它也是简化编码之地。

    使用查找

    控制数据完整性的最佳方式就是限制用户的选择。只要有可能都应该提供给用户一个清晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公共数据特别适合查找:国家代码、状态代码等。

    第 5 部分 - 各种小技巧

    文档、文档、文档

    对所有的快捷方式、命名规范、限制和函数都要编制文档。

    采用给表、列[字段]、触发器等加注释的数据库工具。是的,这有点费事,但从长远来看,这样做对开发、支持和跟踪修改非常有用。

    取决于你使用的数据库系统,可能有一些软件会给你一些供你很快上手的文档。你可能希望先开始在说,然后获得越来越多的细节。或者你可能希望周期性的预排,在输入新数据同时随着你的进展对每一部分细节化。不管你选择哪种方式,总要对你的数据库文档化,或者在数据库自身的内部或者单独建立文档。这样,当你过了一年多时间后再回过头来做第 2 个版本,你犯错的机会将大大减少。

    使用常用英语(或者其他任何语言)而不要使用编码

    为什么我们经常采用编码(比如 9935A 可能是'青岛啤酒'的供应代码,4XF788-Q 可能是帐目编码)?理由很多。但是用户通常都用英语进行思考而不是编码。工作 5 年的会计或许知道 4XF788-Q 是什么东西,但新来的可就不一定了。在创建下拉菜单、列表、报表时最好按照英语名排序。假如你需要编码,那你可以在编码旁附上用户知道的英语。

    保存常用信息

    让一个表专门存放一般数据库信息非常有用。我常在这个表里存放数据库当前版本、最近检查/修复(对 FoxPro)、关联设计文档的名称、客户等信息。这样可以实现一种简单机制跟踪数据库,当客户抱怨他们的数据库没有达到希望的要求而与你联系时,这样做对非客户机/服务器环境特别有用。

    测试、测试、反复测试

    建立或者修订数据库之后,必须用用户新输入的数据测试数据字段。最重要的是,让用户进行测试并且同用户一道保证你选择的数据类型满足商业要求。测试需要在把新数据库投入实际服务之前完成。

    检查设计

    在开发期间检查数据库设计的常用技术是通过其所支持的应用程序原型检查数据库。换句话说,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看如何取出数据。

    展开全文
  • 数据库表自动生成

    千次阅读 2014-07-10 12:01:35
    今天,在一个POJO类里面添加一个属性,然后在
  • MySQL系列之数据库设计

    千次阅读 2016-03-29 09:43:06
    前言这里将以前不怎么熟悉的数据库设计知识重新拾起,做一个简单的知识梳理。之前一直认为数据库设计无非就是创建数据库、建表、添加字段、确定字段类型(这点随意性很大),诸如此类。当系统地对数据库知识重新学习...
  • 数据库

    千次阅读 2007-10-24 08:27:00
    数据库之路——从关系演算到数据立方作者:WangQingDa Gender: Malee-mail:expectoneday@hotmail.com专业:会计电算化(bachelor);计算机软件理论(Master)仅以此...数据库对于任何学习计算机专业的人来说都是基
  • 一个进销存数据库设计案例

    万次阅读 2014-08-19 17:40:09
    /* 商品细分类编号, 外键 ( 参照 PRODUCTLIST  ) */    Product_ID INT IDENTITY(1,1) NOT NULL,  /* 商品名称编号, 主键 */    Name varchar(30) NOT NULL,  /* 商品名称 */   ...
  • 本文来源于我在InfoQ中文站原创的文章,原文地址是:...近日,Naresh撰写了篇博文,对开源世界最常见的两种数据库MySQL与PostgreSQL的特点进行了详尽的分析和比对。如果打算为项目选择款免
  • 博文描述了自由的DataTable对象添加数据库表中的方法,DataTable习惯上叫内存数据库表是数据,内存写入到数据时,不一定每列都要对应上,但对应的数据列数据类型需要一致,方法的形式参数需要了解...
  • DbGate:款免费的智能数据库管理工具

    千次阅读 多人点赞 2021-04-23 21:49:21
    DbGate 是一个免费开源的数据库管理工具,提供了多种数据库支持,目前包括 MySQL、PostgreSQL、SQL Server 以及 MongoDB。DbGate 支持不同的平台,包括 Windows、Linux、MacOS 以及 Web 浏览器。DbGate 基于宽松的 ...
  • MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用...
  • android-一个文件搞定SQLite数据库的创建与更新以及增删查改
  • 数据库面试

    千次阅读 多人点赞 2019-02-13 09:03:42
    数据库问答题 1. SQL语言包括哪些类型? 数据定义DDL:Create Table,Alter Table,Drop Table, Create/Drop Index等 数据操纵DML:Select ,insert,update,delete, 数据控制DCL:grant,revoke 2. 内联接,外联接...
  • 一、建立数据库: 用 Microsoft Access 建立一个名为 data.mdb 的空数据库,使用设计器创建一个admin是保存用户名和密码,里面有字段:UserName,PassWord. 二、连接数据库Conn.asp文件:方法1:Dim DateBase, ...
  • HSQLDB(HyperSQL DataBase)是一个使用 Java 语言编写的开源关系型数据库,支持嵌入式、客户端/服务器部署模式。本文介绍了 HSQLDB 的功能、下载安装、基本操作以及相关的学习资源。
  • 进一步查找资料,发现在使用Java连接SQL Server或者Access数据库时也会有类似的问题。其中位网友的问题描述如下:我用JDBC-ODBC桥连,代码应该是没问题的,ODBC数据源也是配置成功了的。但就是有异常: [Microsoft...
  • 15nosql数据库

    万次阅读 2016-06-17 12:41:51
    MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。主要解决的是海量数据的访问效率问题,为WEB应用提供可扩展的高性能数据存储解决方案。当数据量达到50GB以上的时候,MongoDB的数据库访问速度是MySQL的10...
  • SQLite数据库

    千次阅读 2020-03-08 12:29:22
    SQLite 是一个开源的、内嵌式的关系型数据库,第一个版本诞生于 2000 年 5 月,目前最高版本为 SQLite3。 学习网站:http://www.runoob.com/sqlite/sqlite-tutorial.html 安装方法:( 我用的是ubuntu12.04) 字符界面:...
  • 映射如果用xml文件的话添加数据库字段没有问题 注解的方式添加数据库字段有问题 需要添加 @Transient 注解  如果添加后不能成功 原因 jar包选错了 这里我选择了 java.beans所以除了错 正确的包 ...
  • NoSQL数据库

    千次阅读 2019-01-19 14:49:19
    通常NoSQL数据库具有以下几特点: (1)灵活的扩展性。 (2)灵活的数据模型。 (3)与云计算紧密结合。 2. NoSQL兴起的原因 关系型数据库已经无法满足web2.0的需求。主要表现在以下几方面: 关系型数据库已经无法...
  •  在这篇文章中,我们会着手解决在构建一个数据库驱动的网站的过程中将会遇到的问题。而我们只会使用两个新的工具,PHP和MySQL。如果你的Web主机支持PHP/MySQL,那么你会省掉不少麻烦。如果不是这样,你也不用提心,...
  • MySQL 入门()—— 常用数据库介绍

    千次阅读 多人点赞 2016-04-13 10:52:08
    在开始数据库学习之前,本人也在Oracle和MySQL之间犹豫。 Oracle 跟 MySQL 目前大概二八开,即占 80% 市场份额的 20% 大型互联网公司用的是 Oracle,提供精确数据云服务端;占20% 市场份额 的80% 中小型互联网公司...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 79,135
精华内容 31,654
关键字:

对于向一个数据库添加自由表