-
数据库学习基础之名词解释
2011-06-11 22:27:21具体为:递归查询的优化、规则的一致性维护等。 Access数据库 美国Microsoft公司于1994年推出的微机数据库管理系统。它具有界面友好、易学易用、开发简单、接口灵活等特点,是典型的新一代桌面数据库管理系统。... -
数据挖掘考试题库
2020-07-20 10:28:36OLAP:OLAP是在OLTP的基础上发展起来的,以数据仓库为基础的数据分析处理,是共享多维信息的快速分析,是被专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的决策支持。 粒度:指数据仓库的数据单位...目录
一、名词解释
二、综合题
一、名词解释
- 数据仓库:是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提供所需的集成信息。
- 孤立点:指数据库中包含的一些与数据的一般行为或模型不一致的异常数据。
- OLAP:OLAP是在OLTP的基础上发展起来的,以数据仓库为基础的数据分析处理,是共享多维信息的快速分析,是被专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的决策支持。
- 粒度:指数据仓库的数据单位中保存数据细化或综合程度的级别。粒度影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答查询问题的细节程度。
- 数据规范化:指将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0-1)以提高数据挖掘效率的方法。规范化的常用方法有:最大-最小规范化、零-均值规范化、小数定标规范化。
- 关联知识:是反映一个事件和其他事件之间依赖或相互关联的知识。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。
- 数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
- OLTP:OLTP为联机事务处理的缩写,OLAP是联机分析处理的缩写。前者是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据进行查询和增、删、改等处理。
- ROLAP:是基于关系数据库存储方式的,在这种结构中,多维数据被映像成二维关系表,通常采用星型或雪花型架构,由一个事实表和多个维度表构成。
- MOLAP:是基于类似于“超立方”块的OLAP存储结构,由许多经压缩的、类似于多维数组的对象构成,并带有高度压缩的索引及指针结构,通过直接偏移计算进行存取。
- 数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。
- 广义知识:通过对大量数据的归纳、概括和抽象,提炼出带有普遍性的、概括性的描述统计的知识。
- 预测型知识:是根据时间序列型数据,由历史的和当前的数据去推测未来的数据,也可以认为是以时间为关键属性的关联知识。
- 偏差型知识:是对差异和极端特例的描述,用于揭示事物偏离常规的异常现象,如标准类外的特例,数据聚类外的离群值等。
- 遗传算法:是一种优化搜索算法,它首先产生一个初始可行解群体,然后对这个群体通过模拟生物进化的选择、交叉、变异等遗传操作遗传到下一代群体,并最终达到全局最优。
- 聚类:是将物理或抽象对象的集合分组成为多个类或簇(cluster)的过程,使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。
- 决策树:是用样本的属性作为结点,用属性的取值作为分支的树结构。它是分类规则挖掘的典型方法,可用于对新样本进行分类。
- 相异度矩阵:是聚类分析中用于表示各对象之间相异度的一种矩阵,n个对象的相异度矩阵是一个nn维的单模矩阵,其对角线元素均为0,对角线两侧元素的值相同。
- 频繁项集:指满足最小支持度的项集,是挖掘关联规则的基本条件之一。
- 支持度:规则A→B的支持度指的是所有事件中A与B同地发生的的概率,即P(A∪B),是AB同时发生的次数与事件总次数之比。支持度是对关联规则重要性的衡量。
- 可信度:规则A→B的可信度指的是包含A项集的同时也包含B项集的条件概率P(B|A),是AB同时发生的次数与A发生的所有次数之比。可信度是对关联规则的准确度的衡量。
- 关联规则:同时满足最小支持度阈值和最小可信度阈值的规则称之为关联规则。
二、综合题
-
何谓数据挖掘?它有哪些方面的功能?
从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。相关的名称有知识发现、数据分析、数据融合、决策支持等。
数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等。 -
何谓数据仓库?为什么要建立数据仓库?
数据仓库是一种新的数据处理体系结构,是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,为企业决策支持系统提供所需的集成信息。
建立数据仓库的目的有3个:
1)一是为了解决企业决策分析中的系统响应问题,数据仓库能提供比传统事务数据库更快的大规模决策分析的响应速度。
2)二是解决决策分析对数据的特殊需求问题。决策分析需要全面的、正确的集成数据,这是传统事务数据库不能直接提供的。
3)三是解决决策分析对数据的特殊操作要求。决策分析是面向专业用户而非一般业务员,需要使用专业的分析工具,对分析结果还要以商业智能的方式进行表现,这是事务数据库不能提供的。 -
列举操作型数据与分析型数据的主要区别。
操作型数据 分析型数据 当前的、细节的 历史的、综合的 面向应用、事务驱动 面向分析、分析驱动 频繁增、删、改 几乎不更新,定期追加 操作需求事先知道 分析需求事先不知道 生命周期符合SDLC 完全不同的生命周期 对性能要求高 对性能要求宽松 一次操作数据量小 一次操作数据量大 支持日常事务操作 支持管理决策需求 4.何谓OLTP和OLAP?它们的主要异同有哪些?
OLTP即联机事务处理,是以传统数据库为基础、面向操作人员和低层管理人员、对基本数据进行查询和增、删、改等的日常事务处理。OLAP即联机分析处理,是在OLTP基础上发展起来的、以数据仓库基础上的、面向高层管理人员和专业分析人员、为企业决策支持服务。
OLTP和OLAP的主要区别如下表:OLTP OLAP 数据库数据 数据库或数据仓库数据 细节性数据 综合性数据 当前数据 历史数据 经常更新 不更新,但周期性刷新 一次性处理的数据量小 一次处理的数据量大 对响应时间要求高 响应时间合理 用户数量大 用户数据相对较少 面向操作人员,支持日常操作 面向决策人员,支持管理需要 面向应用,事务驱动 面向分析,分析驱动 -
何谓粒度?它对数据仓库有什么影响?按粒度组织数据的方式有哪些?
粒度是指数据仓库的数据单位中保存数据细化或综合程度的级别。粒度影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答查询问题的细节程度。按粒度组织数据的方式主要有:
①简单堆积结构
②轮转综合结构
③简单直接结构
④连续结构 -
简述数据仓库设计的三级模型及其基本内容。
概念模型设计是在较高的抽象层次上的设计,其主要内容包括:界定系统边界和确定主要的主题域。
逻辑模型设计的主要内容包括:分析主题域、确定粒度层次划分、确定数据分割策略、定义关系模式、定义记录系统。
物理数据模型设计的主要内容包括:确定数据存储结构、确定数据存放位置、确定存储分配以及确定索引策略等。在物理数据模型设计时主要考虑的因素有: I/O存取时间、空间利用率和维护代价等。
提高性能的主要措施有划分粒度、数据分割、合并表、建立数据序列、引入冗余、生成导出数据、建立广义索引等。 -
在数据挖掘之前为什么要对原始数据进行预处理?
原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理。
为数据挖掘算法提供完整、干净、准确、有针对性的数据,减少算法的计算量,提高挖掘效率和准确程度。 -
简述数据预处理方法和内容。
①数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。
②数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。
③数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构。
④数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。 -
简述数据清理的基本内容。
①尽可能赋予属性名和属性值明确的含义;
②统一多数据源的属性值编码;
③去除无用的惟一属性或键值(如自动增长的id);
④去除重复属性(在某些分析中,年龄和出生日期可能就是重复的属性,但在某些时候它们可能又是同时需要的)
⑤去除可忽略字段(大部分为空值的属性一般是没有什么价值的,如果不去除可能造成错误的数据挖掘结果)
⑥合理选择关联字段(对于多个关联性较强的属性,重复无益,只需选择其中的部分用于数据挖掘即可,如价格、数据、金额)
⑦去掉数据中的噪音、填充空值、丢失值和处理不一致数据。 -
简述处理空缺值的方法。
①忽略该记录;
②去掉属性;
③手工填写空缺值;
④使用默认值;
⑤使用属性平均值;
⑥使用同类样本平均值;
⑦预测最可能的值。 -
常见的分箱方法有哪些?数据平滑处理的方法有哪些?
分箱的方法主要有:
①统一权重法(又称等深分箱法)
②统一区间法(又称等宽分箱法)
③最小熵法
④自定义区间法
数据平滑的方法主要有:平均值法、边界值法和中值法。
12.何谓数据规范化?规范化的方法有哪些?写出对应的变换公式。
将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如0.0~1.0),称为规范化。规范化的常用方法有:
12. 数据归约的方法有哪些?为什么要进行维归约?
①数据立方体聚集
②维归约
③数据压缩
④数值压缩
⑤离散化和概念分层
维归约可以去掉不重要的属性,减少数据立方体的维数,从而减少数据挖掘处理的数据量,提高挖掘效率。-
何谓聚类?它与分类有什么异同?
聚类是将物理或抽象对象的集合分组成为多个类或簇(cluster)的过程,使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。
聚类与分类不同,聚类要划分的类是未知的,分类则可按已知规则进行;聚类是一种无指导学习,它不依赖预先定义的类和带类标号的训练实例,属于观察式学习,分类则属于有指导的学习,是示例式学习。 -
举例说明聚类分析的典型应用。
①商业:帮助市场分析人员从客户基本库中发现不同的客户群,并且用不同的购买模式描述不同客户群的特征。
②生物学:推导植物或动物的分类,对基于进行分类,获得对种群中固有结构的认识。
③WEB文档分类
④其他:如地球观测数据库中相似地区的确定;各类保险投保人的分组;一个城市中不同类型、价值、地理位置房子的分组等。
⑤聚类分析还可作为其他数据挖掘算法的预处理:即先进行聚类,然后再进行分类等其他的数据挖掘。聚类分析是一种数据简化技术,它把基于相似数据特征的变量或个案组合在一起。 -
聚类分析中常见的数据类型有哪些?何谓相异度矩阵?它有什么特点?
常见数据类型有区间标度变量、比例标度型变量、二元变量、标称型、序数型以及混合类型等。相异度矩阵是用于存储所有对象两两之间相异度的矩阵,为一个nn维的单模矩阵。其特点是d(i,j)=d(j,i),d(i,i)=0,d(j,j)=0。如下所示:
-
分类知识的发现方法主要有哪些?分类过程通常包括哪两个步骤?
分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法、粗糙集法和遗传算法。分类的过程包括2步:首先在已知训练数据集上,根据属性特征,为每一种类别找到一个合理的描述或模型,即分类规则;然后根据规则对新数据进行分类。 -
什么是决策树?如何用决策树进行分类?
决策树是用样本的属性作为结点,用属性的取值作为分支的树结构。它是利用信息论原理对大量样本的属性进行分析和归纳而产生的。决策树的根结点是所有样本中信息量最大的属性。树的中间结点是以该结点为根的子树所包含的样本子集中信息量最大的属性。决策树的叶结点是样本的类别值。
决策树用于对新样本的分类,即通过决策树对新样本属性值的测试,从树的根结点开始,按照样本属性的取值,逐渐沿着决策树向下,直到树的叶结点,该叶结点表示的类别就是新样本的类别。决策树方法是数据挖掘中非常有效的分类方法。 -
简述ID3算法的基本思想及其主算法的基本步骤。
首先找出最有判别力的因素,然后把数据分成多个子集,每个子集又选择最有判别力的因素进一步划分,一直进行到所有子集仅包含同一类型的数据为止。最后得到一棵决策树,可以用它来对新的样例进行分类。
主算法包括如下几步:
①从训练集中随机选择一个既含正例又含反例的子集(称为窗口);
②用“建树算法”对当前窗口形成一棵决策树;
③对训练集(窗口除外)中例子用所得决策树进行类别判定,找出错判的例子;
④若存在错判的例子,把它们插入窗口,重复步骤②,否则结束。 -
简述ID3算法的基本思想及其建树算法的基本步骤。
首先找出最有判别力的因素,然后把数据分成多个子集,每个子集又选择最有判别力的因素进一步划分,一直进行到所有子集仅包含同一类型的数据为止。最后得到一棵决策树,可以用它来对新的样例进行分类。
建树算法的具体步骤如下:
①对当前例子集合,计算各特征的互信息;
②选择互信息最大的特征Ak;
③把在Ak处取值相同的例子归于同一子集,Ak取几个值就得几个子集;
④对既含正例又含反例的子集,递归调用建树算法;
⑤若子集仅含正例或反例,对应分枝标上P或N,返回调用处。 -
设某事务项集构成如下表,填空完成其中支持度和置信度的计算。
-
从信息处理角度看,神经元具有哪些基本特征?写出描述神经元状态的M-P方程并说明其含义。
-
遗传算法与传统寻优算法相比有什么特点?
①遗传算法为群体搜索,有利于寻找到全局最优解;
②遗传算法采用高效有方向的随机搜索,搜索效率高;
③遗传算法处理的对象是个体而不是参变量,具有广泛的应用领域;
④遗传算法使用适应值信息评估个体,不需要导数或其他辅助信息,运算速度快,适应性好;
⑤遗传算法具有隐含并行性,具有更高的运行效率。 -
写出非对称二元变量相异度计算公式(即jaccard系数),并计算下表中各对象间的相异度。
-
简述K-平均算法的输入、输出及聚类过程(流程)。
输入:簇的数目k和包含n个对象的数据集。
输出:k个簇,使平方误差准则最小。
步骤:
①任意选择k个对象作为初始的簇中心;
②计算其它对象与这k个中心的距离,然后把每个对象归入离它“最近”的簇;
③计算各簇中对象的平均值,然后重新选择簇中心(离平均值“最近”的对象值);
④重复第2第3步直到簇中心不再变化为止。 -
简述K-中心点算法的输入、输出及聚类过程(流程)。
输入:结果簇的数目k,包含n个对象的数据集
输出:k个簇,使得所有对象与其最近中心点的相异度总和最小。
流程:
①随机选择k个对象作为初始中心点;
②计算其它对象与这k个中心的距离,然后把每个对象归入离它“最近”的簇;
③随机地选择一个非中心点对象Orandom,并计算用Orandom代替Oj的总代价S;
④如果S<0,则用Orandom代替Oj,形成新的k个中心点集合;
⑤重复迭代第3、4步,直到中心点不变为止。 -
何谓文本挖掘?它与信息检索有什么关系(异同)。
文本挖掘是从大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。它与信息检索之间有以下几方面的区别:
①方法论不同:信息检索是目标驱动的,用户需要明确提出查询要求;而文本挖掘结果独立于用户的信息需求,是用户无法预知的。
②着眼点不同:信息检索着重于文档中字、词和链接;而文本挖掘在于理解文本的内容和结构。
③目的不同:信息检索的目的在于帮助用户发现资源,即从大量的文本中找到满足其查询请求的文本子集;而文本挖掘是为了揭示文本中隐含的知识。
④评价方法不同:信息检索用查准率和查全率来评价其性能。而文本挖掘采用收益、置信度、简洁性等来衡量所发现知识的有效性、可用性和可理解性。
⑤使用场合不同:文本挖掘是比信息检索更高层次的技术,可用于信息检索技术不能解决的许多场合。一方面,这两种技术各有所长,有各自适用的场合;另一方面,可以利用文本挖掘的研究成果来提高信息检索的精度和效率,改善检索结果的组织,使信息检索系统发展到一个新的水平。
具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。 4、数据挖掘对聚类的数据要求是什么? (1)可伸缩性(2)处理不同类型属性的能力(3)发现任意形状的聚类(4)使输入参数的领域知识最小化(5)处理噪声数据的能力(6)对于输入顺序不敏感(7)高维性(8)基于约束的聚类(9)看解释性和可利用性 -
简述Apriori算法的思想,谈谈该算法的应用领域并举例。
答:思想:其发现关联规则分两步,第一是通过迭代,检索出数据源中所有烦琐项集,即支持度不低于用户设定的阀值的项即集,第二是利用第一步中检索出的烦琐项集构造出满足用户最小信任度的规则,其中,第一步即挖掘出所有频繁项集是该算法的核心,也占整个算法工作量的大部分。 在商务、金融、保险等领域皆有应用。
-
数据库期末复习基础题答案
2019-12-04 21:13:02名词解释 符号系统 不同载体上的信息虽然表现形式不同,其内在的含义是一致的,但必须通过一致的方式来记录内容,和一致的解读方式来还原内容。 这种一致的记录和解读信息的方式,被称为符号系统。这种方式必须...名词解释
符号系统
- 不同载体上的信息虽然表现形式不同,其内在的含义是一致的,但必须通过一致的方式来记录内容,和一致的解读方式来还原内容。
- 这种一致的记录和解读信息的方式,被称为符号系统。这种方式必须是可操作的和精确的。
编码
- 对于各种客观实体和抽象概念等,将其在另外一个符号体系下进行描述(文字)
- 将客观事物或者某一个符号体系下的内容映射成数字的过程,就是编码
信息
- 信息是世界上事物的存在、运动方式的描述
- 信息有助于减少不确定性。信息与物质和运动的关系
- 信息的可复制性,可传播性、可存储性
数据
存储在某种媒体上可加以鉴别的符号资料。即对现实世界中客观事物的符号表示(描述事物的符号记录),可以是数值数据,也可以是非数值数据,如声音、图像等
数据库
长期储存在计算机内的有组织的、可共享的相关数据的集合。
数据库管理系统
- 是一套软件产品,可以把一系列相关数据保存在计算机中,并提供对这些数据进行检索、修改和维护等操作的工具和编程接口。
- 和数据库的区别在于,数据库是指数据部分。
数据库应用系统(又名信息管理系统)
利用数据库管理系统,进行信息的收集、整理、加工、储存、查询和利用的系统,一般借助于计算机、网络和其他外部设备构成。
实体
- 是现实世界中独立存在的、可区别于其他对象的“对象”或“事物”。
- 是关于将被收集的信息的主要数据对象。
- 具有一组属性。
- 可以是物理存在的对象:人、汽车、商品、职工等;
- 也可以是抽象存在的对象:公司、企业、工作或感兴趣信息事件
实体集
实体集(entity set,)是一组具有相同特征或属性的实体的集合。
属性
- 实体所具有的某一特性
- 一个实体可以由若干个属性来刻画
- 例如,学生可由学号、姓名、年龄、系等组成
域
- 属性的取值范围
- 例如,性别的域为(男、女),月份的域为1到12的整数
数据模型
数据模型(Data Model)是现实世界数据特征的抽象。数据模型从本质上来说,是数据间相互联系或者说约束条件的描述。数据模型正是从一般抽象的层面上模拟和描述了数据库系统的静态特征、动态行为和约束条件。
码与建
- 能唯一标识一个实体的属性或属性集称为实体的键。
- 如:学生的学号,学生的姓名可能有重名,不能作为学生实体的键。
ER图
- 是用于数据库设计的高层概念数据模型。
- 概念数据模型用来描述数据库的结构以及有关的在数据库上的检索和更新事务
- 独立于任何数据库管理系统和硬件平台。
- 矩形框表示实体型,椭圆表示属性,菱形表示联系
主键
表的主键是能够唯一标识表中一行数据的字段或者最小字段组合。
空值
空值用来表示未知(Unknown)或不适用(Inapplicable)的情况,使用NULL表示
关系
- 指业务中相关的两个或多个实体之间的关联。
- 关系的一个具体值称为关系实例。一个具体的关系实例表达了实体之间的一组有意义的关联
外键
- 外键是描述表之间关系的桥梁和纽带。
- 用来保证参照完整性
- 当被其他数据引用的数据删除(或修改)时,那些引用的数据如何处理?不允许删除(Restrict)置为空或缺省值。级联删除(Cascade),可能会导致雪崩。
- 在数据导入导出时,往往需要暂时禁止外建
视图
- 视图是一个虚表
- 不存储数据,在使用时对原有数据的重新组织。
- 它是一个逻辑结构,不占据存储空间。
- 基于表、在大部分SQL中,特别是DQL和DML,语法地位等价于表
多表连接
- 将多个表的数据进行笛卡尔积,在此基础上进行查询,称为连接查询(Join)。
- 连接条件:在笛卡尔积的基础上,通常要根据多个表之间相关联的某些字段之间的判断条件进行筛选,这种多表之间的筛选条件称为连接条件。
- 根据连接条件,可以分为:等值连接(Equal join)、不等值连接(Non-equal join)、自连接(Self join)和外连接(Outer join)。
物理数据模型
- 是面向计算机物理表示的模型,描述了数据在储存介质上的组织结构。
- 它不但与具体的DBMS有关,而且还与操作系统和硬件有关。每一种逻辑数据模型在实现时都有起对应的物理数据模型。
- DBMS为了保证其独立性与可移植性,大部分物理数据模型的实现工作由系统自动完成,设计者只需要进行结构设计。
事务
事务(Transaction)是包括多个数据库操作,构成一个完整业务操作的逻辑工作单元。
是数据库区别于文件系统的主要特性之一。
目的:把数据库从一种一致状态转变为另一种一致状态。事务处理
- 目的:把数据库从一种一致状态转变为另一种一致状态。
- 事务的执行结果:全部成功 or 全部失败
- 提交:通知数据库当前事务完全结束,数据库将事务的影响永久化。并准备开始下一个事务。
- 卷回:通知数据库撤销并结束当前事务,该事务之前所造成的影响完全回复。
概念模型
数据库概念模型实际上是现实世界到机器世界的一个中间层次。数据库概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。建立数据概念模型,就是从数据的观点出发,观察系统中数据的采集、传输、处理、存储、输出等,经过分析、总结之后建立起来的一个逻辑模型,
序列
Sequence 是oracle提供的用于产生一系列唯一数字的数据库对象。由于oracle中没有设置自增列的方法,所以我们在oracle数据库中主要用序列来实现主键自增的功能。
存储过程
存储过程(Stored Procedure)是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,它存储在数据库中,一次编译后永久有效,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。存储过程是数据库中的一个重要对象。在数据量特别庞大的情况下利用存储过程能达到倍速的效率提升
约束
- 根据实际的业务要求,要求数据必须满足的一系列条件称为商业规则
- 约束(Constraints):对于一些常见、通用的要求,使用设置的方式建立规则。设置简单,执行代价较小,一致性强
表
触发器
- 触发器是一种特殊的存储过程。它不是由用户显式调用的,而是当满足某个触发事件时自动执行的。
- 触发器包括:触发事件,触发器约束和触发器动作。
数据库管理员
数据库管理员(Database Administrator,简称DBA),是从事管理和维护数据库管理系统(DBMS)的相关工作人员的统称,属于运维工程师的一个分支,主要负责业务数据库从设计、测试到部署交付的全生命周期管理。
-
基于J2EE框架的个人博客系统项目毕业设计论文(源码和论文)
2011-03-12 10:44:332、数据的一致性与完整性。3、数据的共享与独立性。 2.2. 系统的可行性分析 2.2.1. 技术可行性 技术上的可行性分析要考虑将来要采用的硬件和软件技术能否满足用户(这里是服务器,网速)提出的要求(如计算机的... -
大话Oracle RAC:集群、高可用性、备份与恢复--详细书签版
2013-02-06 16:12:064.1.1 并发访问和数据一致性 97 4.1.2 事务和隔离级别 98 4.1.3 Oracle支持的隔离级别 99 4.2 Oracle单实例的并发控制机制 100 4.2.1 Lock 100 4.2.2 数据记录的行级锁 101 4.2.3 Latch 105 4.2.4 ... -
「开放知识」的定义OpenDefinition.zip
2019-07-19 04:23:58名词解释 「知识」包含: 音乐、电影、书籍等的内容 科学、历史、地理或其他的数据 政府或其他行政信息 尽管软件显然是开放知识的一个重心内容,但软件在此并不包含在定义内,这是因为以前的工作(比如开源软件... -
Redis简介
2019-11-05 11:11:42其性能远超数据库,并且还支持集群、分布式、主从同步等配置,原则上可以无限扩展,让更多的数据存储在内存中,更让人欣慰的是它还支持一定的事务能力,这保证了高并发的场景下数据的安全和一致性。 名词解释: ...- 基于内存的数据库。
- 由于其可以进行相关配置,导致即使在断电后,redis也可以从磁盘读取上次信息,所以具有一定的持久化功能。它的性能十分优越,可以支持每秒十几万此的读/写操作,其性能远超数据库,并且还支持集群、分布式、主从同步等配置,原则上可以无限扩展,让更多的数据存储在内存中,更让人欣慰的是它还支持一定的事务能力,这保证了高并发的场景下数据的安全和一致性。
名词解释:- 集群:同一个业务,部署在多个服务器上(不同的服务器运行同样的代码,做同一件事)。
作用:分摊压力;一台服务器出现问题,业务还可由其他服务器处理。 - 分布式:一个业务分拆多个子业务,部署在不同的服务器上(不同的服务器,运行不同的代码,为了同一个目的)。
作用:模块之间独立,各做各的事,便于扩展,复用性高。
高吞吐量。某个任务需要一个机器运行10个小时,将该任务用10台机器的分布式跑(将这个任务拆分成10个小任务),可能2个小时就跑完了。 - 主从同步:
- 在多台数据服务器中,只有一台主服务器,而主服务器只负责写入数据,不负责外部程序读取数据。
- 存在多台从服务器,从服务器不写入数据,只负责同步主服务器的数据,并让外部程序读取数据。
- 主服务器写入数据后,即刻将写入数据的命令发送给从服务器,从而使得主从数据同步。
- 应用程序可以随机读取某一台从服务器的数据,这样就可以分摊读取数据的压力。
- 当从服务器不能工作时,整个系统将不受影响;当主服务器不能工作时,可以方便地从从服务器选举一台来当主服务器。
- 集群:同一个业务,部署在多个服务器上(不同的服务器运行同样的代码,做同一件事)。
- 应用场景
- 存储
缓存
用的数据; - 需要高速读/写的场合使用它快速读/写;(可实现批量读写,即先操作内存中的redis,最后再持久化到数据库)。
- 存储
-
超级有影响力霸气的Java面试题大全文档
2012-07-18 09:47:04对于客户机,EntityBean是一种持久性对象,它代表一个存储在持久性存储器中的实体的对象视图,或是一个由现有企业应用程序实现的实体。 Session Bean 还可以再细分为 Stateful Session Bean 与 Stateless ... -
工程硕士学位论文 基于Android+HTML5的移动Web项目高效开发探究
2017-02-28 21:22:19专业名词 名词解释 HTML5 万维网的核心语言、标准通用标记语言下的一个应用超文本标记语言(HTML)的第五次重大修改 Android 一种基于Linux的自由及开放源代码的操作系统,主要使用于移动设备,如智能手机和平板... -
界面之下:还原真实的MV*模式
2021-01-09 01:04:57其余的依赖关系和MVC模式一致。 <h3>MVP(Passive View)的调用关系 既然View对Model的依赖被打破了,那View如何同步Model的变更?看看MVP的调用关系: <p><img alt="mvp-call" src=... -
Cassandra 权威指南(Apache Cassandra 项目主席作序推荐)--详细书签版
2013-02-04 13:39:051.3.5 可调节的一致性 15 1.3.6 Brewer的CAP理论 18 1.3.7 面向行 21 1.3.8 无schema 22 1.3.9 高性能 22 1.4 Cassandra来自何方 22 1.5 Cassandra的应用场景 23 1.5.1 大规模部署 23 1.5.2 写... -
C#微软培训教材(高清PDF)
2009-07-30 08:51:17第十二章 域 和 属 性 .139 12.1 域 .139 12.2 属 性 .143 12.3 小 结 .146 第十三章 事件和索引指示器 .148 13.1 事 件 .148 13.2 索引指示器 .151 13.3 小 结 .154 第十四章 继 承 .155 14.1 C#的... -
浏览器和NodeJS中不同的Event Loop
2020-12-29 07:19:19改部分细致解释可在【拓展】部分看详细解释</a>)</li><li>如果这是一个worker event loop,但是task队列中没有任务,并且WorkerGlobalScope对象的closing标识为true,则销毁EL,中止... -
C#微软培训资料
2014-01-22 14:10:17第十二章 域 和 属 性 .139 12.1 域 .139 12.2 属 性 .143 12.3 小 结 .146 第十三章 事件和索引指示器 .148 13.1 事 件 .148 13.2 索引指示器 .151 13.3 小 结 .154 第十四章 继 承 .155 14.1 C#的... -
java 面试题 总结
2009-09-16 08:45:34对于客户机,EntityBean是一种持久性对象,它代表一个存储在持久性存储器中的实体的对象视图,或是一个由现有企业应用程序实现的实体。 Session Bean 还可以再细分为 Stateful Session Bean 与 Stateless Session ... -
软件工程教程
2012-07-06 23:10:29传统的手工方式对图书信息的管理已越来越不能适应社会发展的需要,尤其是随着计算机网络和Internet的普及,运用先进的信息管理系统对信息进行科学化和网络化管理,已成为图书信息管理系统发展的趋势。 系统的研发... -
JAVA 正则表达式
2010-01-15 11:16:37等性(canonical equivalence)"。 Pattern.CASE_INSENSITIVE(?i) 默认情况下,大小写不明感的匹配只适用于 US-ASCII 字符集。 这个标志能让表达式忽略大小写进行匹配。要想对 Unicode 字符进行大小不明感的匹配... -
移动通信(第二版)中文版
2011-03-29 09:00:07附录2 名词解释 英汉对照表 简 介: 本书是移动通信领域的导论,主要讨论数字数据传输。适用于选修计算机网络或通信课程的电子工程或计算机专业的学生。本书从计算机科学的角度涵盖移动通信的各个方面,还指出了... -
移动通信(第二版)中文版.part1(共两个分卷)
2011-03-29 09:06:41由于上传限制,分为两个分卷上传. 《移动通信(第二版 中文版)》 作 者: JOCHEN SCHILLER 出 版 社: 高等教育出版社 目 录: 第一章 绪论 1.1应用 1.1.1车辆 1.1.2应急通信 ...附录2 名词解释 英汉对照表 -
格蠹汇编:软件调试案例集锦.张银奎(带详细书签).pdf
2018-04-26 23:11:14笃字之意与诚相近,用朱熹的话解释“真实无妄之谓诚”。简单理解,笃行就是“一心一意,坚持不懈地实践”。笃行需要恒心和毅力,如果说有窍门的话,那么便是挖掘乐趣。因为一旦有乐趣,就会“我自乐此,不知疲也”,... -
10分钟看懂 Java NIO 底层原理
2020-10-29 16:42:17很多的小伙伴,也被nio这个名词搞晕了,一会儿java 的nio 不叫 非阻塞io,一会儿java nio 又是非阻塞io,到底是啥呢? 很多的小伙伴,被异步和非阻塞搞晕了。都非阻塞了,难道不是异步的吗?这这,好难呀。 此文,... -
jquery插件使用方法大全
2012-05-24 23:58:18(详情可以参见:jQuery.ajax文档) 此外,系统的可扩展性大大增强,可以附加各种数据处理器、过滤器和传输机制,为开发新的Ajax插件提供了方便。 2. 延迟对象 延迟对象(Deferred Object,jQuery.Deferred对象)是...