精华内容
下载资源
问答
  • 三种数据模型

    千次阅读 2014-02-20 15:29:27
    数据库的类型是根据数据模型来划分的,而任何一个DBMS也是根据数据模型有针对性地设计出来的,这就意味着必须把数据库组织成符合DBMS规定的数据模型。目前成熟地应用在数据库系统中的数据模型有:层次模型、网状模型...

    数据库的类型是根据数据模型来划分的,而任何一个DBMS也是根据数据模型有针对性地设计出来的,这就意味着必须把数据库组织成符合DBMS规定的数据模型。目前成熟地应用在数据库系统中的数据模型有:层次模型、网状模型和关系模型。它们之间的根本区别在于数据之间联系的表示方式不同(即记录型之间的联系方式不同)。层次模型以“树结构”表示数据之间的联系。网状模型是以“图结构”来表示数据之间的联系。关系模型是用“二维表”(或称为关系)来表示数据之间的联系的。

      1.层次模型(Hierchical)

      层次模型是数据库系统最早使用的一种模型,它的数据结构是一棵“有向树”。根结点在最上端,层次最高,子结点在下,逐层排列。层次模型的特征是:

    • 有且仅有一个结点没有父结点,它就是根结点;
    • 其他结点有且仅有一个父结点。图所示为一个系教务管理层次数据模型,图(a)所示的是实体之间的联系,图(b)所示的是实体型之间的联系。

      Image:数据模型.jpg

      最有影响的层次模型的DBS是20世纪60年代末,IBM公司推出的IMS层次模型数据库系统。

      2.网状模型(Network)

      网状模型以网状结构表示实体与实体之间的联系。网中的每一个结点代表一个记录类型,联系用链接指针来实现。网状模型可以表示多个从属关系的联系,也可以表示数据间的交叉关系,即数据间的横向关系与纵向关系,它是层次模型的扩展。网状模型可以方便地表示各种类型的联系,但结构复杂,实现的算法难以规范化。其特征是:

    • 允许结点有多于一个父结点;
    • 可以有一个以上的结点没有父结点。

      下图所示为一个系教务管理网状数据模型。

      Image:系教务管理层次数据模型.jpg

      3.关系模型(Relation)

      关系模型以二维表结构来表示实体与实体之间的联系,它是以关系数学理论为基础的。关系模型的数据结构是一个“二维表框架”组成的集合。每个二维表又可称为关系。在关系模型中,操作的对象和结果都是二维表。关系模型是目前最流行的数据库模型。支持关系模型的数据库管理系统称为关系数据库管理系统,Access就是一种关系数据库管理系统。图所示为一个简单的关系模型,其中图(a)所示为关系模式,图(b)所示为这两个关系模型的关系,关系名称分别为教师关系和课程关系,每个关系均含3个元组,其主码均为“教师编号”。

      Image:图关系模型.jpg

    • 描述的一致性,不仅用关系描述实体本身,而且也用关系描述实体之间的联系;
    • 可直接表示多对多的联系;
    • 关系必须是规范化的关系,即每个属性是不可分的数据项,不许表中有表;
    • 关系模型是建立在数学概念基础上的,有较强的理论依据。

      在关系模型中基本数据结构就是二维表,不用像层次或网状那样的链接指针。记录之间的联系是通过不同关系中同名属性来体现的。例如,要查找“刘晋”老师所上的课程,可以先在教师关系中根据姓名找到教师编号“1984030”,然后在课程关系中找到“1984030”任课教师编号对应的课程名即可。通过上述查询过程,同名属性教师编号起到了连接两个关系的纽带作用。由此可见,关系模型中的各个关系模式不应当是孤立的,也不是随意拼凑的一堆二维表,它必须满足相应的要求。

      关系是一个二维表,即元组的集合。关系框架是一个关系的属性名表。形式化表示为:

      R(A_1,A_2,\cdot,A_n)

      其中,R为关系名,Ai(i=1,2,…,n)为关系的属性名。

      关系之间通过公共属性实现联系。例如,图所示为两个关系,通过“教师编号”公共属性实现两个关系之间的联系。

      关系数据库是指对应于一个关系模型的所有关系的集合。例如,在一个教务管理关系数据库中,包含教师关系、课程关系、学生关系、任课关系、成绩关系等。

    展开全文
  • GM(1,1)灰色预测模型

    千次阅读 2019-10-31 14:30:22
    数据分析领域,人们根据数据系统的特点将数据系统分为白色系统,黑色系统和灰色系统。白色系统是说系统内部特征清楚明了,信息完全透明,黑色系统意味着外界对系统内部完全不了解,只能通过外界的联系加以观察研究...

    1.灰色预测模型

    在数据分析领域,人们根据数据系统的特点将数据系统分为白色系统,黑色系统和灰色系统。白色系统是说系统内部特征清楚明了,信息完全透明,黑色系统意味着外界对系统内部完全不了解,只能通过外界的联系加以观察研究,灰色系统介于黑白之间,信息属于半透明状态,只有一部分信息是已知的且系统内各因素间有不确定的关系。

    灰色预测法是一种预测灰色系统的方法。通过鉴别系统因素之间(即:模型参数之间)发展趋势的相异程度,进行关联分析,对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。

    世界万物,错综复杂,很少有从里到外都明白无误的规律。然而尽管如此,每种事物都有又展现出自己独有的功能。这就意味着肯定存在某种内在因素和规律来促使着中功能的展现。通过什么方式去发现它们才是问题的关键。灰色系统是通过对原始数据的整理来寻找这种内在规律和因素;也就是通过对原始数据的生成处理,产生具有规律性的数据序列,即生成灰色序列。灰色序列就是寻找事物内部规律的关键。灰色序列通过某种生成弱化其自身随机性,显现其规律性。数据生成的常用方式有累加生成、累减生成和加权累加生成。在灰色预测模型里,这三种方法都用得到。

    灰色生成数列:

    原始数组:

    x^{^{(0)}}=(x^{^{(0)}}(1),x^{^{(0)}}(2),......x^{^{(0)}}(n))

    1次累加原始数组

    x^{1}(k)=\sum_{i=1}^{k}x^{0}(i)             k=1,2,3.....n

    带有x^{1} =(x^{1}(1),x^{1}(2),......x^{1}(n))

    加权邻值生成:

    原始数列:

    x^{1} =(x^{1}(1),x^{1}(2),......x^{1}(n))

    称任意一对相邻元素x^{1}(k),x^{1}(k-1)互为相邻值。对于常数\alpha \in [0,1]

    z^{1}(k)=\alpha x^{1}(k)+(1-\alpha )x^{1}(k-1)  k=2,3,4,5...n

    由此得到的数列成为邻值生成数列\alpha也成为生成系数。特别是,当生成系数\alpha=0.5时,则称该数列为均值生成数,也称为等权邻值生成数。

    灰色模型时利用离散随机数经过生成变为随机性被显著削弱而规律性加强的生成数,建立起的微分方程形式的模型,这样便于对其变化过程进行研究和描述

    灰色模型GM(1,1)

    对于导数的定义:

    \frac{dx}{dt} = \lim_{\Delta t\rightarrow 0}\frac{x(t+\Delta t)}{\Delta t} 当\Delta t很小,且取的很小的1单位时,(例如,假如t为时间单位,1单位就是1皮淼),上式可以近似地表示为:\frac{\Delta x}{\Delta t}=x(t+1)-x(t)离散化为:

    \Delta x=x(k+1)-x(k)

    继续吧上面的式子转换到1次数据累加:

    \Delta ^{(1)}(x^{(1)}(k+1))=x^{1}(k+1)-x^{1}(k)=\sum_{i=1}^{k+1}x^{0}(i)-\sum_{i=1}^{k}x^{0}(i)=x^{0}(k+1)

    根据上面式子引导我们定义x(1)的灰导数:

    d(k)=\Delta ^{(1)}x^{1}(k)=x^{0}(k)=x^{1}(k)-x^{1}(k-1)

    定义

    z^{(1)}(k)=\alpha x^{(1)}(k)+(1-\alpha )x^{(1)}(k-1)

    为数列x^{(1)}的邻值生成数列。其中\alpha是 x^{(1)}(k)的权重(通常是0.5)有了灰导数和临值生成数列我们可以定义GM(1,1

    的灰微分方程模型:

    x^{(0)}(k)+az^{(1)}(k)=b

    其中,x^{(0)}(k)成为灰导数,a称为发展系数,z^{(1)}(k)称为白化背景值,b称为灰作用量

    k\in \left \{ 2,....,n \right \}

    \begin{Bmatrix} x^{(0)}(2) +\alpha z^{(1)}(2)&=b \\ x^{(0)}(3) +\alpha z^{(1)}(3)&=b& \\ ......& \\ x^{(0)}(n) +\alpha z^{(1)}(n)&=b \end{Bmatrix}

    引入矩阵向量记号

    \mu =\begin{bmatrix} a\\ b \end{bmatrix}   Y=\begin{bmatrix} X^{(0)}(2)\\ X^{(0)}(3)\\ ...\\ X^{(0)}(n) \end{bmatrix}   B=\begin{bmatrix} -Z^{(1)}(2) & 1 \\ -Z^{(1)}(3) & 1 \\ ...... \\ -Z^{(1)}(n) & 1 \end{bmatrix}

    于是GM(1,1)模型可表示为Y=BU,那么现在的问题就是求a和b的值,可以用一元线性回归

    \mu =\begin{bmatrix} a\\ b \end{bmatrix} =(B^{T}B)^{-1}(B^{T}B)^{-1}B^{T}Y   求出系数a,b

    GM(1,1)的白化型:

    对于GM(1,1)的灰微分方程,如果将k=2,3,...n视为连续变量t则之前的x^{(1)}视为时间t的函数,于是灰导数x^{(0)}(k)变为连续函数的导数dx^{(1)}(t)/dt,白化背景值z^{(1)}(k)对应于x^{(1)}(t)于是GM(1,1)的灰微分方程对应的白微分方程为:

    \frac{dx^{(1)}(t)}{dt}+ax^{(1)}(t)=b

    灰色预测的步骤

    1)数据的检验与处理

    为了保证GM(1,1)建模的可行性,需要对已知数据做必要的检验处理,原始数据

    x^{^{(0)}}=(x^{^{(0)}}(1),x^{^{(0)}}(2),......x^{^{(0)}}(n))

    计算数列的级比:

    \lambda (k)=\frac{x^{(0)}(k-1)}{x^{(0)}(k)}

    如果所有的级比\lambda (k)\in (exp(\frac{-2}{n+1}),exp(\frac{2}{n+1}))那么可以说该序列可进行灰色预测,如果级比不满足这个关系,需要进行一定的数据处理,最常用的是平移处理:

    y^{(0)}(k)=x^{(0)}(k)+c  k=1,2,....n

    调节常量c,使数据都落到级比范围内

    2)建立GM(1,1)模型

    原数据:x^{^{(0)}}=(x^{^{(0)}}(1),x^{^{(0)}}(2),......x^{^{(0)}}(n))

    建立灰色模型GM(1,1):

    x^{(0)}(k)+az^{(1)}(k)=b

    利用回归分析确定a,b借助于两个常量系数,确定白化模型:

    \frac{dx^{(1)}(t)}{dt}+ax^{(1)}(t)=b

    求解得:

    x^{(1)}(t)=(x^{(0)}(1)-\frac{b}{a})e^{-a(t-1)}+\frac{b}{a}

    令t=k+1 得到一次累加预测值

    \hat{x} ^{(1)}(k+1)=(x^{(0)}(1)-\frac{b}{a})e^{-a(k)}+\frac{b}{a}

    根据灰导数或者累减生成,还原到原数据

    \hat{x} ^{(0)}(k+1)=\hat{x} ^{(1)}(k+1)-\hat{x} ^{(1)}(k)

     

     

     

    展开全文
  • 数据集成

    万次阅读 2018-05-13 21:16:32
    数据集成内容定义:数据集成是要将互相关联的分布式异构数据源集成到一起, 使用户...数据集成难点: ( 1 ) 异构性: 被集成的数据源通常是独立开发的, 数据模型异构, 给集成带来很大困难。这些异构性主要表现在: 数据...

    数据集成内容


    定义:数据集成是要将互相关联的分布式异构数据源集成到一起, 使用户能够以透明的方式访问这些数据源。

    集成是指维护数据源整体上的数据一致性、提高信息共享利用的效率;

    透明的方式是指用户无需关心如何实现对异构数据源数据的访问,只关心以何种方式访问何种数据。


    数据集成难点:

    ( 1 ) 异构性: 被集成的数据源通常是独立开发的, 数据模型异构, 给集成带来很大困难。这些异构性主要表现在: 数据语义、相同语义数据的表达形式、数据源的使用环境等。

    ( 2 ) 分布性: 数据源是异地分布的, 依赖网络传输数据, 这就存在网络传输的性能和安全性等问题。

    ( 3 ) 自治性: 各个数据源有很强的自治性, 它们可以在不通知集成系统的前提下改变自身的结构和数据, 给数据集成系统的鲁棒性提出挑战。



    数据集成方法:

    1.模式集成方法:

    在构建集成系统时将各数据源的数据视图集成为全局模式, 使用户能够按照全局模式透明地访问各数据源的数据。全局模式描述了数据源共享数据的结构、语义及操作等。用户直接在全局模式的基础上提交请求, 由数据集成系统处理这些请求, 转换成各个数据源在本地数据视图基础上能够执行的请求。 模式集成方法的特点是直接为用户提供透明的数据访问方法。

    模式集成要解决两个基本问题: 构建全局模式与数据源数据视图间的映射关系; 处理用户在全局模式基础上的查询请求。

    联邦数据库和中间件集成方法是现有的两种典型的模式集成方法。


    联邦数据库是早期人们采用的一种模式集成方法。联邦数据库中数据源之间共享自己的一部分数据模式, 形成一个联邦模式。联邦数据库系统按集成度可分为两类: 采用紧密藕合联邦数据库系统和采用松散藕合联邦数据库系统。

    紧密藕合:联邦数据库系统使用统一的全局模式, 将各数据源的数据模式映射到全局数据模式上, 解决了数据源间的异构性。这种方法集成度较高, 用户参与少; 缺点是构建一个全局数据模式的算法复杂, 扩展性差。

    松散藕合:联邦数据库系统比较特殊, 没有全局模式, 采用联邦模式。该方法提供统一的查询语言, 将很多异构性问题交给用户自己去解决。松散藕合方法对数据的集成度不高, 但其数据源的自治性强、动态性能好, 集成系统不需要维护一个全局模式。


    中间件集成方法是另一种典型的模式集成方法, 它同样使用全局数据模式。G.wiedehrold最早给出了基于中间件的集成方法的构架。与联邦数据库不同, 中间件系统不仅能够集成结构化的数据源信息, 还可以集成半结构化或非结构化数据源中的信息, web信息。斯坦福大学Gare:aMolina等人开发了TSIMMIS系统, 就是一个典型的中间件集成系统。

    典型的基于中间件的数据集成系统( 2) 主要包括中间件和包装器, 其中每个数据源对应一个包装器, 中间件通过包装器和各个数据源交互。用户在全局数据模式的基础上向中间件发出查询请求. 中间件处理用户请求, 将其转换成各个数据源能够处理的子查询请求, 并对此过程进行优化, 以提高查询处理的并发性, 减少响应时间。包装器对特定数据源进行了封装, 将其数据模型转换为系统所采用的通用模型, 并提供一致的访问机制。中间件将各个子查询请求发送给包装器, 由包装器来和其封装的数据源交互, 执行子查询请求, 并将结果返回给中间件。

    中间件注重于全局查询的处理和优化, 相对于联邦数据库系统的优势在于: 它能够集成非数据库形式的数据源, 有很好的查询性能, 自治性强; 中间件集成的缺点在于它通常是只读的, 而联邦数据库对读写都支持。

     



    2.数据复制方法

    将各个数据源的数据复制到与其相关的其它数据源上, 并维护数据源整体上的数据一致性、提高信息共享利用的效率.

    数据仓库:该方法将各个数据源的数据复制到同一处数据仓库。用户则像访问普通数据库一样直接访问数据仓库。


    数据异构性问题:

    语法异构和语义异构的区别可以追溯到数据源建模时的差异: 当数据源的实体关系模型相同, 只是命名规则不同时,造成的只是数据源之间的语法异构; 当数据源构建实体模型时, 若采用不同的粒度划分、不同的实体间关系以及不同的字段数据语义表示, 必然会造成数据源间的语义异构, 给数据集成带来很大麻烦.

    语法异构:一般指源数据和目的数据之间命名规则及数据类型存在不同. 对数据库而言, 命名规则指表名和字段名. 语法异构相对简单, 只要实现字段到字段、记录到记录的映射,解决其中的名字冲突和数据类型冲突。这种映射都很直接, 比较容易实现.

    语意异构:字段拆分、字段合并、字段数据格式变换、记间字段转移。 

       3.综合性集成方法:

    模式集成方法为用户提供了全局数据视图及统一的访问接口, 透明度高; 但该方法并没实现数据源间的数据交互, 用户使用时经常需要访问多个数据源, 因此该方法需要系统有很好的网络性能。

    数据复制方法在用户使用某个数据源之前, 将用户可能用到的其它数据源的数据预先复制过来, 用户使用时仅需访问某个数据源或少量的几个数据源, 这会大大提高系统处理用户请求的效率; 但数据复制通常存在延时.使用该方法时,很难保障数据源之间数据的实时一致性。

    为了突破两种方法的局限性, 人们通常将这两种方法混合在一起使用, 即所谓的综合方法。综合方法通常是想办法提高基于中间件系统的性能, 该方法仍有虚拟的数据模式视图供用户使用, 同时能够对数据源间常用的数据进行复制. 对于用户简单的访问请求, 综合方法总是尽力通过数据复制方式. 在本地数据源或单一数据源上实现用户的访间需求; 而对那些复杂的用户请求, 无法通过数据复制方式实现时, 才使用虚拟视图方法。



    4.其他技术:


    网格技术:

    现在进行科学研究所要进行的数据分析、计算变得日益复杂, 需要多种设备和多个系统的协作, 为此人们提出网格计算技术, 试图构建一种能够联合网络中所有资源, 为用户提供一种虚拟的巨型超级计算机系统。而数据网格技术的最终目标是建立异构分布环境下海量数据的一体化存储、管理、访问、传输与服务的架构和环境, 简而言之, 数据网格技术主要解决的是在广域环境下分布的, 异构的, 海量存储资源的统一访问与管理的问题, 可以很好地解决海量数据难于组织、难以处理的问题。数据网格技术是在计算网格技术的基础上发展起来的, 对于数据集型的大型科学研究具有重大的科研和应用价值, 它为广域的具有数据密集型或协作特点的大型科学应用和研究提供了支撑平台。


    本体技术:

    本体是对某一领域中的概念及其之间关系的显式描述。是语义网络的项关键技术。本体技术能够明确表示数据的语义以及支持基于描述逻辑的自动推理, 为语义异构性问题的解决提供了新的思路, 对异构数据集成来说应该有很大的意义。

    采取本体技术和中间件相结合的方法: 采用中间件架构, 支持虚拟视图或视图集合, 且不存储任何异构数据库中的实际数据。为了更好地解决语义异构, 在中间件中引入了一个本体库。

    应用层:为用户提供访问数据库的接口。

    中间件层:中间件层从更高层次上屏蔽了数据源的分布性和异构性。用户认为所有的数据都是本地的, 处于同一服务域中, 而具体的查询请求的处理、结果的返回都由中间层负责。中间件主要由中介器、包装器和本体库3个部分组成, 其中, 中介器又包括查询生成器、查询分解引擎、查询执行引擎和结果处理4 个功能组件。

    数据源层:每一个数据源都采取本地管理的方式对数据进行管理。


    展开全文
  • 神经网络模型简述 实例:交通运输能力预测设计 MATLAB程序及仿真结果 由于货物运输、地方经济及企业发展的紧密联系,因此作为反映货物运输需求的一项重要指标, 货运量预测研究和分析具有较强的实际意义。 常用的...

    目录

    神经网络模型简述

    实例:交通运输能力预测设计

    MATLAB程序及仿真结果


        由于货物运输、地方经济及企业发展的紧密联系,因此作为反映货物运输需求的一项重要指标, 货运量预测研究和分析具有较强的实际意义。

        常用的货运量预测方法包括时间序列方法、移动平滑法、指数平滑和随机时间序列方法、相关(回归)分析法、灰色预测方法和作为多种方法综合的组合预测方法等.这些方法大都集中在对其因果关系回归模型和时间序列模型的分析上, 所建立的模型不能全面和本质地反映所预测动态数据的内在结构和复杂特性, 从而丢失了信息量.人工神经网络作为一种并行的计算模型, 具有传统建模方法所不具备的很多优点, 有很好的非线性映射能力, 对被建模对象的经验知识要求不多, 一般不必事先知道有关被建模对象的结参数和动作特性等方面的知识, 只需给出对象的输入和输出数据, 通过网络本身的学习功能就可以达到输入与输出的映射关系.货运量预测可以利用BP 网络模型和径向基网络模型来实现。

     

    神经网络模型简述

    BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,其激励函数是一般是S函数(即sigmoid函数)。从结构上讲,BP网络具有输入层、隐藏层和输出层;从本质上讲,BP算法就是以网络误差平方为目标函数、采用梯度下降法来计算目标函数的最小值。

    径向基神经网络(RBF神经网络)是一种性能良好的前向网络,其激励函数是一般是高斯函数。具有最佳逼近、训练简洁、学习收敛速度快以及克服局部最小值问题的性能,目前已经证明RBF网络能够以任意精度逼近任意连续的函数,且具有全局逼近能力,从根本上解决了BP网络的局部最优问题,而且拓扑结构紧凑,结构参数可实现分离学习,收敛速度快。因此它已经被广泛应用于模式识别、非线性控制和图像处理等领域。

     

    实例:交通运输能力预测设计

        输入的神经元可以根据需要求解的问题和数据表示方式确定。根据对关于货运量影响因素的分析,这里分别取国内生产总值GDP 、工业总产值、铁路运输路线长度、复线里程比重、公路运输线路长度、等级公路比重、铁路货车数量和民用载货车辆数量等8 项指标作为货运量的影响因子, 将它们作为网络的输入.以货运总量、铁轮货运量和公路货运量作为网络输出.由此来构建BP 网络和RBF网络。利用某7 年的历史统计数据作为网络的训练样本, 以后续2 年的历史统计数据作为网络的外推测试样本.输入样本如表1 所示, 目标样本如表2 所示.

     

    表 1  输入的样本数据

    GDP

    工业

    总产

    铁路

    运输

    长度

    复线

    比重

    公路

    运输

    长度

    等级

    公路

    比重

    铁路

    货运

    数量

    民用

    载货

    车辆

    58478

    135185

    5.30

    0.23

    16.2

    0.21

    1015.3

    586.4

    67884

    152369

    5.30

    0.27

    18.5

    0.26

    1107.6

    577

    74462

    182563

    6.21

    0.25

    21.4

    0.28

    1214.6

    601.2

    78345

    201587

    6.32

    0.26

    25.7

    0.29

    1336.5

    626.8

    82067

    225689

    6.32

    0.26

    30.2

    0.31

    1443.5

    675.96

    89403

    240568

    6.47

    0.28

    34.6

    0.33

    1516.2

    726.31

    95933

    263856

    6.48

    0.28

    39.5

    0.36

    1642.6

    764.25

    104790

    285697

    6.70

    0.30

    42.0

    0.39

    1763.1

    852.21

    116694

    308765

    6.70

    0.30

    46.3

    0.41

    1867.1

    878.23

     

    表 2  目标样本

     

    货运量

    铁路货运量

    公路货运量

    102467

    52266

    46153

    124486

    60728

    56246

    148691

    69355

    67346

    162663

    79757

    78267

    186695

    91757

    95647

    205764

    99736

    98756

    226697

    109965

    102765

    245716

    120537

    111258

    263683

    130465

    120412

        由于输入的每组样本数据包含8 项, 所以神经网络的输入层设置8个神经元。每组输入样本对应的目标样本包含3 项,所以输出层设置3 个神经元。

        

    关于隐含层的设计:

        一般来讲, 一个三层的神经网络可以完成任意n 维输入到m 维输出的映射.但实际上, 隐层的层数和单元数的选择尚无理论上的指导, 一般是根据经验或者反复实验确定.因此, 网络往往存在很大的冗余性, 一定程度上增加了网络学习的负担.隐单元数目太多会导致学习时间过长、误差不一定最佳, 也会导致容错性差、不能识别以前没有看到的样本, 因此一定存在一个最佳的隐单元数.文中建立的BP神经网络模型中, 隐层神经元个数介于5-17.通过训练结果中误差的大小最终确定隐层中神经元的个数为14 .而RBF神经网络采用正规化网络模型,隐单元的个数与训练样本的个数相同,即7个.

     

    MATLAB程序及仿真结果

     

     

    BP网络程序:

    p=[58478 135185 5.30 0.23 16.2 0.21 1015.3 586.4;
    67884 152369 5.30 0.27 18.5 0.26 1107.6 577;
    74462 182563 6.21 0.25 21.4 0.28 1214.6 601.2;
    78345 201587 6.32 0.26 25.7 0.29 1336.5 626.8;
    82067 225689 6.32 0.26 30.2 0.31 1443.5 675.96;
    89403 240568 6.47 0.28 34.6 0.33 1516.2 726.31;
    95933 263856 6.48 0.28 39.5 0.36 1642.6 764.25]';
    t=[102467 52266 46153;124486 60728 56246;
    148691 69355 67346;162663 79757 78267;
    186695 91757 95647;205764 99736 98756;
    226697 109965 102765]';
    t1=clock;#对应于测试样本的目标输出
    TF1 = 'tansig';TF2 = 'logsig'; 
    net=newff(p,t,[14,3],{TF1 TF2 },'trainlm');
    Net.trainParam.show=500;
    net.trainParam.epochs=1000;
    net.trainParam.goal=0.0001;
    net=train(net,p,t);
    date=etime(clock,t1)
    y=sim(net,p);
    p1=[104790 285697 6.70 0.30 42.0 0.39 1763.1 852.21;116694 308765 6.70 0.30 46.3 0.41 1867.1 878.23]';#测试样本
    y1=sim(net,p1)#测试样本p1对应的BP网络实际输出
    

    BP网络程序运行结果:

    可以看出, 网络在训练18次(Epoch)后就收敛于目标函数.当带入2 组测试样本P1后, 网络的实际输出为:

    y1 =1.0e+05 *
        2.2598    2.2802
        1.1027    1.1147
        1.0390    1.0464
    耗时:date =0.6080


    RBF网络程序:

     

    p=[58478 135185 5.30 0.23 16.2 0.21 1015.3 586.4;
    67884 152369 5.30 0.27 18.5 0.26 1107.6 577;
    74462 182563 6.21 0.25 21.4 0.28 1214.6 601.2;
    78345 201587 6.32 0.26 25.7 0.29 1336.5 626.8;
    82067 225689 6.32 0.26 30.2 0.31 1443.5 675.96;
    89403 240568 6.47 0.28 34.6 0.33 1516.2 726.31;
    95933 263856 6.48 0.28 39.5 0.36 1642.6 764.25]';
    t=[102467 52266 46153;
    124486 60728 56246;
    148691 69355 67346;
    162663 79757 78267;
    186695 91757 95647;
    205764 99736 98756;
    226697 109965 102765]';
    t2=clock;
    net=newrb(p,t);
    datet=etime(clock,t2)
    p1=[104790 285697 6.70 0.30 42.0 0.39 1763.1 852.21;
    116694 308765 6.70 0.30 46.3 0.41 1867.1 878.23]';
    y1=sim(net,p1)
    

    RBF网络程序执行结果:

     

    y1 =1.0e+05 *
        2.2670    2.2670
        1.0996    1.0996
        1.0277    1.0277
    耗时:date = 0.0780

    由于训练样本容量比较小,只有7 组数据, 所以预测精度不是很高.考虑到这些因素, 这里得到的预测结果还是可以接受的。

    但从耗时来看,RBF网络的耗时远远小于BP网络,随着样本数据量加大,两者在耗时上的差距会越来越明显。

     

    RBF网络的优点:
    ①  它具有唯一最佳逼近的特性,且无局部极小问题存在。
    ②  RBF神经网络具有较强的输入和输出映射功能,并且理论证明在前向网络中RBF网络是完成映射功能的最优网络。
    ③  网络连接权值与输出呈线性关系。
    ④  分类能力好。
    ⑤  学习过程收敛速度快。

     

     

     

    展开全文
  • 第一章 矢量数据模型 矢量数据模型,也称为离散对象模型,是采用离散对象来表示地球表面的空间要素的。基于这一概念,矢量数据可以用个基本步骤制备。①在一个空的空间将空间要素分为点、线和多边形,并用点及其...
  • 、协整分析 协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。 ADF t-Statistic Prob. Roe 与Ocf -2.7700*** 0....
  • 数据仓库常见建模方法与建模实例演示

    万次阅读 多人点赞 2020-04-14 15:52:09
    1.数据仓库建模的目的? 为什么要进行数据仓库建模?大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑 访问性能:能够快速...
  • 云计算三种模型

    千次阅读 2019-09-09 21:42:04
    通常有三种云服务模型:SaaS(软件即服务),PaaS(平台即服务)和IaaS(基础架构即服务)。 每个都自己的好处和差异。为了您的组织能作出最佳选择,您必要了解SaaS,PaaS和IaaS之间的差异。 SaaS: 软件即服务 ...
  • Conceptual Data Model 概念数据模型(CDM)帮助您分析信息系统的概念结构,以识别要表示的主要实体、它们的属性以及它们之间的关系。 CDM比逻辑(LDM)或物理(PDM)数据模型更抽象。 1.新建概念数据模型 2.创建域...
  • 种常见的软件开发模型

    万次阅读 2017-01-02 19:21:21
    软件开发模型(Software Development Model)是指软件开发全部过程、活动和任务的结构框架。软件开发包括需求、设计、编码和测试等阶段,有时也包括维护阶段。软件开发模型能清晰、直观地表达软件开发全过程,明确...
  • 就是人们常说的分类,通过已的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出...
  • 数据分析---Fama-French因子模型

    万次阅读 多人点赞 2020-03-31 22:44:11
    短短二十行,只需两个库,就能构建Fama-French因子模型,快来看看吧!
  • 数据完整性是指数据库中存储的数据是有意义的或正确的,和现实世界相符。关系模型类完整性约束: – 实体完整性(Entity Integrity) – 参照完整性(Referential Integrity) – 用户定义的完整性(User-...
  • OLAP和多维数据模型

    万次阅读 多人点赞 2017-11-09 15:56:36
    联机分析处理OLAP是一软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。 它具有FASMI(Fast Analysis of Shared Multidimensional Information),即共享多维信息的...
  • 机器学习要素之数据模型、算法

    千次阅读 多人点赞 2019-06-20 19:38:58
    机器学习要素包括数据模型、算法。简单来说,这要素之间的关系,可以用下面这幅图来表示: 总结成一句话:算法通过在数据上进行运算产生模型。 下面我们先分别来看个要素。 数据 关于数据,其实...
  • 维空间数据模型及结构

    千次阅读 2015-03-21 15:18:32
    近几年,很多人都在致力于数据模型的研究,虽然有三维GIS系统问世,但其功能远远不能满足人们分析问题的需要。原因主要是维GIS理论不成熟,其拓扑关系模型一直没有解决,另外维基础上的数据量很大,很难建立...
  • 常见集成模型总结

    千次阅读 2018-07-16 22:56:08
    Bagging(Bootstrap汇总)是一集成方法。首先,我们创建随机训练数据集样本(训练数据集的子集)。然后我们为每个样本建立分类器。最后,这些多分类器的结果将结合起来,使用平均或多数投票。Bagging助于降低...
  • 什么是星型模型

    千次阅读 2019-02-12 15:18:36
    星型模型是最简单的数据集市模型,是最广泛用于开发数据仓库和维度数据集市的方法。星型模型由一个或多个引用任意数量的维度表的事实表组成。 星型模型是雪花模型的一个重要特例,对于处理更简单的查询更有效。 星型...
  • 数据分析-PART2--10大数据分析模型

    万次阅读 多人点赞 2018-07-31 10:00:39
    数据分析-PART2--10大数据分析模型 数据分析-PART3--数据分析常用指标 数据分析-PART4--数据分析方法 数据分析-PART5--数据分析可视化 数据分析-PART6--数据分析能力培养 数据分析-PART 7--数据分析工具网站...
  • 《数据库原理》— 数据库系统概论第五版习题解析

    万次阅读 多人点赞 2017-05-29 14:57:48
    数据的种类数字、文字、图形、图像、声音、正文等。数据与其语义是不可分的。解析在现代计算机系统中数据的概念是广义的。早期的计算机系统主要用于科学计算,处理的数据是整数、实数、浮点数等传统数学中的数据。...
  • 机器学习中最常见的四分类模型

    万次阅读 多人点赞 2020-05-23 12:30:00
    点击蓝字关注我,干货领取!作者:Jason Brownlee翻译:候博学前言 机器学习是一个从训练集中学习出算法的研究领域。分类是一项需要使用机器学习算法的任务,该算法学习如何为数据集...
  • [GIS原理] 3 空间数据模型

    千次阅读 多人点赞 2018-11-22 20:31:05
    文章目录相关概念空间数据模型地理空间空间现象空间实体地理空间与空间抽象概念数据模型逻辑数据模型物理数据模型空间数据结构GIS所考虑的对象地理空间数据的概念模型对象模型/要素模型场模型网络模型选择空间数据...
  • 数据库学习:数据模型

    万次阅读 2018-05-30 14:31:59
    前言正题在开始编写文章前,几个问题需要思考一下:什么数据模型生成数据模型的业务规则数据模型构成数据模型的类别1. 什么是数据模型数据模型(data model)是对复杂现实世界数据结构的一简单表达,如采用图形...
  • 作者:Chris St. Jeor &...这篇文章将围绕如何构建一个时间序列模型,并将列举个基本步骤:使数据平稳,选择正确的模型,以及评估模型的准确性。本篇文章所使用的历史页面视图数据示例来源于一家大型汽车营销公司。...
  • 业务模型;UML类图
  • 你应该掌握的 7 回归模型

    万次阅读 多人点赞 2018-07-19 21:26:56
    事实是有很多回归形式,每回归都有其特定的适用场合。在这篇文章中,我将以简单的形式介绍 7 中最常见的回归模型。通过这篇文章,我希望能够帮助大家对回归有更广泛和全面的认识,而不是仅仅知道使用线性回归和...
  • ArcGIS矢量数据模型

    千次阅读 2017-12-01 14:41:33
    在过去20年中,矢量数据模型是GIS中变化最大的方面,例如,ESRI公司所开发每新软件包都对应一新的矢量数据模型,ArcView对应Shapefile,Arc/Info对应Coverage,ArcGIS对应Geodatabase。Shapefile和Coverage是...
  • Verilog基础知识

    千次阅读 2019-09-05 18:58:06
    1. Verilog语法的基本概念 Verilog HDL是一用于数字系统设计的语言。Verilog HDL既是一行为描述的语言也是一结构描述的...这些抽象的级别和它们所对应的模型类型共有以下5。 系统级(system-level):...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 665,687
精华内容 266,274
关键字:

常见的数据模型有三种,它们是