精华内容
下载资源
问答
  • 因此,为了建立起富有成效知识管理体系,企业必须有所为,有所不为,把知识管理重点放在影响企业生存与发展最重要知识——核心知识上面,即通过建立企业核心知识管理体系,来提高知识管理成效。
  • 工资管理需要和人事管理相联系,同时连接工时考勤和医疗保险等等,来生成企业每个职工的基本工资、津贴、医疗保险、保险费、实际发放工资等。资金是企业生存的主要元素,资金的流动影响企业的整体运作,企业员工的...
  • 电子商务网站市企业开展电子商务基础设施和信息平台是实施电子商务公司或商家与服务对象之间交互界面是电子商务系统运转承担者和表现者 区别与一般web站点以数据处理为主数据类型复杂数据流量大数据交换频繁...
  • 在这种升级改造的过程中,怎么处理和利用那些历史遗留下来的老系统,成为影响新系统建设成败和开发效率的关键因素之一。通常称这些老系统为遗留系统。 目前,学术和工业界对遗留系统的定义没有统一的意见。Bennett ...

    计算机技术飞速发展,日新月异,许多企业因为业务发展的需要和市场竞争的压力,需要建设新的企业信息系统。在这种升级改造的过程中,怎么处理和利用那些历史遗留下来的老系统,成为影响新系统建设成败和开发效率的关键因素之一。通常称这些老系统为 遗留系统。     

    目前,学术和工业界对遗留系统的定义没有统一的意见。Bennett  1995 年对遗留系统做了如下的定义:遗留系统是不知道如何处理但对组织又至关重要的系统。Brodie  Stonebraker 对遗留系统的定义如下:遗留系统是指任何基本上不能进行修改和演化以满足新的变化了的业务需求的信息系统。     

    笔者认为,遗留系统应该具有以下特点: 

        1)系统虽然能完成企业中许多重要的业务管理工作,但已经不能完全满足要求。一般实现业务处理电子化及部分企业管理功能,很少涉及经营决策。 

        2)系统在性能上已经落后,采用的技术已经过时。如多采用主机/终端形式或小型机系统,软件使用汇编语言或第三代程序设计语言的早期版本开发,使用文件系统而不是数据库。 

        3)通常是大型的系统,已经融入企业的业务运行和决策管理机制之中,维护工作十分困难。 

        4)系统没有使用现代系统工程方法进行管理和开发,现在基本上已经没有文档,很难理解。 在企业信息系统升级改造过程中,如何处理和利用遗留系统,成为新系统建设的重要组成部分。处理恰当与否,直接关系到新系统的成败和开发效率。遗留系统的演化方式可以有很多种,根据系统的技术条件、商业价值及维护和运行系统的组织特征不同,可以采取继续维护、某种形式的重构或替代策略,或者联合使用几种策略。究竟采用哪些策略来处理遗留系统,需要根据对遗留系统的所有系统特性的评价来确定。

    遗留系统的评价方法

    对遗留系统评价的目的是为了获得对遗留系统更好的理解,这是遗留系统演化的基础,是任何遗留系统演化项目的起点。本文的评价方法包括度量系统技术水准、商业价值和与之关联的组织特征,其结果作为选择处理策略的基础。评价方法由一系列活动组成,如下图所示。 

    启动评价 

    评价是为了获得对遗留系统的足够深度的理解,从技术、商业和企业角度对系统的理解为系统处理策略提供基础,开始评价前,需要了解以下问题。 

    (1)对企业来说,遗留系统是否是至关重要的。在评价过程中,可能会发现系统对企业的继续运作产生的影响不大。在这种情况下,就没有必要考虑系统的演化问题。     

    2)企业的商业目标是什么。从商业观点来看,评估师必须理解企业的商业目标,因为商业目标产生演化需求。 

    (3)演化需求是什么。演化需求来自企业的商业目标和评价活动。需求必须是可见的,以便决定已存在的系统是否能满足需求。 

    (4)所期望的系统寿命多长。一个系统的寿命由软件和硬件的服务能力决定,一旦系统硬件或支撑软件过时,系统的有效性就受到限制。 

    (5)系统使用期限多久。如果系统的使用期限只是短期的,就没有必要花费成本来演化系统。相反,如果系统将在相当长的时期内支持主要业务流程,则必须进行演化。     

    6)系统的技术状态如何。例如,如果应用软件的技术状况很差,则很难理解,维护费用会很高。 

    (7)企业是否愿意改变。企业对改变的态度是遗留系统演化成功的关键因素之一。     

    8)企业是否有能力承受演化。企业的技术成熟度,员工的素质,支撑工具的级别等都是影响演化的因素。 

    商业价值评价     

    商业价值评价的目标是判断遗留系统对企业的重要性。在多数情况下,重要业务过程的改变意味着旧的系统现在仅仅具有外围价值,修改这种系统只需花费少许财力和物力。     在其他情况下,系统的业务价值很大,需要继续维护运行。可以在概要和详细两个级别上进行遗留系统的商业价值评价。    

    概要级评价将为更加详细的分析提供信息。概要级评价包括: 

        1)咨询。向有关专家进行咨询,包括最终用户和负责业务处理的管理人员。 

        2)评价问卷。问卷应该标识系统在业务处理过程中的哪些地方使用,本系统与其他系统的关系,如果系统不再运行所需的代价,系统已有的缺点和存在的问题等。问题的准确性依赖于所评价的系统。 

        3)进行评价。有了问卷的基础后,必须认真分析系统是如何使用的,这往往会发现系统的价值,而这在问卷中是得不到的。(详细级评价包括应用系统不符合业务规范的风险分析,这种分析十分费时,最好由业务分析师来完成详细级的评价。)  

    外部环境评价

    系统的外部技术环境是指硬件、支撑软件和企业基础设施的统一体。     

    1)硬件。系统硬件包括许多需要进行常规性维护的部件,这些硬件或者在一个站点,或者分布在许多站点并由网络连接。一般来说,遗留系统的硬件包括主机和小型机、磁盘驱动器、磁带、终端、打印机和网络硬件。     与商业价值评价类似,硬件评价也可以分为概要级评价和详细级评价。概要级评价把遗留系统作为一个整体,提供硬件质量估计。详细级评价包括识别系统中的每个部件。在这两种情况下,必须识别一系列特征,用作评价的基础。特征的选择取决于要评价的系统,系统的一些常见特征有供应商、维护费用、失效率、年龄、功能、性能等。     具体评价方法是:每一个部件(或整个系统)在每个特征上分配一个价值分数(取值为 1~4),然后把所有分数相加,获得该部件的总分。 

        2)支撑软件。系统的支撑软件环境也由许多部分组成,可包括操作系统、数据库、事务处理程序、编译器、网络软件、应用软件等。一般来说,支撑软件是依赖于某个硬件的,应用软件依赖于系统软件。在评价过程中,必须考虑这种依赖性。支撑软件的评价方法类似于硬件评价,在此省略。 

        3)企业基础设施。企业基础设施包括开发和维护系统的企业职责和运行该系统的企业职责(两者可能为同一个企业),这些基础设施是很难评价的,但对遗留系统的演化起关键作用。因此必须考虑以下问题。 企业和使用者的类型。企业或者有自己的系统开发队伍,或者所有开发和应用管理都是请其他企业完成。系统用户或许只重复一些记录性工作,或许包括一些更有技术性的工作。 开发组织的技术成熟度。开发组织的技术成熟度包括是否使用了现代系统工程方法,是否遵循了统一的标准,是否进行了过程改进等。 企业的培训过程。如果企业(包括开发方和客户方)的培训做得好,遗留系统的演化可能会更成功。 系统支持人员的技术水平。如果系统支持人员的水平和经验不够,就不要急于对系统做大的改动。 企业是否愿意改变。企业对改变的态度是遗留系统演化成功的关键因素之一。企业基础设施的评价方法类似于硬件评价,在此省略。 

    应用软件评价

    应用软件评价也有两个级别。 

    (1)系统级。把整个系统看作是不可分的原子,评价时不考虑系统的任何部分。 

    (2)部件级。关注系统的每个子系统,考虑每个子系统的特征,包括复杂性、数据、文档、外部依赖性、合法性、维护记录、大小、安全性等。具体评价方法也与硬件评价类似,在此省略。  

    分析评价结果

    评价活动将产生硬件、支撑软件、企业基础设施和应用软件的特征值矩阵,这些特征值体现了遗留系统当前的技术因素,其加权平均值代表了系统的技术水平。

     

    遗留系统的演化策略 

     

    在上图中,把对遗留系统的评价结果分列在坐标的四个象限内。对处在不同象限的遗留系统采取不同的演化策略。  

    淘汰策略 

     3 象限为低水平、低价值区,即遗留系统的技术含量较低,且具有较低的商业价值。对这种遗留系统的演化策略为淘汰,即全面重新开发新的系统以代替遗留系统。     完全淘汰是一种极端性策略,一般是企业的业务产生了根本的变化,遗留系统基本上不再适应企业运作的需要;或者是遗留系统的维护人员、维护文档资料都丢失了。经过评价,发现将遗留系统完全淘汰,开发全新的系统比改造旧系统从成本上更合算。 对遗留系统的完全淘汰是企业资源的根本浪费,应该善于“变废为宝”,通过对遗留系统功能的理解和借鉴,可以帮助新系统的设计,降低新系统开发的风险。 

    继承策略 

     4 象限为低水平、高价值区,即遗留系统的技术含量较低,可满足企业运作的功能或性能要求,但具有较高的商业价值,目前企业业务对该系统仍有很大的依赖性。对这种遗留系统的演化策略为继承。在开发新系统时,需要完全兼容遗留系统的功能模型和数据模型。为了保证业务的连续性,新老系统必须并行运行一段时间,再逐渐切换到新系统上运行。 要做到对遗留系统的继承,必须对系统进行分析,得到旧系统的功能模型和数据模型,这种分析可以部分代替或验证系统的需求分析。     如果遗留系统的维护文档不完整,而又必须解析系统的功能模型和数据模型,那将是一项十分艰巨的任务。这时可使用有关系统重构的 CASE 工具,通过分析系统的代码生成系统结构图或其他报告。 

    改造策略  

     1 象限为高水平、高价值区,即遗留系统的技术含量较高,本身还有较大的生命力,且具有较高的商业价值,基本上能够满足企业业务运作和决策支持的要求。这种系统可能建成的时间还很短,对这种遗留系统的演化策略为改造。     这些改造包括系统功能的增强和数据模型的改造两个方面。系统功能的增强是指在原有系统的基础上增加新的应用要求,对遗留系统本身不做改变。数据模型的改造是指将遗留系统的旧的数据模型向新的数据模型转化的过程。 

    集成策略 

     2 象限为高水平、低价值区,即遗留系统的技术含量较高,但其商业价值较低,可能只完成某个部门(或子公司)的业务管理。这种系统在各自的局部领域里工作良好,但从企业全局来看,多个这样的系统,他们各自基于不同的平台,不同的数据模型,无法互联互通,数据还不一致,这就是很严重的问题了。对这种遗留系统的演化策略为集成。在集成过程中,可采用由互连系统构成的系统的架构,遗留系统可作为从属系统来描述。 在企业信息系统建设过程中,如何处理那些遗留系统,将会是越来越突出的问题,因为即使是今天看来很先进的系统在明天也会成为遗留系统。对遗留系统的处理恰当与否,直接关系到新系统的成败和开发效率。如何建立一套系统的、行之有效的方法,以期望对实际工作有所指导,已成为一个迫切的问题。在实际工程项目中,遇到处理遗留系统的问题时,要具体情况具体分析,选择最佳的演化策略。 

    展开全文
  • 当一个企业要进行过程改进的时候,首先要做的事情就是发现和定义问题,然后针对问题...因此,当我们致力于发现和定义企业存在的问题,以期找到过程改进目标的时候,应该重在挖掘影响效率的因素,并且形成解决方案。近年
  • 在研究知识共享活动基本过程基础上,分析了知识共享效率影响因素,得出效率评价指标体系。然后,运用粗糙集理论对评价指标进行预处理,去除冗余指标项,在合理化评价指标体系同时减少网络输入维度,进而采用RBF...
  • 在这种升级改造的过程中,怎么处理和利用那些历史遗留下来的老系统,成为影响新系统建设成败和开发效率的关键因素之一。通常称这些老系统为遗留系统。 目前,学术和工业界对遗留系统的定义没有统一的意见 。Bennett ...

    计算机技术飞速发展,日新月异,许多企业因为业务发展的需要和市场竞争的压力,需要建设新的企业信息系统。在这种升级改造的过程中,怎么处理和利用那些历史遗留下来的老系统,成为影响新系统建设成败和开发效率的关键因素之一。通常称这些老系统为遗留系统。

    目前,学术和工业界对遗留系统的定义没有统一的意见 。Bennett 在 1995 年对遗留系统做了如下的定义:遗留系统是不知道如何处理但对组织又至关重要的系统 。Brodie 和 Stonebraker 对遗留系统的定义如下:遗留系统是指任何基本上不能进行修改和演化以满足新的变化了的业务需求的信息系统。

    遗留系统应该具有以下特点:
    (1)系统虽然能完成企业中许多重要的业务管理工作,但已经不能完全满足要求。一般实现业务处理电子化及部分企业管理功能,很少涉及经营决策。
    (2)系统在性能上已经落后,采用的技术已经过时。如多采用主机/终端形式或小型机系统,软件使用汇编语言或第三代程序设计语言的早期版本开发,使用文件系统而不是数据库。
    (3)通常是大型的系统,已经融入企业的业务运行和决策管理机制之中,维护工作十分困难。
    (4)系统没有使用现代系统工程方法进行管理和开发,现在基本上已经没有文档,很难理解。

    在企业信息系统升级改造过程中,如何处理和利用遗留系统,成为新系统建设的重要组成部分。处理恰当与否,直接关系到新系统的成败和开发效率。遗留系统的演化方式可以有很多种,根据系统的技术条件 、 商业价值及维护和运行系统的组织特征不同,可以采取继续维护 、 某种形式的重构或替代策略,或者联合使用几种策略。究竟采用哪些策略来处理遗留系统,需要根据对遗留系统的所有系统特性的评价来确定。

    1 遗留系统的评价方法

    对遗留系统评价的目的是为了获得对遗留系统更好的理解,这是遗留系统演化的基础,是任何遗留系统演化项目的起点。本文的评价方法包括度量系统技术水准 、 商业价值和与之关联的组织特征,其结果作为选择处理策略的基础。

    评价方法由一系列活动组成,如图 1 所示。

    1.1 启动评价

    评价是为了获得对遗留系统的足够深度的理解,从技术 、 商业和企业角度对系统的理解为系统处理策略提供基础,开始评价前,需要了解以下问题。
    (1)对企业来说,遗留系统是否是至关重要的。在评价过程中,可能会发现系统对企业的继续运作产生的影响不大。在这种情况下,就没有必要考虑系统的演化问题。
    (2)企业的商业目标是什么。从商业观点来看,评估师必须理解企业的商业目标,因为商业目标产生演化需求。
    (3)演化需求是什么。演化需求来自企业的商业目标和评价活动。需求必须是可见的,以便决定已存在的系统是否能满足需求。
    (4)所期望的系统寿命多长。一个系统的寿命由软件和硬件的服务能力决定,一旦系统硬件或支撑软件过时,系统的有效性就受到限制。
    (5)系统使用期限多久。如果系统的使用期限只是短期的,就没有必要花费成本来演化系统。相反,如果系统将在相当长的时期内支持主要业务流程,则必须进行演化。
    (6)系统的技术状态如何。例如,如果应用软件的技术状况很差,则很难理解,维护费用会很高。
    (7)企业是否愿意改变。企业对改变的态度是遗留系统演化成功的关键因素之一。
    (8)企业是否有能力承受演化。企业的技术成熟度,员工的素质,支撑工具的级别等都是影响演化的因素。

    1.2 商业价值评价

    商业价值评价的目标是判断遗留系统对企业的重要性。

    在多数情况下,重要业务过程的改变意味着旧的系统现在仅仅具有外围价值,修改这种系统只需花费少许财力和物力。在其他情况下,系统的业务价值很大,需要继续维护运行。可以在概要和详细两个级别上进行遗留系统的商业价值评价。

    概要级评价将为更加详细的分析提供信息。概要级评价包括:
    (1)咨询。向有关专家进行咨询,包括最终用户和负责业务处理的管理人员。
    (2)评价问卷。问卷应该标识系统在业务处理过程中的哪些地方使用,本系统与其他系统的关系,如果系统不再运行所需的代价,系统已有的缺点和存在的问题等。问题的准确性依赖于所评价的系统。
    (3)进行评价。有了问卷的基础后,必须认真分析系统是如何使用的,这往往会发现系统的价值,而这在问卷中是得不到的。

    详细级评价包括应用系统不符合业务规范的风险分析,这种分析十分费时,最好由业务分析师来完成详细级的评价。

    1.3 外部环境评价

    系统的外部技术环境是指硬件、支撑软件和企业基础设施的统一体。

    (1)硬件

    系统硬件包括许多需要进行常规性维护的部件,这些硬件或者在一个站点,或者分布在许多站点并由网络连接。一般来说,遗留系统的硬件包括主机和小型机 、 磁盘驱动器 、 磁带 、 终端 、 打印机和网络硬件。

    与商业价值评价类似,硬件评价也可以分为概要级评价和详细级评价。概要级评价把遗留系统作为一个整体,提供硬件质量估计。详细级评价包括识别系统中的每个部件。在这两种情况下,必须识别一系列特征,用作评价的基础。

    特征的选择取决于要评价的系统,系统的一些常见特征有供应商 、 维护费用 、 失效率 、 年龄 、 功能 、 性能等。具体评价方法是:每一个部件(或整个系统)在每个特征上分配一个价值分数(取值为1~4),然后把所有分数相加,获得该部件的总分。

    (2)支撑软件

    系统的支撑软件环境也由许多部分组成,可包括操作系统 、 数据库 、 事务处理程序 、 编译器 、 网络软件 、 应用软件等。一般来说,支撑软件是依赖于某个硬件的,应用软件依赖于系统软件。在评价过程中,必须考虑这种依赖性。支撑软件的评价方法类似于硬件评价,在此省略。

    (3)企业基础设施

    企业基础设施包括开发和维护系统的企业职责和运行该系统的企业职责(两者可能为同一个企业),这些基础设施是很难评价的,但对遗留系统的演化起关键作用。因此必须考虑以下问题。

    • 企业和使用者的类型。企业或者有自己的系统开发队伍,或者所有开发和应用管理都是请其他企业完成。系统用户或许只重复一些记录性工作,或许包括一些更有技术性的工作。
    • 开发组织的技术成熟度。开发组织的技术成熟度包括是否使用了现代系统工程方法,是否遵循了统一的标准,是否进行了过程改进等。
    • 企业的培训过程。如果企业(包括开发方和客户方)的培训做得好,遗留系统的演化可能会更成功。
    • 系统支持人员的技术水平。如果系统支持人员的水平和经验不够,就不要急于对系统做大的改动。
    • 企业是否愿意改变。企业对改变的态度是遗留系统演化成功的关键因素之一。
    • 企业基础设施的评价方法类似于硬件评价,在此省略。

    1.4 应用软件评价

    应用软件评价也有两个级别。

    (1)系统级。把整个系统看作是不可分的原子,评价时不考虑系统的任何部分。
    (2)部件级。关注系统的每个子系统,考虑每个子系统的特征,包括复杂性 、 数据 、 文档 、 外部依赖性 、 合法性 、 维护记录 、 大小 、 安全性等。

    具体评价方法也与硬件评价类似,在此省略。

    1.5 分析评价结果

    评价活动将产生硬件 、 支撑软件 、 企业基础设施和应用软件的特征值矩阵,这些特征值体现了遗留系统当前的技术因素,其加权平均值代表了系统的技术水平。

    把对技术水平的全面评价结果与商业评价进行比较,可以为系统演化提供第一手的资料。具体方法是按照商业评价分值和技术水平分值的情况,把评价结果分为四种类型,如图 2 所示。

    2 遗留系统的演化策略

    在图 2 中,把对遗留系统的评价结果分列在坐标的四个象限内。对处在不同象限的遗留系统采取不同的演化策略。

    (1)淘汰策略

    第3象限为低水平 、 低价值区,即遗留系统的技术含量较低,且具有较低的商业价值。对这种遗留系统的演化策略为淘汰,即全面重新开发新的系统以代替遗留系统。

    完全淘汰是一种极端性策略,一般是企业的业务产生了根本的变化,遗留系统基本上不再适应企业运作的需要;或者是遗留系统的维护人员 、 维护文档资料都丢失了。经过评价,发现将遗留系统完全淘汰,开发全新的系统比改造旧系统从成本上更合算。

    对遗留系统的完全淘汰是企业资源的根本浪费,应该善于 “ 变废为宝 ” ,通过对遗留系统功能的理解和借鉴,可以帮助新系统的设计,降低新系统开发的风险。

    (2)继承策略

    第4象限为低水平 、 高价值区,即遗留系统的技术含量较低,可满足企业运作的功能或性能要求,但具有较高的商业价值,目前企业业务对该系统仍有很大的依赖性。

    对这种遗留系统的演化策略为继承。在开发新系统时,需要完全兼容遗留系统的功能模型和数据模型。为了保证业务的连续性,新老系统必须并行运行一段时间,再逐渐切换到新系统上运行。

    要做到对遗留系统的继承,必须对系统进行分析,得到旧系统的功能模型和数据模型,这种分析可以部分代替或验证系统的需求分析。

    如果遗留系统的维护文档不完整,而又必须解析系统的功能模型和数据模型,那将是一项十分艰巨的任务。这时可使用有关系统重构的 CASE 工具,通过分析系统的代码生成系统结构图或其他报告。

    (3)改造策略

    第1象限为高水平 、 高价值区,即遗留系统的技术含量较高,本身还有较大的生命力,且具有较高的商业价值,基本上能够满足企业业务运作和决策支持的要求。这种系统可能建成的时间还很短,对这种遗留系统的演化策略为改造。

    这些改造包括系统功能的增强和数据模型的改造两个方面。系统功能的增强是指在原有系统的基础上增加新的应用要求,对遗留系统本身不做改变。数据模型的改造是指将遗留系统的旧的数据模型向新的数据模型转化的过程。

    (4)集成策略

    第2象限为高水平 、 低价值区,即遗留系统的技术含量较高,但其商业价值较低,可能只完成某个部门(或子公司)的业务管理。这种系统在各自的局部领域里工作良好,但从企业全局来看,多个这样的系统,他们各自基于不同的平台,不同的数据模型,无法互联互通,数据还不一致,这就是很严重的问题了。

    对这种遗留系统的演化策略为集成。在集成过程中,可采用由互连系统构成的系统的架构,遗留系统可作为从属系统来描述。在企业信息系统建设过程中,如何处理那些遗留系统,将会是越来越突出的问题,因为即使是今天看来很先进的系统在明天也会成为遗留系统。对遗留系统的处理恰当与否,直接关系到新系统的成败和开发效率。如何建立一套系统的 、 行之有效的方法,以期望对实际工作有所指导,已成为一个迫切的问题。

    在实际工程项目中,遇到处理遗留系统的问题时,要具体情况具体分析,选择最佳的演化策略。

    展开全文
  • 二、效率的影响因素:回顾、分析与归纳 三、效率的评价及评价指标的选择 第二节 微观经济组织及其现实形态 一、微观经济组织的界定 二、我国现有微观经济组织的分类 三、我国微观经济组织的现实形态 第三节 ...
  • 二、效率的影响因素:回顾、分析与归纳 三、效率的评价及评价指标的选择 第二节 微观经济组织及其现实形态 一、微观经济组织的界定 二、我国现有微观经济组织的分类 三、我国微观经济组织的现实形态 第三节 ...
  • 前言: 由于数据挖掘能分析出数据中有用信息,给企业带来显著...制造业对数据挖掘需求多运用在品质管控方面,从制造过程中找出影响产品品质最重要的因素,已期提高作业流程的效率。 近几年、电话公司、信用卡公司

    前言:

    由于数据挖掘能分析出数据中的有用信息,给企业带来显著的经济效益,这使得数据挖掘技术越来越普及。例如在销售数据中发掘客户的消费习惯,并从交易记录中找出顾客偏好的产品组合,其他包括找出流失顾客的特征与突出新产品的时机点等都是零售业常见的实例;利用数据挖掘分析顾客群的消费行为与交易记录,结合基本数据,并依据对品牌价值等级的高低来区隔客户,进而达到差异化营销的目的;制造业对数据挖掘的需求多运用在品质管控方面,从制造过程中找出影响产品品质最重要的因素,已期提高作业流程的效率。

    近几年、电话公司、信用卡公司、保险公司以及股票交易上对欺诈行为的侦测都很有兴趣,这些行业每年因为欺诈行为遭受的损失都非常巨大,数据挖掘可以从一些信用不良的客户数中发现相似特征并预测可能的欺诈交易,达到减少损失的目的。金融业可以利用数挖掘来分析市场动向,并预测个别公司的营运及股价走向。数据挖掘的另一个独特的用法实在医疗业,用来预测手术、用药、诊断或是流程控制的效率。

    归纳起来,数据挖掘技术的基本任务主要体现在分类与回归、聚类、关联规则、时序模式、偏差检测五个方面。下图是典型的数据挖掘应用场景:

    2.1 分类与回归

    我们经常会碰到这样的问题:

    1. 如何将信用卡申请人分为低、中、高风险群?
    2. 如何预测那些顾客会在未来半年内取消该公司服务,那些电话用户会申请增值服务?
    3. 如何预测银行可以安全地带给贷款人的贷款量?
    4. 哪些使用2G通信网络的手机用户有可能转换到3G通信网络?
    5. 如何有效预测房地产开发中存在的风险?

    除此之外,市场经理需要进行数据分析,以便帮助他预测具有某些特征的顾客会购买一台新的计算机;医学研究者希望分析乳腺癌数据,预测病人应当接受三种具体治疗方案的哪一种;这些都是分类与回归的例子。

    2.1.2 分类与回归建模原理

    分类(classification):指将数据映射到预先定义好的群组或类。

    因为在分析测试数据前,类别就已经确定了,所以分类通常被称为有监督学习。分类算法要求基于数据属性值来定义类别,通常通过已知所属类别的数据的特征来描述类别。

    分类就是一个构造函数(分类模型),把具有某些特征的数据项映射到给定的类别上。该过程由两步构成。

    模型创建:通过对训练数据集的学习来建立分类模型。

    模型实用:使用分类模型对测试数据和新数据进行分类。

    其中的训练数据集是带有类标号的,也就是说在分类之前,要划分的类别是已经确定的。通常分类模型是以分类规则、决策树或数学表达式的形式给出。

    回归(Regression):用属性的历史数据预测未来趋势。

    回归首先假设一些已知类型的函数(例如线性函数、Logistic 函数等)可以你和目标数据,然后利用某种误差来分析确定一个与目标数据拟合程度最好的函数。

    回归模式的函数定义与分类模式相似,主要差别在于分类采用离散预测值(例如类标号),而回归模式采用连续的预测值。在这种观点下,分类和回归都是预测问题。但数据挖掘界普遍认为:用预测法预测类标号为分类,预测连续值(例如实用回归方法)为预测。许多问题可以实用线性回归解决,许多非线性问题可以通过对变量进行变化,从而转化为线性问题来解决。

    2.1.2 分类与回归算法

    分类与回归常用算法

    分类与回归常用算法
    算法名称  
    BP(Back Propagation,反向传播) 一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一
    LM(Levenberg-Marquardt) 基于梯度下降法和牛顿法结合的优化算法,特点是迭代次数少,收敛速度快,精度高。
    FNN(Fuzzy Neural Network,模糊神经网路) 具有模糊权系数或者输信号是模糊量的神经网络,是模糊系统和神经网络结合的产物,汇聚了神经网络与模糊系统的优点
    RBF(Radial Basis Function,径向基函数) 具有单隐层的三层前馈网络。是一种局部逼近网络,能够以任意精度逼近任意连续函数,特别适合于解决分类问题。
    ANFIS(Adaptive Neural Fuzzy Inference System,自适应模糊推理系统) 功能上与上一阶T-S模糊推理系统等价的自适应网络,是将神经网络的学习机制引入模糊系统,构成一个带有人类感觉和认知成分的自适应系统。
    WNN(Wavelet Neural Network,小波神经网络) 基于小波变换而构成的神经网络模型,即用非线性小波基取代通常的神经元非线性激活函数(如Sigmod函数),把小波变换与神经网络有机结合,充分继承了两者的有点。
    SVM(Support Vector Machine,支持向量机) V.Vapnik等人在研究统计学习理论的基础上发展起来的一种新的机器学习算法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。支持向量机根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以获得最好的推广能力。
    CART(classification and Regression Tree,分类与回归树) 一种非常有效的非参数分类与回归方法,通过构建树、修剪树、评估树来构建一个二叉树。

    2.2 聚类

    我们经常会遇到这样的问题:

    1. 如何通过一些特定的症状归纳某类特定的疾病?
    2. 谁是银行信用卡的黄金用户?
    3. 谁喜欢打国际长途,在什么时间,打到哪里?
    4. 对住宅区进行聚类,确定自动提款机ATM的安放位置。
    5. 如何对用户WAP上网行为进行分析,通过客户分群进行精确营销?

    除此之外,促销应该针对哪一类用户,这类客户具有哪些特征?这类问题往往是促销前首要解决的问题,对整个客户座分群,将客户分组在各自的群组里,然后对每个不同的群组,采取不同的营销策略。这些都是聚类分析的例子。

    2.2.1 聚类分析建模原理

    聚类(Clustering)分析:是在没有给定划分类的情况下,根据信息相似度进行信息聚类的一种方法,因此聚类又称为无指导的学习。

      与分类不同,分类需要先定义类别和训练样本,是有指导的学习。聚类就是将数据划分或分割成相交或不相交的群组的过程,通过数据之间预先指定的属性上的相似性,就可以完成聚类任务。

    聚类的输入是一组未被标记的数据,根据数据自身的距离或相似度进行划分。划分的原则是保持组内最大的组内相似性和最小的组间相似性,也就是使不同聚类中的数据尽可能地不同,而同一聚类中的数据尽可能地相似。比如股票价格波动的情况,可以将股票分成不同的类,总共可以分成几类,各类包含哪些股票,每一类的特征是什么,这对投资者,尤其对投资基金的人来说,可能是很重要的信息。当然,聚类除了将样本分类外,还可以完成孤立点挖掘,如将其应用于网络入侵检测或金融风险欺诈探测中。

    2.2.2 聚类方法

    主要聚类算法分类
    类别 主要算法
    划分(分裂)方法 K-means (K-平均值)
    K-MEDOIDS(K-中心点)
    CLARANS (基于选择的算法)
    层次方法 BIRCH  (平衡迭代规约和聚类)
    CURE(代表点聚类)
    CHAMELEON(动态模型)
    基于密度的方法 DBSCAN(基于高密度连接区域)
    DENCLUE(密度分布函数)
    OPTICS(对象排序识别)
    基于网格的方法 STING(统计信息网络)
    CLIOUE(聚类高维空间)
    WAVE-CLUSTER(小波变换)
    基于模型的方法 统计学方法
    神经网络方法

    2.3 关联规则

    我们经常会碰到这样的问题:

    1. 商业销售上,如何通过交叉销售得到更大的收入?
    2. 保险方面,如何分析索赔要求发现潜在的欺诈行为?
    3. 银行方面,如何分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务?
    4. 哪些制造零件和设备设置与故障时间关联?
    5. 那些病人和药物属性与结果关联?
    6. 哪些商品是已经购买商品A的人最有可能购买的?

    除此之外,人们希望从大量的商业交易记录中发现有价值的关联知识,以帮助其商品目录的设计、交叉营销或其他有关的商业决策。在商业销售上,关联规则可用于交叉销售,以得到更大的收入;在保险方面,如果出现了不常见的索赔要求组合,则可能为欺诈行为,需要进一步调查;在医疗方面,可找出可能的治疗组合;在银行方面,对顾客进行分析,可推荐感兴趣的服务等;这些都属于关联规则挖掘问题,关联规则挖掘的目的是在一个数据集中找出各项之间的关系,从大量数据中挖掘出有价值的描述数据项之间相互联系的有关知识。随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘相应的关联知识越来越感兴趣。

    2.3.1 什么是关联规则

    关联规则(Association):揭示数据之间的相互关系,而这种关系没有在数据中直接表示出来。

    关联分析的任务就是发现事物间的关联规则或称相程度。关联规则的一半形式是:

    如果A发生,则B有百分之C的可能发生。C称为关联规则的置信度(Confidence)。

    利用关联分析能寻找数据库中大量数据的相关联系,常用的两种技术为:

    关联规则:用于发现一个事物与其他事物间的相互关联性或相互依赖性。

    序列模式分析:将重点放在分析数据之间的前因后果关系上。

    2.3.2 关联规则算法

    算法名称 算法描述
    Apriori 一种最有影响的挖掘布尔关联规则频繁项集的算法,其核心是基于两阶段频集思想的地推算法。
    FB-Tree 针对Ariori算法的固有缺陷,J.Han等提出了不产生候选挖掘频项集的方法:FB-树频集算法
    灰色关联法 以分析和确定各因素之间的影响程度或若干个子因素(子序列)对主因素(母序列)的贡献程度而进行的一种分析方法。
    HotSpot 挖掘得到通过树状结构显示的感兴趣的目标最大化/最小化的一套规则,最大化/最小化利益目标变量/值。

    2.4 时序模式

    我们经常会碰到这样的问题:

    1. 下个月商品销售量、销售额和库存量是多少?
    2. 明天广州市的最高用电负荷是多少?

    2.4.1 什么是时序模式

    时序模式:描述基于时间或其他序列的经常发生的规律或趋势,并对其建模。

    与回归一样,他也用已知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。序列模式将关联模式和时间序列模式结合起来,重点考虑数据在时间维度上的关联性。时序模式包含时间序列分析和序列发现。

    时间序列分析:用已有的数据序列预测未来。在时间序列分析中,数据的属性值是随着时间不断变化的。回归不强调数据间的先后顺序,而时间序列要考虑时间特性,尤其要考虑时间周期的层次,如天、周、月、年等,有时还要考虑日历的影响,如节假日等。

    序列发现:用于确定数据之间与时间相关的序列模式。这些与数据(或者事件)中发现的相关的关联规则很相似,只是这些序列是与时间相关的。

    2.4.2 时间序列的组合成分

    时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响。

    •  长期趋势因素(T):反映了经济现象在一个较长时间内的发展方向,它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。
    • 季节变动因素(S):是经济现象受季节变动所形成的一种长度和幅度固定的周期波动。
    • 周期变动因素(C):也称循环变动因素,它是受各种经济因素影响所形成的上下起伏不定的波动。
    • 不规则变动因素(I):不规则变动又称随机变动,它是受各种偶然因素影响所形成的不规则变动。

    2.4.3 时间序列的组合模型

    时间序列y可以表示为四个因素的函数,即 y = f(Tt,St,Ct,It)。时间序列分解方法有很多,较常用的模型有加法模型和乘法模型。

    • 加法模型:假定时间序列是基于4种成分相加而成的。长期趋势并不影响季节变动。若以y表示时间序列,则加法模型为:

    y_{t}=T_{t}+ S_{t}+C_{t}+I_{t} 

    • 乘法模型:假定时间序列是基于4中成分相乘而成的。假定季节变动与循环变动为长期趋势的函数。该模型的方程式为:y_{t} = T_{t}\times S_{t}\times C_{t} \times I_{t}

    乘法分解模型的基本步骤是:

    1. 运用移动平均法剔除长期趋势和周期变化,得到时许TC。然后再用按月(季)平均法求出季节指数S。
    2. 做散点图,选择适合的曲线模型拟合序列的长期趋势,得到长期趋势T。
    3. 计算周期因数C。用序列TC除以T即可得到周期变动因数C。
    4. 将时间序列的T,S,C分解出来后,剩余的即为不规则变动,即I=\frac{Y}{TSC}

    2.4.4 时序算法

    方法 时间范围 适用情况
    一元线性回归预测法 短、中期 自变量与因变量之间存在线性关系
    多元线性回归预测法 短、中期 因变量与两个或两个以上自变量之间存在线性关系
    非线性回归预测法 短、中期 因变量与一个自变量或多个其他自变量之间存在某种非线性关系
    趋势外推法 中、长期 当被预测项目的有关变量用时间表示时,用非线性回归
    移动平均法 短期 不带季节变动的反复预测
    指数平滑法 短期 具有或不具有季节变动的反复预测
    平稳时间序列预测法 短期 适用于任何序列的发展型态的一种高级预测方法
    灰色预测发 短、中期 适用于时间序列的发展呈指数型趋势

    2.5 偏差检测

    偏差:是对差异和极端特例的表述,如分类中反常的实例、聚类外的离群值、不满足规则的特例等。

    偏差检测:用来发现与正常情况不同的异常和变化,并进一步分析这种变化是有意的欺诈行为,还是正常的变化。如果是一场行为,则需要提示采取防御措施,尽早防范。

    注:大部分数据挖掘方法都是将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能比正常的数据更有用。

     

     

     

     

     

     

     

     

     

     

     

    展开全文
  • 进销存软件能在这科技时代里起到那么大作用,市场上那么多进销存软件,到底哪一款好呢,其实基本... 二十一世界,网络信息化时代,科技和效率被排到了第一位,这些因素可以影响一个国家发展、影响一个企业的
         进销存软件能在这科技时代里起到那么大的作用,市场上那么多的进销存软件,到底哪一款好呢,其实基本功能大体都一至,那么这里介绍一款特别的进销存软件,超易进销存软件,它相比同类型软件具有界面美观大方,功能强大而操作简单,自定义功能特别强大,是目前国内唯一一款提供超级强大自定义功能的进销存软件。
       二十一世界,网络信息化的时代,科技和效率被排到了第一位,这些因素可以影响一个国家的发展、影响一个企业的兴衰。作为一个企业,如何才能在这科技高速发展的时代中兴奋繁荣,似乎已经不可缺的应用到科技工具——企业管理软件,一个企业能在对的位置用上对的工具就会事半功倍,这里给大家介绍进销存软件。
        相信采购、财务、会计对于进销存软件并不陌生,但大部分的人其实对进销存软件不怎么了解或是根本不懂。顾名思义:进销存软件就是用计算机软件来管理企业经营中最基本的进货(采购)、商品销售、入库出库(库存管理)、应收应付、收入支出、经营分析的基本流程。
        为什么要用进销存软件?前面说到了这是时代进步的环境下必须的,然而这也是因为传统的手工处理流程是由员工根据原始凭证编制记账凭证,并据此登记库存明细账、库存分类账、库存总账、销售明细账、往来账等,这一系列工作复杂而且繁琐。采用进销存软件则只需要用户输入原始的数据,软件就会自动生成进销存账、库存明细账、应收账、应付账、承揽了企业的进销存及往来业务的大量记账工作。这样既可以提高管理者的效率,而且所有数据都能很好地保存起来,随时可以通过软件查看全面的管理信息。
        为什么要用进销存软件?告别手工开单,直接打印漂亮送货单;管理者随时查看企业各种数据,企业管理流程化,制度化;进销存软件让这一起实现了。
    展开全文
  •  一、选题的意义 二、研究现状综述与评析 三、研究方法与结构安排 四、论文形成的主要观点 第一章 相关理论及背景知识(研究准备) 第一节 效率基本理论回顾及评述 一、效率的定义 二、效率的影响因素:回顾、...
  • 有保障的售后服务是选择软件产品的基本条件。 一般来说以公司方式运营的产品在售后服务方面更有保障,双方可以以合同或协议的方式来保证产品的售后服务质量及 持续性。 4 市面上有几款比较好的皮肤组件 4.1 Skin...
  • 而对于区域物流发展,经济产业发展状况是各种因素中最主要一个方面。一个地区只有拥有发展经济有利条件,才能够在同一层次上与其他地区形成一定差异和优势,而这种差异和优势必定会把社会生产力吸引过来,...
  • 企业数据电子化基础上,保护企业的关键数据并加以合理利用已成为企业成功关键因素。因此,对制造行业各种数据进行集中存储、管理与备份,依据企业对不同数据不同要求,从而合理构建企业数据存储平台。采用...
  • 网上会展并不提倡上网能够解决企业的一切问题,而是主攻企业的供求信息关注度,让企业能够得到真实有效产品信息,并通过互联共享机制,让企业发布信息最广泛为人所知,让企业感觉到网络所能带来实际利益,...
  • EF设计一个主要目的是提高开发效率,减少编码工作,让开发者“零配置”“少编码”操作数据库大部分功能。 例如:数据库查询条件传入问题是所有ORM框架都不能回避一个问题,所以我经常在想——既然我们...
  • 工资管理需要和人事管理相联系,同时连接员工考勤和医疗保险等等,来生成企业每个职工的基本工资、补贴、奖金、实际发放工资等。资金是企业生存的主要元素,资金的流动影响企业的整体运作,企业员工的工资是企业...
  • 昆山工业技术研究院着眼于为委托用户和质检机构搭建良好沟通桥梁,免去目前市场业务中企业用户需要实地地并频繁地与检测机构沟通,从而提出自己委托乃至下委托单、等待检测报告等,设计并研发了市场上首款提供...
  • 地产业作为我国市场经济重要组成部分,作为一种高附加值综合性...本文在对风险管理基本理论进行分析综述基础上,研究开发风险管理有关问题,提出加强对开发风险防范和意识,提高企业运营效率,避免风险损失。
  • 运行效率和数据安全是影响电子商务网站架构重要因素。  •2、基本电子商务网站构成要素 •网站域名及地点 •网站页面 •商品目录 •购物车、付款台、商品配送 •计数器、留言板 •会员管理 •商品...
  • c语言编写单片机技巧

    2009-04-19 12:15:17
    最近几年高频电路与数位电路共享相同电路板,构成所谓混载电路系统似乎有增加趋势,类似如此设计经常会造成数位电路动作时,高频电路却发生动作不稳定等现象,其中原因之一是数位电路产生噪讯,影响高频电路...
  • 10.供应链的基本要素包括供应商、销售商和生产企业。 11.保税区内的商品如要进入所在国的国内市场,则要交纳进口税。 12.国际运输具有路线长、环节多、涉及面广、风险性大、时间性强等特点。 13.在物流...
  • 习 题 答 案 习题一答案 一、选择题 1. 软件的主要特性是(A B C)。 A) 无形 B) 高成本 C) 包括程序和文档  D) 可独立构成计算机系统 ... 底层:由不再进行分解的基本加工组成。 4. 加工小说明有...
  • 什么是VLAN

    2013-10-23 09:59:12
    而且这种划分的方法也导致了交换机执行效率的降低,因为在每一个交换机的端口都可能存在很多个VLAN组的成员,这样就无法限制广播包了。另外,对于使用笔记本电脑的用户来说,他们的网卡可能经常更换,这样,VLAN就...
  • [Oracle.11g权威指南(第2版)].谷长勇.扫描版.pdf

    千次下载 热门讨论 2013-06-23 21:16:09
    2.3.2 网格的基本属性 12 2.3.3 Oracle网格基础架构 13 2.4 Oracle 11g新特性 15 2.4.1 企业网格管理的高可用性 15 2.4.2 更加优化的性能 17 2.4.3 简化的信息管理 18 2.4.4 集成的信息 20 2.4.5 内置的业务智能 21 ...
  • 本书第1章强调不要把数据库当成一个黑盒,讨论了开发人员必须了解的数据库的基本特性和功能。第2章提供了一个创建Oracle数据库的绝好例子,从中你将深入地了解数据库和实例的概念。第3章介绍了各种类型的文件,特别...
  • 17 粒子群算法工具箱(史峰) 粒子群算法工具箱包含了粒子群算法的基本操作和常用功能,实现步骤包括种群规模选择,粒子长度选取,适应 度函数编写,粒子群参数确定等,可以方便实现函数极值寻找,系统参数寻优等...

空空如也

空空如也

1 2
收藏数 33
精华内容 13
关键字:

影响企业效率的基本因素