精华内容
下载资源
问答
  • IT技术包括什么

    2009-06-29 23:34:00
    IT技术包括什么  IT= information technology 信息技术实际上有三个层次:第一层是硬件,主要指数据存储、处理和传输的主机和网络通信设备;第二层是指软件,包括可用来搜集、存储、检索、分析、应用、评估信息的...

    IT技术包括什么

          IT= information technology 信息技术实际上有三个层次:第一层是硬件,主要指数据存储、处理和传输的主机和网络通信设备;第二层是指软件,包括可用来搜集、存储、检索、分析、应用、评估信息的各种软件,它包括我们通常所指的ERP(企业资源计划)、CRM(客户关系管理)、SCM(供应链管理)等商用管理软件,也包括用来加强流程管理的WF(工作流)管理软件、辅助分析的DW/DM(数据仓库和数据挖掘)软件等;第三层是指应用,指搜集、存储、检索、分析、应用、评估使用各种信息,包括应用ERP、CRM、SCM等软件直接辅助决策,也包括利用其它决策分析模型或借助DW/DM等技术手段来进一步提高分析的质量,辅助决策者作决策(强调一点,只是辅助而不是替代人决策)。有些人理解的IT把前二层合二为一,统指信息的存储、处理和传输,后者则为信息的应用;也有人把后二层合二为一,则划分为前硬后软。通常第三层还没有得到足够的重视,但事实上却是唯有当信息得到有效应用时IT的价值才能得到充分发挥,也才真正实现了信息化的目标。信息化本身不是目标,它只是在当前时代背景下一种实现目标比较好的一种手段。

     
          卡尔的IT是指什么呢?在那篇文章里面他并没有明确提出,不过他提到信息技术的核心功能--数据存储、处理和传输。从他推理的逻辑来看,即从蒸汽机、铁路、电报电话、电力等基础设施建设推过来的,还用摩尔定律来佐证主机和光纤的发展。如果他就此打住,只从这一点出发,他的逻辑论证是非常严谨的,后面对《IT不再重要》发表不管支持与反对评论的人,在这一点上都是基本认同的(除了那些硬件和网络厂商外),笔者也认同这一点。整个文章里他对物化的IT基础设施建设部分关注很多,基本没有关注应用层面。但后面他讲到大众化趋势时,又提到“信息技术极易复制”,则把IT又推到了商业软件,这里已经迈出了“危险”的一步。在2004年他出版同名书时开篇就定义了他研究、类比过来的IT,“我用的‘IT’是指通常意义上的,即所有被用来以数字形式存储、处理和传输信息的硬件和软件,特别强调的是,我只是指技术本身,我指的‘IT’并不包括技术中流动的信息和那些使用技术的人才技能”,所以他所指的IT是指前二层。如果就这此打住,可能还是不会有太大争议(这次又加上那些难受的软件厂商)。客观地分析软件本身的特征,的确不具备核心竞争力的四个判断标准中的三个即:稀缺性、不易复制性、不易替代性,卡尔本人也没有否认而且是在强调IT具备核心竞争力的第四个判断标准,即有价值。但他偏偏又把题目定成了“IT不再重要”,几欲把整个IT一棍子打死!


          可惜他在IT这一概念上是经常含混不清:一会儿指主机网络,一会儿又跑到软件,在他后来出版的书里甚至经常“一不小心”就迈到了第三层,完全违背了他在书开头所界定的IT范围,如论述信息技术的应用、对CIO发出的诘问等。有很多读者、包括哈佛商业评论的编辑当时就指出了这一点。后面其它很多人也因为这一点来攻击他,甚至有人说卡尔干脆就不懂IT,有可能是真的,因为他毕竟本来就不是做IT的。这也给我们搞研究的人也给予很大的启示和警醒,对自己不太熟悉的领域套用其它方法来研究时要特别小心,否则会闹出很多笑话。


          这里笔者要强调一点,经常有软件厂商(国内外的都有)宣称上了信息化就能如何如何,就能加强企业核心竞争力(反正多是现在流行什么就跟什么,“与时俱进”)。不知道他们是有意还是无意,且不按核心竞争力判断的四个标准来推断,试反问几个简单的问题:如果上了信息化就能如何,有多少上了信息化的企业已经亏损甚至倒闭?尤其是那些宣称有几十万家客户使用他们软件的软件企业该问问自己。如果上了信息化就能如何,那么我们假设入库、出库、销售、库存等信息全是准确的,就能自动提高销售、降低库存吗?如果说没有上信息化之前,老板可能还可因为看不见而糊涂但幸福地过过日子,那么现在呢?只是痛苦地知道有如此多的库存在仓库里呆了如此长的时间,如此多的商品长时间占据着柜台却没有带来任何销售额更不要说利润!分析一下软件厂商们宣传“信息技术是企业的核心竞争力”的现象,结论只有两个:要么这些企业不懂什么是核心竞争力(我想应该大多数还是懂的,既希望他们懂又希望他们不懂,希望结果是懂是因为至少软件企业还能懂一些管理理念而不是埋头纯粹一技术性公司,希望结果是不懂是因为这样可以少被别人攻击没有职业道德,不知者不为过嘛),要么是另有所图。一般企业客户与IT企业之间存在严重的信息不对称问题。IT企业与企业客户之间的博弈,最后的结果往往会是次优选择,即所谓的“柠檬效应”。在这点上,除了IT企业和从业人员要提高自身的职业操守外,政府或行业必须加强对信息化建设的培训教育,提高企业对信息化建设的认识,引进管理咨询公司、监理公司等来改变这一博弈结局,以达到新的平衡,促进IT业更健康的发展。


          信息技术本身只是一个工具,就象一柄利剑或一枝好笔,买了它并不能一定保证你武功增进多少、字写漂亮多少,还需要你不断地去练习如何舞剑、如何写字,信息化建设也需要你不断地提升运用信息的能力,这才是真正核心也是最难的地方。功夫全在题外!信息化(数字化)目的并不是上系统拿几个数字,它只是基础,其核心在一个“化”字,把各种资源相关的信息整合起来后进行“合理化”、“优化”的配置。譬如用历史信息来辅助做销售预测、采购计划、生产计划、配送计划、库存计划,并按照这些计划下达指令并根据实际运行情况滚动修正计划。美国哈林顿(Joseph Harrington)博士提出的计算机集成制造(Computer Integrated Manufacturing,CIM)包含两个基本观点:一是企业生产的各个环节包括市场分析、产品设计、加工制造、经营管理和售后服务等是一个不可分割的整体,必须紧密相连、统一考虑;二是整个运作过程实质上是一个数据的采集、传递和加工处理过程,最终产品可以看作是数据的物质表现。如果上了信息系统却不用它来辅助决策,还是按照原来的运作方式运作,则信息系统的作用可能只是限于解放某些岗位的某些工作,如统计报表等,且同时还会增加另外一些岗位的工作。大量经验表明,如果不用信息系统收集上来的数据,要实现用来辅助决策的准确、及时、完整的信息根本不可能,信息系统只有用它才可能逐步提高其准确性、及时性和完整性。按照核心竞争力的评价标准,要构造核心竞争力,本质上只有整合能力才是,而且越外显的能力越容易被模仿。冰山一角,露在外面的越少越不容易被模仿,越能构成核心竞争力。

          就象哈佛商业评论编辑Hal Varian(加利福尼亚大学伯克利分校信息管理与系统系主任)指出的那样:“卡尔说IT正在商品化、不再提供竞争优势,这一点他是对的。但知道如何有效使用IT还是一种非常稀缺的技能。”“提供竞争优势的不是IT本身,而是那些知道如何有效利用它的人。”“公司在花成千上万的钱在数据存储和获取客户交易数据上,但一大堆数据就躺在那儿、没有经过分析、没有使用,但是,在那些训练有素的分析人员手上同样的数据却能产生巨大的回报!”这是一个数据丰富的时代,但同时是一个知识贫乏的时代!


          波士顿大学管理学院信息系统管理学教授托马斯·H.达文波特要把“过去的40年,更确切地描述为‘数据时代’,而不是‘信息时代’”,“将数据转化为某种更有用的东西,需要相当多的人力投入和智慧,但大多数组织仅仅从技术的角度来看待这一问题。拥有一个数据库或数据挖掘系统,与拥有其它技术一样,是必要的,但对于高质量的信息和知识而言,则是不够的”。


          所以这里我们有必要明确一下一些经常混淆的基本概念。
    数据(Data)=事实的记录,如上季度甲系列产品在华东地区销售额为120万。
    信息=(Information)=数据+ 意义,如上季度甲系列产品华东地区销售额比去年同期减少了25 %。
    智能(Intelligence)=信息+理解(understanding)与推理(reasoning),如分析原因是华东地区销售单位不行,或甲系列产品进入了衰退期,还是公司整体营销活动落后,竞争者强力促销导致?或是其它原因。
    知识(Knowledge) =解决问题的技能(skill),针对这一问题公司应对的策略是什么?
    智慧(Wisdom) =知识的选择(Selection) 应对的行动方案可能有多种,但(战略)选择哪个*智慧。行动则又会产生新的交易数据。
    数据、信息、智能、知识、智慧、行动与管理活动之间存在多重循环关系。


          同样的高速公路、同样的高档车,开车的人不同将会开出完全不同的水平,这时更关键的因素--开车的本事就显得至关重要了。在初级阶段,竞争比较粗放,可能主要是看谁能修好道,买好车。到后面,大家硬件基础设施差不多,竞争日趋白热化,这个时候人的作用就突显出来了,光有好道好车还不行,还得有舒马赫这样的顶级选手才能赢得比赛。企业经营与赛车还不太一样,赛车有人制定规则,规定只能跑一样的道,企业之间的竞争是八仙过海各显神通,有钱的就可以买高档的服务器、小型机,没有钱的就只能买PC服务器;有钱的就可以用光纤宽带,没有钱的则只能用ADSL甚至拨号;有钱的可以花几千万去买SAP、Oracle,没有钱的则只能用用金蝶、用友,甚至只有一些基本功能的小的进销存或财务软件;有钱的可以请五大帮他们制定符合未来趋势的战略并进行培训,没有钱的则只能*企业家自己摸着石头过河……的确,这是一场不太公平的竞争。但网络经济来了,用卡尔的话说,就是IT技术已经变得“大众化”,已变成商品。更何况ASP模式的出现,将极大的降低了企业信息化的门槛,昂贵的服务器、网络、软件费用的门槛被一下子降低了。好比虽然你有私家的宝马、奔驰,可以很快地到达你想要到的地方。但我也可以坐出租车差不多也能实现同样的效果,再差点儿我有公共汽车、地铁,只要很低的成本也能基本实现我的目标。但同样的宽带、同样一套系统软件,但使用的人一样,效果却完全不一样,君不见同样是使用SAP、Oracle或者金蝶、用友,有很成功的,也有很失败的?还是那句话,功夫在诗外!

    组成
    IT是Information Technology的缩写,意为“信息技术”,包含现代计算机、网络、通讯等信息领域的技术。IT的普遍应用,是进入信息社会的标志。不同的人和不同的书上对此有不同解释。但一个基本上大家都同意的观点是,IT有以下三部分组成:
    -----传感技术 这是人的感觉器官的延伸与拓展,最明显的例子是条码阅读器;
    -----通信技术 这是人的神经系统的延伸与拓展,承担传递信息的功能;
    -----计算机技术 这是人的大脑功能延伸与拓展,承担对信息进行处理的功能。
    所谓信息化是用信息技术来改造其他产业与行业,从而提高企业的效益。在这个过程中信息技术承担了一个得力工具的角色。
    顺便说一句何谓IT产业,有一个大致的分类,可以供大家参考:
    IT基础技术的提供 IC研发、软件编写 如INTEL、MS等
    IT技术产品化 元器件、部件、组件制造 如精英、大众等
    IT产品集成化 计算机及外设制造商 如联想、IBM
    IT产品系统化 解决方案、信息系统 如华为、HP
    IT产品流通 渠道、销售 如神州数码
    IT产品服务 咨询服务和售后服务 如蓝色快车
    IT产业舆论支持 IT类媒体 如CCW、CCID
    IT产业第三方服务 各种需要配套的服务 如法律咨询、PR服务
    IT后备人员培养 各种院校 如计算机专业
    IT产业合作组织 各种协会、集会
    集成测试的整个周期将系统性地包括软件接收测试、端到端测试、电视画面合成测试、系统测试、用户验收测试、多运动项目综合测试及技术演练等等

    展开全文
  • 4.4.1 演绎信息检索

    2018-10-09 11:52:31
    为了信息检索,在提供的针对数据库的接口中,逻辑编程的最好。在这章中, 我们实现的查询语言,被设计成使用这种方式。 为了演示查询系统做什么,我们将显示在管理微软的个人记录的数据库中,查询系统是如何被 使用...

    4.4.1 演绎信息的检索

    为了信息检索,在提供的针对数据库的接口中,逻辑编程的最好。在这章中,
    我们实现的查询语言,被设计成使用这种方式。

    为了演示查询系统做什么,我们将显示在管理微软的个人记录的数据库中,查询系统是如何被
    使用的。微软是在波士顿地区的高技术企业。语言提供了面向模式的读取个人信息。也能利用
    做逻辑演绎的通用规则。

    * 一个样品数据库

    关于微软的个人数据库包括了关于企业个人信息的断言。这个是关于Ben Bitdiddle的个人信息,
    一个全职的计算机专家:

    (address (Bitdiddle Ben) (Slumerville (Ridge Road) 10))
    (job (Bitdiddle Ben) (computer wizard))
    (salary (Bitdiddle Ben) 60000)

    任何一个断言都是一个列表(在这个案例中是三个),它的元素本身也是列表。

    作为一个全职的专家,Ben负责公司的计算机部门,他领导两个程序员和一个技术员。
    这里有他们的信息。

    (address    (Hacker Alyssa P) (Cambridge (Mass Ave) 78))
    (job        (Hacker Alyssa P) (computer programmer))
    (salary     (Hacker Alyssa P) 40000)
    (supervisor (Hacker Alyssa P) (Bitdiddle Ben))

    (address    (Fect Cy D) (Cambridge (Ames Street) 3))
    (job        (Fect Cy D) (computer programmer))
    (salary     (Fect Cy D) 35000)
    (supervisor (Fect Cy D) (Bitdiddle Ben))

    (address    (Tweakit Lem E) (Boston (Bay State Road) 22))
    (job        (Tweakit Lem E) (computer technician))
    (salary     (Tweakit Lem E) 25000)
    (supervisor (Tweakit Lem E) (Bitdiddle Ben))

    这也有一个程序员实习生。由Alyssa负责指导。

    (address    (Reasoner Louis) (Slumerville (Pine Tree Road) 80))
    (job        (Reasoner Louis) (computer programmer trainee))
    (salary     (Reasoner Louis) 30000)
    (supervisor (Reasoner Louis) (Hacker Alyssa P))


    所有的这些人都在计算机部门,正如在他们的工作描述中,第一项中的“计算机”
    这个词显示的那样。

    Ben是一个高级雇员,他的上司是公司的老板本人。
    (supervisor  (Bitdiddle Ben) (Warbucks Oliver))
    (address    (Warbucks Oliver) (Swellesley (Top Heap Road)))
    (job        (Warbucks Oliver) (administration big wheel))
    (salary     (Warbucks Oliver) 150000)

    除了Ben管理的计算机部门,还有一个会计部门,包括了主会计员和他的助手。

    (address    (Scrooge Eben) (Weston (Shady Lane) 10))
    (job        (Scrooge Eben) (accounting chief accountant))
    (salary     (Scrooge Eben) 75000)
    (supervisor (Scrooge Eben) (Warbucks Oliver))

    (address    (Cratchet Robert) (Allston (N Harvard Street) 16))
    (job        (Cratchet Robert) (accounting scrivener))
    (salary     (Cratchet Robert) 18000)
    (supervisor (Cratchet Robert) (Scrooge Eben))

    这也有一个老板的秘书。

    (address    (Aull DeWitt) (Slumerville (Onion Square) 5))
    (job        (Aull DeWitt) (administration secretary))
    (salary     (Aull DeWitt) 25000)
    (supervisor (Aull DeWitt) (Warbucks Oliver))

    这个数据库也包括了判断。这个判断是哪一种工作可能由其它的工作岗位来代替。
    例如一个计算机专家能做计算机程序员和计算机技术员的工作。

    (can-do-job (computer wizard) (computer programmer))
    (can-do-job (computer wizard) (computer technician))

    一个程序员能做实习生的工作。

    (can-do-job (computer programmer) (computer programmer trainee))

    也有如下的例子。

    (can-do-job (administration secretary)
      (administration big wheel))

    * 简单的查询
    查询语言允许用户从数据库中检索信息,通过对系统的提示符发出查询语句的响应。
    例如,为了扛以所有的计算机程序员,一个可能的说法是:
    ;;;Query Input:
    (job  ?x  (computer  programmer))

    系统将返回如下的信息项:

    ;;;  Query results:
    (job  (Hacker Alyssa P)   (computer programmer))
    (job  (Fect  Cy  D)   (computer programmer))

    输入的查询指定了我们正在找的数据库中的入口,为了匹配一个特定的模式。在这个例子中,
    模式指定入口包括三个项,它的第一个项是字面上的符号job,第二个项是任意的内容,
    第三个项是字面的列表(computer  programmer).在匹配的列表中的第二个是一个任意的内容,
    被指定为一个模式的变量即?x.  一个模式的变量的通用形式是一个符号,以问号开始的,加上变量的名称。
    在下面我们将看到为什么为模式变量指定命名而不是仅用一个问号来表示任意内容是很有用的。
    对于简单的查询,系统的响应是显示在数据库中匹配特定的模式的所有的入口。

    一个模式能有多个变量。例如,如下的查询

    (address ?x  ?y)

    将列出所有的员工的地址。

    一个模式可能没有变量,在这种情况下查询简单地确定模式是否在一个数据库中。如果在,
    这有一个匹配,如果不在,这没有匹配。

    在一个查询中,同一个模式变量能出现多次,指定相同的任意内容必须在相应的位置上出现。
    这也是变量有名称的原因。例如,

    (supervisor  ?x  ?x)

    找到所有的监督自己的人(尽管在我们的例子数据库中没有这样的人)

    查询

    (job ?x  (computer ?type))

    匹配所有的job,记录的第三个项是一个有两个元素的列表,这个列表的第一项是computer:

    (job  (Bitdiddle  Ben)  (computer  wizard))
    (job  (Hacker Alyssa P)  (computer  programmer))
    (job  (Fect Cy D)  (computer programmer))
    (job  (Tweakit Lem E)  (computer technician))

    这个模式没有匹配如下的记录:

    (job  (Reasoner Louis)  (computer programmer trainee))

    因为在这个记录的第三项是一个有三个元素的列表,模式中的第三项指定它有两个元素。
    如果我们要修改这个模式,为了第三项以computer开头的任何一个列表,我们能如下的指定:

    (job ?x  (computer  . ?type))

    例如

    (computer  . ?type)

    匹配数据(computer programmer trainee) 以?type作为列表 (programmer trainee)
    它也匹配数据(computer programmer)以?type作为列表 (programmer )
    并且也匹配数据(computer)以?type作为空列表 ( )

    我们能描述简单的查询的查询语言过程如下:

    系统找到在查询模式中满足模式的对变量的所有的赋值,也就是,对于变量的值的所有的
    集合,例如,如果模式变量被值实例化,结果在数据库中。

    通过列出满足变量赋值的查询模式的所有的实例,系统返回这个查询。

    注意的是,如果模式没有变量,查询归结为对模式是否在数据库中的确定。如果是,空
    赋值,没有赋值给变量,对于数据库,满足模式。

    练习4.55
    为了从数据库中检索如下的信息,给出简单的查询:
    a. 被苯监督的所有人
    b.在会计部的所有人的姓名和工作
    c.  居住在slumerville的所有人的姓名和地址。


    * 复合的查询
    简单查询形成了查询语言的原生的操作。为了形成复合的操作,
    查询语句提供了组合的方法。让查询语句成为一个逻辑编程语言的一个方法是
    组合的方法映射为在形成逻辑表达式的组合方法: and,or 和 not.
    (这里的and,or 和 not不是lisp的原生程序,而是构建查询语言的操作)

    我们能使用and,以如下的方法来找到所有的程序员的地址:

    (and  (job  ?person  (computer programmer))
       (address   ?person  ?where))

    输出的结果如下:

    (and  (job (Hacker Alyssa P)  (computer programmer))
             (address (Hacker Alyssa P) (Cambridge  (Mass Ave)   78)))
    (and (job  (Fect Cy  D) (computer  programmer))
            (address  (Fect Cy D)   (Cambridge  (Ames Street)   3)))

    总之,

    (and <query1>  <query2> ....... <queryn>)

    这是同时满足<query1>  <query2> ....... <queryn>所有的条件的值的集合。

    正如简单的查询,通过找到满足查询的所有对模式变量的赋值,系统执行了一个复合的查询,
    然后,显示了有那些值的查询的实例。

    组装复合查询的另一个方法是使用 or。例如

    (or  (supervisor   ?x   (Bitdiddle  Ben)) 
           (supervisor   ?x   (Hacker Alyssa  p)))

    将找到被苯或者是阿丽莎监督的所有的员工:

    (or  (supervisor   (Hacker Alyssa  p)   (Bitdiddle  Ben)) 
           (supervisor   (Hacker Alyssa  p)   (Hacker Alyssa  p)))
    (or  (supervisor   (Fect Cy D)   (Bitdiddle  Ben)) 
           (supervisor   (Fect Cy D)   (Hacker Alyssa  p)))
    (or  (supervisor   (Tweakit  Lem E)   (Bitdiddle  Ben)) 
           (supervisor   (Tweakit  Lem E)   (Hacker Alyssa  p)))
    (or  (supervisor   (Reasoner Louis)   (Bitdiddle  Ben)) 
           (supervisor   (Reasoner Louis)   (Hacker Alyssa  p)))

    总之,

    (or <query1>  <query2> ....... <queryn>)

    这是至少满足<query1>  <query2> ....... <queryn>的条件之一的值的集合。

    组装复合查询的另一个方法是使用 not。例如

    (and  (supervisor   ?x  (Bitdiddle Ben)) 
             (not  (job ?x   (computer programmer))))

    找出被苯监督却不是程序员的员工:总之,

    (not <query1>)

    这是找到不满足条件<query1>的集合。

    最后一个组合的形式是被叫做lisp-value.当lisp-value是一个模式的第一个元素时,它指定
    下一个元素是一个Lisp的判断式,被应用其它的元素,都是它的参数。总之,

    (lisp-value  <predicate>   <arg1>  ...  <argn>)

    如果<predicate>  被应用到 <arg1>  ...  <argn>是真的时,条件被满足。例如,为了找到
    工资大于30000美元的所有的人,我们能有如下的写法:

    (and  (salary   ?person   ?amount) 
             (lisp-value   >  ?amount    30000))

    练习4.56
    写出检索如下的信息的复合查询:

    a.  被苯监督的所有的人的姓名和地址
    b.  工资小于苯的所有的人,结合他们的工资和苯的工资
    c.  被不在计算机部门的人监督的所有的人,包括监督人的姓名和工作。

    *规则
    除了原生的查询和复合的查询,查询语言提供了抽象查询的方法。这叫做规则。规则如下:

    (rule  (lives-near   ?person1  ?person2)  
             (and  (address   ?person1  (?town .   ?rest1))
                      (address   ?person2  (?town .   ?rest2))
                      (not (same  ?person1 ?person2))))

    上面的规则指定了如果两个人居住在同一个镇,这两个人彼此居住的很近。
    最后的Not子句排除了所有的人与自己居住的近的规则。相同的关系被一个
    很简单的规则定义:

    (rule  (same  ?x  ?x))

    如下的规则声明了一个人在组织中是一个间接的领导。如果他监督了某人,
    而这个人也成了监督者:

    (rule  (wheel  ?person)
            (and  (supervisor  ?middle-manager  ?person) 
                     (supervisor  ?x   ?middle-manager)))

    一个规则的通用形式是

    (rule  <conclusion>  <body>)

    <conclusion> 是一个模式, <body>任意的查询。我们能认为一个规则表示
    一个大的甚至是无限的判断式的集合,命名了规则结论的所有的实例,并且变量
    的赋值满足查询的语句。当我们描述简单的查询,如果实例化的模式在数据库中,
    我们说对变量的赋值满足了一个模式。但是模式不需要显式地在数据库中作为一个判断式。
    它能成为一个被规则应用的隐式的判断式。例如,查询

    (lives-near  ?x  (Bitdiddle  Ben))

    结果如下:

    (lives-near  (Reasoner Louis)  (Bitdiddle  Ben))
    (lives-near  (Aull DeWitt)   (Bitdiddle  Ben))

    为了找到居住在苯附近的所有的程序员,我们能写如下的查询:

    (and  (job  ?x  (computer  programmer))  
             (lives-near   ?x  (Bitdiddle  Ben)))

    作为复合的程序的例子,规则能被使用作为其它的规则的一部分,
    (正如在上面的lives-near我们看到的那样)或者甚至被递归地定义。
    例如,下面的规则

    (rule  (outranked-by  ?staff-person   ?boss) 
             (or  (supervisor   ?staff-person  ?boss) 
                    (and  (supervisor   ?staff-person  ?middle-manager) 
                             (outranked-by   ?middle-manager  ?boss))))

    说法是如果老板是这个人的监督者,或者是递归地说一个人的监督者比老板的级别低,
    那么一个员工比一个组织中的老板级别低。

    练习4.57
    定义一个规则,第一个人能代替第二个人。如果第一个人能做第二个人的工作,
    或者是某人能做第一个人的工作也能做第二个人的工作,并且如果第一个人和第二个人不是一个人。
    使用你的规则,给出查询,找到如下的信息:

    a.  能代替Cy的所有的人
    b. 能代替某人,且工资更低的所有的人,并且结合两者的工资。

    练习4.58
    定义一个规则,来指定一个人在部门中是大亨。如果这个人工作在部门中,在部门中
    却没有监督他的人。

    练习4.59
    苯总是错过会议。让他害怕的是,忘记会议的习惯可能让他失去工作,苯决定做一些事。
    他添加了所有的周会议到数据库中,通过如下的内容:

    (meeting  accounting  (Monday  9am))
    (meeting   administration  (Monday 10am))
    (meeting computer  (Wednesday  3pm))
    (meeting  administration  (Friday  1pm))

    如上的内容的每一个是部门中的一个会议。苯也添加了一个公司级
    的会议的入口,来描述所有的部门。公司的所有的员工都参加这个会议。

    (meeting  whole-company  (Wednesday  4pm))

    a.  在周五的早上,苯想要查询数据库,来找到发生在这一天的所有的会议。
      他应该使用什么查询?
    b. 阿丽莎是不满意的。她认为能够通过指定她的姓名来查询她要参加的会议
    才更有用。 所以,她设计了一个规则,一个人的会议包括所有的公司级会议,
    加上她所在的部门的会议。填写阿丽莎的规则的程序部分。

    (rule  (meeting-time   ?person  ?day-and-time)
       <rule-body>)

    c. 阿丽莎在周三早晨到了公司,查询这天她必须参加的会议。已经有了如上的规则,
    为了完成任务,她要做什么查询?

    练习4.60
    通过如下的查询

    (lives-near  ?person  (Hacker Alyssa  P))

    阿丽莎能找到谁居住在她的附近,她能和谁一起去工作。在另一方面,
    当她要找到居住在附近的人对,通过查询

    (lives-near  ?person1 ?person2)

    她注意到居住在附近的任何一对人,都被列出了两次,例如,

    (lives-near  (Hacker  Alyssa P)  (Fect Cy  D))
    (lives-near    (Fect Cy  D)  (Hacker  Alyssa P))

    为什么发生了这种情况?有一种方式,找到居住在她附近的人的列表吗?
    任何一对人,只显示一次吗?解释一下。

    *逻辑作为程序
    我们能认为一个规则是一个类型的逻辑含义:如果对模式变量的赋值满足条件,
    那么,它满足条件的结论。因此, 我们能认为查询语言有能力基于规则执行逻辑推导。
    作为一个例子,考虑一下在4.4部分中的开头处的描述的append操作。正如我们所说的,
    append能使用如下的两个规则来描述它的特征:

     对于任何列表y,空列表与y  append形成 y
     对于任何的u,v,y,z,如果v,y append形成z,
    那么 (cons  u  v)和 y  append 形成 (cons  u  z)

    在我们的查询语言中,为了表达这个内容,我们为如下的关系定义了两个规则,

    (append-to-form  x  y  z)

    我们能解释 x,y append 形成 z 的含义

    (rule  (append-to-form  ()  ?y  ?y))
    (rule  (append-to-form  (?u   .   ?v)    ?y  (?u  .  ?z))
         (append-to-form  ?v ?y  ?z))

    第一条规则没有程序体,它意味着结论支持?y的任何内容。
    注意的是第二条规则使用了点符号,来命名一个列表的car,cdr.

    根据这两条规则 ,我们能够写出计算两个列表的添加的查询来。

    ;;;Query Input:
    (append-to-form  (a b)  (c d) ?z)
    ;;;;  Query results;
    (append-to-form  (a b)  (c d)   (a b c d))

    更灵活的是什么,我们能使用相同的规则问问题“哪个列表与列表
    (a b)结合,生成列表(a  b c d)” 做法如下:

    ;;;Query Input:
    (append-to-form  (a b)  ?y   (a  b  c d))
    ;;;;  Query results;
    (append-to-form  (a b)  (c d)   (a b c d))

    我们也能问有哪些列表的数对 结合生成了(a b c d):

    ;;;Query Input:
    (append-to-form  ?x  ?y   (a  b  c d))
    ;;;;  Query results;
    (append-to-form  ()  (a b c d)   (a b c d))
    (append-to-form  (a)  (b c d)   (a b c d))
    (append-to-form  (a b)  (c d)   (a b c d))
    (append-to-form  (a b c)  (d)   (a b c d))
    (append-to-form  (a b c d)  ()   (a b c d))

    在为了上述的查询推导答案时,在使用规则时,查询系统可能似乎显出一些智能来。
    实际上,正如我们将在下一部分中看到的那样,系统在使用一种非常确定的算法,
    来阐述规则。不幸的是,尽管系统在append的例子上,工作得很得利,在更复杂的例子中,
    通用的方法可能失效了,这正如我们在4.4.3部分中看到的。

    练习4.61
    如下的规则实现了一个关系next-to,它要找到一个列表中的相邻的元素:

    (rule  (?x  next-to  ?y  in (?x ?y  .  ?u)))
    (rule   (?x  next-to  ?y  in (?v  .  ?z)) 
              (?x  next-to  ?y  in ?z))

    如下的查询返回的结果是什么?

    (?x  next  to ?  in (1  (2 3)  4))
    (?x  next  to  1  in  (2 1 3 1))

    练习4.62
    定义一个规则,实现练习2.17中的last-pair操作,它返回的是一个非空的列表中
    的包含最后一个元素的列表。在查询(last-pair  (3)  ?x), (last-pair  (1 2 3)  ?x),
    (last-pair  (2  ?x)  (3)),上检查你的规则。你的规则能正常地工作在查询上吗?例如
    (last-pair  ?x   (3)) ?

    练习4.63
    根据家谱,如下的数据库跟踪了Ada的祖行的谱系,直到Adam。

    (son  Adam  Cain)
    (son  Cain  Enoch)
    (son  Enoch  Irad)
    (son  Irad Mehujael)
    (son  Mehujael  Methushael)
    (son Methushael Lamech)
    (wife  Lamech Ada)
    (son Ada  Jabal)
    (son Ada  Jubal)

    写出规则 例如“S是F的儿子,并且F是G的儿子,那么S是G的孙子”
    “如果W是M的妻子,并且S是W的儿子,那么S是M的儿子”
    (可以认为在古代时比现在的规则更多)将让查询系统找到Gain的孙子,
    Lamech的儿子,Methushael的孙子(为了推导更复杂的关系,
    见练习4.69中的规则)

    展开全文
  • 什么是信息社会 ——信息检索的背景介绍 工业社会之后,1963年,日本梅棹忠夫在《信息产业论》中首先提出“信息社会”的概念。 技术的发展:通信技术、计算机技术等新型信息处理技术和手段的出现促使信息在更广泛...

    什么是信息社会 ——信息检索的背景介绍

    工业社会之后,1963年,日本梅棹忠夫在《信息产业论》中首先提出“信息社会”的概念。
    
    1. 技术的发展:通信技术、计算机技术等新型信息处理技术和手段的出现促使信息在更广泛的领域发生作用 ——每一个新概念的提出背后都有技术的发展作为支撑,尤其是科学技术领域

    2. 信息社会——信息技术和信息产业高度发达,信息资源极为丰富的社会,一个社会的信息化程度包括信息资源生产能力以及信息资源发展潜力。
      信息资源生产能力 ——社会当前生产信息和信息产品的能力,取决于信息技术和信息产业的发达程度
      信息资源发展潜力 ——社会未来生产信息和信息产品的能力,取决于**
      该社会信息技术和信息产业化的发达程度**,还取决于社会其他各个方面的知识化水平,如人的素质,社会的协调化程度。

    梅棹忠夫深刻的一段话:

    国民经济的发展以及产业结构的变化类似于动物的进化。对于高级的复杂动物(如人类),外层器官(大脑、神经系统和感觉器官)所占的比例较大。与此类似,随着社会经济的发展深化,信息产业的重要性将逐步提高,即相当于人的大脑、神经系统和感觉器官功能扩展的那些产业会迅速发展。

    日本学者认为:

      信息化指的是从有形的物质产品中创造价值的社会向无形的信息创造价值的社会阶段转变。
    

    信息化是以现代通信、网络、数据库技术为基础,对所研究对象各要素汇总至数据库,供特定人群生活、工作、学习、辅助决策等和人类息息相关的各种行为相结合的一种技术,使用该技术后,可以极大的提高各种行为的效率,为推动人类社会进步提供极大的技术支持。
    我的理解:利用信息技术应用于某一场景帮助提升从前行为的价值或者拓展出新的价值。

    信息素质的标准——如果想成为一个具有信息素质的人,你应该具备哪些条件?

    1.信息素养:(1)能够有效、高效地获取信息。(2)能够熟练、批判地评价信息。(3)能够准确、创造性地使用信息。

    以上是较为系统的说法,其实就是考验我们信息采集,信息分析,信息利用的能力。

    2.独立学习:(1)具有信息素养,并能探求于个人兴趣有关的信息,果然兴趣是最好的老师这句话大家都认同
    3.社会责任:略。

    展开全文
  • 大学文献检索资料 DOC

    2009-11-28 10:35:24
    文献信息检索实际上包括文献的存储和文献的检索两个相互依存的过程。 二、信息检索的步骤: 1.分析研究课题: 2.选择检索工具: 3.确定检索途径:分类途径、主题途径、题名途径、著作途径、号码途径、其他途径。 ...
  • 大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。 在这里还是要推荐下我自己建的大数据...

    大数据技术 ,就是从各种类型的数据中快速获得有价值信息的技术。 大数据 领域已经涌现出了大量新的技术,它们成为大数据采集、存储、处理和呈现的有力武器。大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。

    image.png

    一、大数据采集技术

    数据采集是指通过RFID射频数据、传感器数据、社交网络交互数据及移动互联网数据等方式获得的各种类型的结构化、半结构化(或称之为弱结构化)及非结构化的海量数据,是大数据知识服务模型的根本。重点要突破分布式高速高可靠数据爬取或采集、高速数据全映像等大数据收集技术;突破高速数据解析、转换与装载等大数据整合技术;设计质量评估模型,开发数据质量技术。

    大数据采集一般分为大数据智能感知层:主要包括数据传感体系、网络通信体系、传感适配体系、智能识别体系及软硬件资源接入系统,实现对结构化、半结构化、非结构化的海量数据的智能化识别、定位、跟踪、接入、传输、信号转换、监控、初步处理和管理等。必须着重攻克针对大数据源的智能识别、感知、适配、传输、接入等技术。基础支撑层:提供大数据服务平台所需的虚拟服务器,结构化、半结构化及非结构化数据的数据库及物联网络资源等基础支撑环境。重点攻克分布式虚拟存储技术,大数据获取、存储、组织、分析和决策操作的可视化接口技术,大数据的网络传输与压缩技术,大数据隐私保护技术等。

    二、大数据预处理技术

    主要完成对已接收数据的辨析、抽取、清洗等操作。

    1、抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的。

    2、清洗:对于大数据,并不全是有价值的,有些数据并不是我们所关心的内容,而另一些数据则是完全错误的干扰项,因此要对数据通过过滤“去噪”从而提取出有效数据。

    三、大数据存储及管理技术

    大数据存储与管理要用存储器把采集到的数据存储起来,建立相应的数据库,并进行管理和调用。重点解决复杂结构化、半结构化和非结构化大数据管理与处理技术。主要解决大数据的可存储、可表示、可处理、可靠性及有效传输等几个关键问题。开发可靠的分布式文件系统(DFS)、能效优化的存储、计算融入存储、大数据的去冗余及高效低成本的大数据存储技术;突破分布式非关系型大数据管理与处理技术,异构数据的数据融合技术,数据组织技术,研究大数据建模技术;突破大数据索引技术;突破大数据移动、备份、复制等技术;开发大数据可视化技术。

    开发新型数据库技术,数据库分为关系型数据库、非关系型数据库以及数据库缓存系统。其中,非关系型数据库主要指的是NoSQL数据库,分为:键值数据库、列存数据库、图存数据库以及文档数据库等类型。关系型数据库包含了传统关系数据库系统以及NewSQL数据库。

    开发大数据安全技术。改进数据销毁、透明加解密、分布式访问控制、数据审计等技术;突破隐私保护和推理控制、数据真伪识别和取证、数据持有完整性验证等技术。

    四、大数据分析及挖掘技术

    大数据分析技术。改进已有数据挖掘和机器学习技术;开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术;突破基于对象的数据连接、相似性连接等大数据融合技术;突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。

    数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘涉及的技术方法很多,有多种分类法。

    根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;

    根据挖掘对象可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web;

    根据挖掘方法分,可粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等。统计方法中,可细分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等。神经网络方法中,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法,另外还有面向属性的归纳方法。

    从挖掘任务和挖掘方法的角度,着重突破:

    1、可视化分析。数据可视化无论对于普通用户或是数据分析专家,都是最基本的功能。数据图像化可以让数据自己说话,让用户直观的感受到结果。

    2、数据挖掘算法。图像化是将机器语言翻译给人看,而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据,挖掘价值。这些算法一定要能够应付大数据的量,同时还具有很高的处理速度。

    3、预测性分析。预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。

    4、语义引擎。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。语言处理技术包括机器翻译、情感分析、舆情分析、智能输入、问答系统等。

    5、数据质量和数据管理。数据质量与管理是管理的最佳实践,透过标准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。

    五、大数据展现与应用技术

    大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,为人类的社会经济活动提供依据,从而提高各个领域的运行效率,大大提高整个社会经济的集约化程度。

    在我国,大数据将重点应用于以下三大领域:商业智能、政府决策、公共服务。例如:商业智能技术,政府决策技术,电信数据信息处理与挖掘技术,电网数据信息处理与挖掘技术,气象信息分析技术,环境监测技术,警务云应用系统(道路监控、视频监控、网络监控、智能交通、反电信诈骗、指挥调度等公安信息系统),大规模基因序列分析比对技术,Web信息挖掘技术,多媒体数据并行化处理技术,影视制作渲染技术,其他各种行业的云计算和海量数据处理应用技术等。

    查看更多文章:

    没有基础想学大数据难吗?

    大数据入门学习,你要掌握这些技能

    大数据领域三个大的技术方向

    自学大数据从哪入手

    大数据专业未来就业前景如何?

    教你大数据必修三大技能 ,快快记录下来

    展开全文
  • sql2005全文检索.doc

    2009-09-09 10:31:46
    SQL Server 2005全文检索技术在网站上的应用实录 http://tech.ddvip.com 2008年01月21日 社区交流 Excel服务器-用Excel做管理系统 关键字: DataGuard checkpoint 动态查询 synonyms 卸载SQL 2005 SQL Server群集 ...
  • 搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序...
  • 计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经...
  • 文本挖掘是一个多学科混杂的领域,涵盖了多种技术包括数据挖掘技术、信息抽取、信息检索,机器学习、自然语言处理、计算语言学、统计数据分析、线性几何、概率理论甚至还有图论。 二、文本挖掘有什么用...
  • 文本挖掘是一个多学科混杂的领域,涵盖了多种技术包括数据挖掘技术、信息抽取、信息检索,机器学习、自然语言处理、计算语言学、统计数据分析、线性几何、概率理论甚至还有图论。二、文本挖掘有什么用1、文本分类...
  • 语言技术平台(LTP) 是由 哈工大社会计算与信息检索研究中心 11 年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的...
  • 计算机视觉五大技术

    2020-04-27 13:10:38
    计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经...
  • 1 什么是pyltp语言技术平台(LTP) 是由 哈工大社会计算与信息检索研究中心 11年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、高效、...
  • 一文详解计算机视觉五大技术

    千次阅读 2019-08-20 00:51:49
    计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经...
  • EI、SCI、CSCI、CPCI 分别是什么

    千次阅读 2020-12-06 11:34:08
    EI在全球的学术界、工程界、信息界中享有盛誉,是科技界共同认可的重要检索工具。EI (工程索引)是全球范围内的一个数据库,主要收录工程技术领域的重要文献,包括期刊以及会议文献,另外也收录一些科技报告、专著等...
  • SCI作为众多学术研究者关注的焦点,能成功发表一篇SCI论文对每一位学者来说都...SCI即《科学引文索引》,是由美国科学信息研究所创建的,SCI是一部国际性的检索刊物,包括有:自然科学、生物、医学、农业、技术和行...
  • 语言技术平台(LTP) 是由 哈工大社会计算与信息检索研究中心 11  年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰
  • WEBRTC网络安全 波士顿大学EC601学期项目:测试WebRTC技术中的安全漏洞。 作者:Wiley Hunt和Apollo Lo 我们的项目涉及探索WebRTC和... :我们的工作是探索可以从恶意方拥有的公共TURN服务器中检索什么样的危害信息
  • 本文将对结合机器学习的 ranking 技术——learning2rank——做个系统整理,包括 pointwise、pairwise、listwise 三大类型,它们的经典模型,解决了什么问题,仍存在什么缺陷。关于具体应用,可能会在下一篇文章介绍...
  • 范围:文本分析、信息检索、词性标注、问答系统、邮件回复、文本分类、文本鉴别(涉黄、反动)等。 (1)词法分析 a.分词技术 b.词性标注 是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个...
  • SCI即《科学引文索引》,是由美国科学信息研究所创建的,SCI是一部国际性的检索刊物,包括有:自然科学、生物、医学、农业、技术和行为科学等,主要侧重基础科学。所选用的刊物来源于94个类、40多个国家、50多种文字...
  • 数据挖掘不是一种广告宣传,它是一个应用驱动的领域,数据挖掘吸纳了诸如统计学习、机器学习、模式识别、数据库和数据仓库、信息检索、可视化、算法、高性能计算和许多应用领域的大量技术。它是从大量数据中挖掘有趣...
  • 计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经...
  • 计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经...
  • 互动信息管理 - 包括反馈信息管理、互动咨询管理、社区评论管理 网站广告系统 - 具有分组轮播广告、页内广告、浮动广告、弹出窗口、挂角广告等多种形式 网站页面设置 - 可以设置每个页面的自定义标题、META标签、...

空空如也

空空如也

1 2 3 4 5 ... 11
收藏数 201
精华内容 80
关键字:

信息检索技术包括什么