精华内容
下载资源
问答
  • 如何判断照片曝光是否准确

    千次阅读 2013-12-12 19:08:21
    正确地曝光是拍出一张照片的最基本要求,那么如何能判断一张照片曝光是否正确呢? 在胶片时代,唯一的方法就只能是回来把照片冲洗出来之后才...但数码相机的屏幕往往都带有欺骗。很多人都有这样的体会:一张在相机上

    正确地曝光是拍出一张照片的最基本要求,那么如何能判断一张照片曝光是否正确呢?

    在胶片时代,唯一的方法就只能是回来把照片冲洗出来之后才看得到。

    使用数码相机,就可以在拍完之后立刻回放照片。理论上,这样就可以立即做出判断了。但事情往往没有这样简单。

    • 相机屏幕会骗人

    在相机上回放照片,我们可以立即看到拍到的画面。但数码相机的屏幕往往都带有欺骗性。很多人都有这样的体会:一张在相机上看效果不错的照片,在电脑屏幕上却可能惨不忍睹;而一张在相机上看起来不佳的照片,却有可能其实还不错。


    这是因为相机屏幕与电脑显示器之间存在差异。包括分辨率、显示材质、亮度等等。其中由于亮度不同,所以在相机看到曝光准确的照片,在电脑屏幕上看却很有可能过曝或欠曝。有一次外拍,我对模特测光拍摄之后回放,并以此为基础进行正式拍摄。结果在相机上看到正常的照片,导入电脑之后才发现全部过曝了。这就是因为相机屏幕的亮度比电脑屏幕低。

    • 环境有影响

    在室外拍摄,尤其是阳光明媚的晴天,回放照片是一件很有难度的事。强烈的阳光会影响你对屏幕的观察,甚至可能完全无法看清画面。即使躲在阴影中,明亮的环境也会产生很大的影响,几乎很难根据屏幕显示来判断曝光。

    • 直方图是可靠的工具

    既然眼睛不可靠,我们还能用什么工具呢?答案就是直方图。直方图上显示的是一张照片中从明到暗的数据分布,由于数据不会受设备或环境的影响,在任何地方看都是一致的。所以直方图就是我们用来判断曝光的可靠工具。

    • 直方图如何看


    上图是直方图的三种形式。直方图中像山峰一样的黑色区域,就是照片中的明暗信息。其中横坐标从左至右代表从最暗(纯黑)到最亮(纯白)的亮度,“山峰”越高,则代表在该亮度上的信息最多。


    在顶图中,“山峰”完全挨着直方图的右边,说明在照片中有大量无细节的纯白区域,而缺少暗部信息,这往往说明照片已经过曝。


    在底图中,“山峰”几乎靠着直方图的左边,说明在照片中有大量几乎纯黑的无细节区域,同时缺少亮部信息,照片很可能欠曝。


    看中间的图,“山峰”既不靠左,也不挨右,说明照片中没有溢出的数据,所有画面都有细节,其中亮度位于黑白中间的信息最多,说明照片整体亮度适中,曝光准确。

    • 直方图的局限

    在一般的场景中,光线亮度比较均匀,位于中间亮度的部分最多。但是有些场景本身就是高亮或昏暗的,比如雪景或夜景,此时如果“山峰”还保持在中间,反而说明曝光不准确,而“山峰”偏右或偏左,才是准确的。


    此外,由于直方图上反应的是照片中所有的亮度信息。如果在画面中有绝对高光,比如灯泡或太阳,或者绝对黑暗,比如阴影中的纯黑物体,那么直方图上的“山峰”始终都会紧挨着一侧边缘,此时就不能要求所有信息都位于直方图左右边缘之内。

    • 结论

    在拍摄中,用眼睛在相机回放中判断曝光往往是不准确的,应以直方图作为判断依据。正常情况下,直方图上的信息应该位于左右边缘之间,且中间部的信息最多。


    此外,要记住直方图只是反映一张照片上的明暗信息分布情况。在具体使用时必须根据场景的实际情况来灵活使用。



    展开全文
  • mysql处理高并发-保证数据准确性

    万次阅读 2017-05-26 18:53:36
     1、先查询出目前金额信息a  2、将充值的金额组装a(原金额+充值金额=新金额)  3、更新金额(执行update方法) 问题: 多并发的情况下, 会是多个线程同时读取到目前金额a , 之后 多个线

    问题描述: 压力高并发情况下  执行update方法 得到结果非预期结果

     

    例如: 多个线程执行 充值金额方法

             1、先查询出目前金额信息a

             2、将充值的金额组装a(原金额+充值金额=新金额)

             3、更新金额(执行update方法)

    问题: 多并发的情况下, 会是多个线程同时读取到目前金额a ,  之后 多个线程进行分别组装数据,依次更新,  这就导致  A账户本来有50元  两个并发线程同时充值50元  最终数据库中 账户只有100元,而不是150元(第二次更新覆盖第一次更新)

     

    解决方案:

    1、先更新(更新会锁表)  然后在查询   如果金额超出预期  直接回滚 ,更新中  将加减运算放在sql中执行 可以保证数据准确性。

    beginTranse(开启事务)

    try{

        //quantity为请求减掉的库存数量
        $dbca->query('update s_store set amount = amount - quantity where postID = 12345');

        $result = $dbca->query('select amount from s_store where postID = 12345');

        if(result->amount < 0){

           throw new Exception('库存不足');

        }

    }catch($e Exception){

        rollBack(回滚)

    }

    commit(提交事务)

    优化:

    beginTranse(开启事务)

    try{

        //quantity为请求减掉的库存数量
        $dbca->query('update s_store set amount = amount - quantity where postID = 12345');

        $result = $dbca->query('select amount from s_store where postID = 12345');

        if(result->amount < 0){

           throw new Exception('库存不足');

        }

    }catch($e Exception){

        rollBack(回滚)

    }

    commit(提交事务)

     

    2、乐观锁,类CAS机制

        第二种加锁方案是一种悲观锁机制。而且SELECT...FOR UPDATE方式也不太常用,联想到CAS实现的乐观锁机制,于是我想到了第三种解决方案:乐观锁。

        具体来说也挺简单,首先SELECT SQL不作任何修改,然后在UPDATE SQL的WHERE条件中加上SELECT出来的vip_memer的end_at条件。如下:


    vipMember = SELECT * FROM vip_member WHERE uid=1001 LIMIT 1 # 查uid为1001的会员
    cur_end_at = vipMember.end_at
    if vipMember.end_at < NOW():
       UPDATE vip_member SET start_at=NOW(), end_at=DATE_ADD(NOW(), INTERVAL 1 MONTH), active_status=1, updated_at=NOW() WHERE uid=1001 AND end_at=cur_end_at
    else:
       UPDATE vip_member SET end_at=DATE_ADD(end_at, INTERVAL 1 MONTH), active_status=1, updated_at=NOW() WHERE uid=1001 AND end_at=cur_end_at

     

        这样可以根据UPDATE返回值来判断是否更新成功,如果返回值是0则表明存在并发更新,那么只需要重试一下就好了。

     

    3、应用层分布式锁

    可以在应用层使用一个分布式锁(可以放在Memcache中),控制同一时间,只允许一个应用实例进行查询并更新的操作。

     

    4、使用队列

     

     

    相关推荐: http://blog.csdn.net/asd1836382/article/details/46355703

    http://www.jb51.net/article/50103.htm

    http://blog.csdn.net/dujianxiong/article/details/54849091

    http://blog.csdn.net/caomiao2006/article/details/38568825(个人认为  这个写的还不错)

    展开全文
  • 大数据的监控和数据准确性保证

    千次阅读 2015-07-15 11:44:46
    虽然在总概上能够保证数据的准确性,但是具体到每一个数据的准确性上需要加强,目前想到的加强措施如下: (1)针对得到的PDC数据,另起一套代码反向匹配校验 宽表 和 数据源 数据。 (2)加强Code Review,确保...

    我们目前的数据流程是:数据源数据 经过挖掘处理转换等操作生成中间数据,入宽表 ,然后 提取宽表数据 入PDC,数据停留的地方有 数据源–>中间数据–>宽表–>PDC。

    目前我们的监控措施如下:
    (1) 数据源 –>中间数据–>宽表 每个数据流有监控,监控的是每个数据的总量
    (2) 每天运行监控 监控 宽表每个数据的变化
    (3) 宽表–>PDC有对最终每种数据总量的监控 和 对 数据的简单校验(如 太大的数据,太小的数据,数据解密异常等的校验)

    虽然在总概上能够保证数据的准确性,但是具体到每一个数据的准确性上需要加强,目前想到的加强措施如下:
    (1)针对得到的PDC数据,另起一套代码反向匹配校验 宽表 和 数据源 数据。
    (2)加强Code Review,确保代码逻辑不出问题;加强沟通,确保对数据的处理理解不产生歧义。
    (3) 开发一套注重隐私安全的简单校验系统,让每个人能够核对一下自己的PDC数据,以发现 数据挖掘 的不足,并进行优化。

    展开全文
  • 第五章 信息法与综合性信息检索 目录: 5.1 信息法概述 5.1.1 信息法的概念 从广义上讲,信息法是调整信息活动中产生的各种社会关系的法律规范的总称。 一般来说,信息法由信息资源管理法、政府信息公开法、信息...

    第五章 信息法与综合性信息检索

    目录:
    在这里插入图片描述
    在这里插入图片描述

    5.1 信息法概述

    5.1.1 信息法的概念

    从广义上讲,信息法是调整信息活动中产生的各种社会关系的法律规范的总称。
    一般来说,信息法由信息资源管理法、政府信息公开法、信息保密法、大众传播法、知识产权法、网络信息法等组成,涉及宪法、法律、行政法规、部门规章、地方行政和规章在内的所有关于信息活动和信息工作的法律法规。

    5.1.2 信息法律关系

    信息法律关系是根据信息法规产生的,以主体之间的权利义务关系为表现形式的特殊的社会关系。信息法律关系的主体,又称信息权利主体,是指信息法律关系中的权利享有者和义务承担者。自然人(公民)、法人、国家(政府)这三类主体,是信息法规定的信息主体的法律形态。
    信息法律关系的客体,又称信息权利客体,是信息法律关系主体的权利和义务所指向的对象或称标的。信息法律关系的客体是信息,但并非一切信息,只是那些能够满足信息主体的利益或需要的,同时又能得到国家相关法律确认和保护的信息,才能成为信息法律关系的客体。

    5.1.3 信息法律与信息政策

    现代信息资源管理不仅要依赖于法律的调整,在很大程度上,也需要政策的管理。信息政策是国家机关根据需要制定的有关发展和管理信息事业的方针、原则和办法。它是调整国家信息实践活动并借以指导推动整个信息事业发展的行动指南。信息法律与信息政策作为国家调节信息活动产生的社会关系的两种重要手段,二者既有密切的联系,又有区别。
    在这里插入图片描述

    5.1.4 信息立法

    信息立法是指由一定的国家机关制定信息法律的活动。广义上的信息立法还包括国家认可的行政机关制定行政规章的活动和对有关规范性法律文件进行的修改、补充和废止等活动。在我国,信息立法的形式主要有法律、行政法规、国务院部门规章、地方法规、地方政府规章等形式。

    5.2 知识产权与信息产权

     (一)知识产权内涵的拓展到信息产权理念的提出
     (二)信息产权 (information property)
    信息产权(Information Property)是信息所有者基于信息产品享有的特定性质的人身权和财产权。与知识产权一样,信息产权也是一种无形财产权,它是信息产品法律化的表现。知识是信息的核心。知识产权是信息产权的核心部分,但信息产权的内涵要广于知识产权。

    5.2.1 知识产权的概念与法律特征

    知识产权又称智力财产权、知识所有权,英文为intellectual property,它是指人们对脑力劳动创造的智力成果所依法享有的专有权利。
    “知识产权”概念最早由17世纪中叶的法国学者卡普佐夫提出,后为比利时法学家皮卡尔所发展。1967年签署的《成立世界知识产权组织公约》(WIPO),正式采用“intellectual property”,从此知识产权作为一个法律概念逐步得到世界多数国家和众多国际组织的承认。
    在我国过去一直采用智力成果权来表示这一权利概念,直到1986年颁布的《中华人民共和国民法通则》,才正式启用了知识产权的概念。

    5.2.2 知识产权范围

    根据根据中国《民法通则》规定,知识产权的范围包括
    (1)著作权(文学、科学和艺术作品、计算机软件);
    (2)邻接权(出版物、演出、录音录像以及广播电视节目);
    (3)发现权(科学发现);
    (4)专利权(发明、实用新型、外观设计);
    (5)发明权和其他科技成果权(发明、科技进步、合理化建议、技术改进);
    (6)商标权(商标以及服务标记)。
    在这里插入图片描述

    5.2.3 知识产权法

    知识产权法是国家法律体系中综合调整公民、法人或非法人单位相互之间在创造、使用、转让智力成果过程中形成的社会关系的法律规范的总和。它是著作权法、专利法、商标法等各项与知识产权有关的单一性规律、法规的综合。一般认为,著作权、专利权、商标权是知识产权法律制度的三大支柱。
    在这里插入图片描述

    5.2.4 知识产权制度对社会信息化的影响

     (一)知识产权制度是知识和信息创新的的动力机制
     (二)知识产权制度是信息市场运行的基础机制
     (三)知识产权制度可以增强全面信息意识

    5.3 著作权

    著作权又称版权(copyright),是指作者或其他著作权人依法对文学、艺术、科学作品所享有的各项专有权利的总称。我国第一部《著作权法》颁布于1990年9月,后经多次修改,现行的《著作权法》是2010年2月第三次修正后施行的。

    5.3.1 著作权的主体与客体

     根据我国《著作权法》 (2010)中的表述,受著作权法保护的客体就是作品。我国《著作权法实施条例》规定作品是指:“文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。”这些作品必须具有独创性、表达性、可复制性、合法性以及必须是著作权法意义上的作品。
     著作权保护的主体即著作权法律关系的主体,简称为著作权人,是指依法对文学、艺术和科学作品享有著作权的自然人、法人或者其他组织。根据《著作权法》规定,著作权主体可以是公民、法人或其他组织。著作权原始主体中最常见的是作者。

    5.3.2 著作权的内容与限制

    (一)著作权的内容
    1.著作人身权
    根据我国《著作权法》(2010)的规定,著作权中的人身权的内容包括署名权、发表权、修改权和保护作品完整权。
    2.著作财产权
    根据我国《著作权法》(2010)第10条的规定,著作权中的财产权包括:复制权、发行权、出租权、展览权、表演权、放映权、广播权、信息网络传播权、摄制权、改编权、翻译权、汇编权以及应当由著作权人享有的其他权利。
    (二)著作权的限制

    1. 合理使用
    2. 法定许可
    3. 强制许可

    5.3.3 著作邻接权

    著作邻接权,简称邻接权,是知识产权中与著作权相邻接的一种权利。它的实质是指作品传播者在传播作品时所享受的权利,因为它和著作权紧密相连,所以世界上大多数国家都称之为“邻接权”。我国《著作权法》将邻接权表述为“与著作权相关的权益”,且在《著作权实施条例》中规定了邻接权的范围,即“与著作权有关利益,指出版者对其出版的图书和期刊的版式设计享有的权利,表演者对其表演享有的权利,录音录像制作者对其制作的录音录像制品享有的权利,广播电台、电视台对其播放的广播、电视节目所享有的权利。

    5.3.4 著作权的法律保护

    (一)著作权的侵权行为
     所谓侵犯著作权的行为,是指未经著作权人的许可,违反法律规定而擅自行使著作权人的权利或者妨碍著作权人权利实现的行为。
     各国著作权法都规定侵犯著作权应当依法承担相应的法律责任。我国《著作权法》 (2010)第46条和第47条列举了19种侵权行为。
    (二)著作权的侵权责任
     著作权侵权的法律责任一般分为民事责任、行政责任和刑事责任。
     我国《著作权法》 (2010)第46、47条对侵犯著作权的行为规定了承担停止侵害、消除影响、赔礼道歉、赔偿损失等民事责任。这些责任方式,既可以单独使用,也可以合并使用。

    5.4 网络环境下的知识产权保护

    随着现代信息技术的飞速发展和网络的普及,人类社会中一种全新的环境——网络环境逐步成为现实。网络作为第四代信息媒体,以其独有的开放性、无国界性、无限复制性和交互性等特点,在带来作品传播和利用方式根本性变革的同时,也对传统知识产权制度产生了重大影响,这就要求我们以更广阔的视野来认识知识产权,探讨由此产生的相关问题。

    5.4.1 数字作品的知识产权保护

    (一)数字作品的著作权认定
     所谓数字作品,不仅包括文字、美术、摄影、动画、电影、电视等传统作品的数字表达形式,还包括从其被创作之时就是用二进制数字编码形式表达的计算机软件、数据库和多媒体作品等新型数字作品。
     我国国务院法制办与国家版权局共同起草的《著作权法修正案(草案)》中,已确认“数字化”应该是版权人的一项专有权利。目前更多的业内人士倾向于复制行为包括上载、下载、转贴、转寄、储存、数字化、扫描、浏览、打印等,所以未经权利人允许,擅自对他人作品进行数字化处理,就是擅自复制他人作品,应承担侵权责任。
    (二)数字作品的知识产权保护
     我国国家版权局曾于1999年12月9日发布了《关于制作数字化制品的著作权规定》,该规定第2条中指出将已有作品制成数字化作品,不论已有作品以何种形式表现和固定,都属于《著作权实施条例》第5条所指的复制行为,即《中华人民共共和国著作权法》所称的复制行为。第7条又规定,未经著作权人或者著作权集体管理组织许可,将受著作权保护的他人作品制成数字化作品的,除应承担相应的民事责任外,著作权行政管理部门可依照《著作权实施条例》有关规定给予行政处罚。

    5.4.2 网络传输中的著作权问题

    (一)网络传输与复制权
     在网络环境下,通过缓存、浏览、粘贴和下载等手段,大量的数字作品可以被简便、高速、高质量地复制利用,并且这种复制大多是在计算机网络正常运行中自动产生的,使得对他人作品的利用几乎不需要付出什么代价。为了平衡著作权人与使用者之间的利益关系,欧美一些国家主张将网络传输中的“暂时复制”纳入复制权的保护范围内。
     暂时复制”这类复制行为能否纳入传统的“复制”概念进而获得传统复制权的保护,一直是国际版权界争论的焦点。

    (二)网络传输与发行权
     传统的发行是对有形复制件的发行,从我国的《著作权法》(2010)第10条第(6)项所表述“发行权”定义中可以推定发行的定义是:以出售或者赠与方式向公众提供作品的原件或者复制件的行为。通过发行行为,使得有形复制件(如图书)的所有权或者一定期限内的使用权从发行者的手中转移到使用者手中,但在这之前须发生“复制”行为,即发行是与复制行为相联系的。
     美国1995年的《知识产权与全国信息基础设施白皮书》认为网络传输属于向公众发行,在版权人专有的发行权之内。
     欧盟则有不同的理解,1997年12月欧盟通过了《关于协调信息社会的版权和有关权若干方面的指令》,指出发行权是指作者控制以任何形式向公众发行作品原件或有形复制件的的专有权,但是发行权不适用于服务和在线传输,网络传输因此被排除在发行的含义之外。

    (三)网络传输与信息网络传播权
     我国2001年在修改的《著作权法》第10条的有关内容中增设了信息网络传输权。所谓信息网络传播权是指以有线或者无线的方式向公众提供作品,使公众可以在其个人选定的时间和地点获得作品的权利。信息网络传播权的法律地位的确立,使著作权人对作品的传播方式的专有控制权延伸到网络空间,并能直接传播作品,行使邻接权。
     在网络环境下,作为一种信息网络传播者,图书馆在促进人类信息自由和知识共享方面具有重要作用。享有一定的信息网络传播权例外,对图书馆资源建设与信息服务具有重要意义。2006年,中国图书馆学会发布了《关于网络环境下著作权问题的声明》。

    5.4.3 网络传播权的行使

    在这里插入图片描述

    5.4.4 数据库的知识产权保护

    (一)数据库的概念和知识产权保护原则
    (二)我国对数据库的知识产权保护
    (三)数据库的合理使用和侵权界定
    (四)数据库的特殊权利保护

    小结

    信息法是调整人类在信息的采集、加工、存储、传播和利用等活动中发生的各种社会关系的法律规范的总称。随着社会信息化进程的不断加快,特别是随着计算机、网络等信息技术的广泛应用,传统的知识产权制度开始面临越来越多新的挑战。本章主要从信息法的概念、知识产权与信息产权、著作权以及网络环境下的知识产权保护四个层面来进行阐述,并基于网络和信息技术来重新审视知识产权制度,树立信息产权的新理念并注重网络环境下知识产权的保护。

    5.5 科技信息检索概观

    信息检索的发展首先是从科技信息开始的,地区性乃至国际性的信息服务也同样以科技信息为开端。科技信息是科学技术的直接反映,标志着科学技术的发展水平,最新、最及时、最有针对性的科技信息也是科学技术进一步发展和创新的基础和动力。越来越多的人将科技信息看成是重要的资源、无形的财富和资产,掌握科技信息成为增强竞争能力、提高自身实力的重要因素。正是这种对科技信息的强烈需求促进了科技信息产业的发展,促进了科技信息加工、处理、检索理论与实践的发展。

    科技信息检索技术经历了50多年的发展,从手工检索、脱机检索、联机检索、光盘检索到网络检索。其中某些方式已被其他方式取代,如脱机检索被联机检索取代,光盘检索作为一种过渡形式已发展成为网络检索。

    在电子读物日益走进人们生活的今天,传统的印刷本读物在短期内仍然占据着难以替代的重要位置。也就是说今天印刷型出版物的重要地位仍然没有改变,同样,印刷本检索工具的重要地位也依然存在。因此,我们在介绍科技信息检索时,将手工检索工具与计算机检索结合起来讲解。

    5.6 理科信息检索

    理科信息主要指以理科的学科专业为界线划分整理的科技信息,通常包括数学、物理、化学、生物学。这些学科涉及的检索工具也较多,本节以3个应用比较普遍的检索工具为例介绍其用法。

    5.6.1 《生物文献摘要》

    1.概念
    美国《生物学文摘》(Biological Abstracts,简称BA) 创刊于1926年。现为半月刊,一年二卷。BA是目前关于生命科学的最大的一部文摘型检索工具,具有广泛的收录范围,除包括传统的动物学、植物学和微生物学等领域之外,还包括实验医学、农学、药学、生化、生态学、生物医学工程及仪器等一些边缘学科或相关领域。

    2.BA印刷版
    ①BA文摘本
    BA文摘本由类目表、文摘正文、辅助索引组成。类目表决定了BA文摘正文的编排顺序,也是检索文摘的一条检索途径。文摘正文按分类组织,类目与标题等级表的类目设置一致。辅助索引自创刊以来变化较大,目前文摘本中的索引有生物体索引、主题索引和著者索引。

    ②BA来源期刊目录
    BA来源期刊目录(Serial Sources for the BIOSIS DATABASE)自1979年开始出版,单独发行。

    ③生物学文摘/报告•评论•会议
    创刊于1965年,1980年改为现刊名,现为半月刊。BA/RRM收录BA未摘录的生物学文献,BA/RRM和BioResearch Index都是题录型刊物,不带文摘。

    3.BA数字版
    BA数字版有联机数据库、光盘数据库和网络版检索系统。

    BA联机数据库(BIOSIS Previews)由BIOSIS出版,收录的文献包括BA、BA/RRM及其前身Bioresearch Index。该数据库在一些主要的联机检索系统中均有相应的文档。

    BA光盘版(BA on CD)于1980年由BIOSIS编辑出版,3个月更新一次,累积半年的数据出版一张光盘,内容等同于印刷本。

    BA网络版数据库(BIOSIS Previews)用法与光盘版基本一致,其网站 (www.biosis.org) 除提供BA数据库信息外,还提供相应的其他信息与服务。

    4.生物学相关文献检索
    除BA外,生物学信息还广泛分布在中外文其他检索工具和网络信息资源中:

    ①中文检索工具
    分别是:《中国生物学文摘》、《古生物学文摘》和《中国国土资源文摘》。

    ②外文检索工具
    英文的生物学检索工具出版量比较大,种类也较多,如英国生理学会出版的《生物科学近期文献题录》(Current Awareness in Biological Sciences), 伦敦动物学会出版的《动物学记录》(The Zoological Record)等。

    ③网上信息资源
    中文生物学网上信息有:中国科学院上海生物工程研究所中心网站(http://www.srcb.ac.cn)。此外,国内各生物学研究所和各大学生物系的网站均能提供一定的生物学信息。外文关于生物学的网上信息在一些大学的网站上也能找到。

    5.6.2 《化学文摘》

    1.概念
    美国《化学文摘》(Chemical Abstracts,简称CA),创刊于1907年,现为周刊,每年出版2卷,每卷26期。CA是检索化学文献极为重要的检索工具,由于其具有广博的收录范围、完备的索引体系、短暂的出版周期、多样化的出版形式为检索者带来了方便,成为世界上公认的最大型、最权威的化学化工信息检索工具,在我国化学界享有盛誉。

    2.CA印刷版
    CA的印刷本是最古老的出版形式,至今依然具有重要作用。掌握印刷本的编撰结构,对于熟练掌握其用法和提高检索效率具有重要意义。

    ①CA的文摘本
     CA每周出版一本文摘。
     CA的文摘本由分类目次表、文摘、索引和附录构成。
     文摘按分类目次表所列类目编排,每一类目下的文摘分四个部分编排,每一部分之间用虚线隔开。其编排次序是:
    a. 论文(包括会议录、学位论文、科技报告、存档资料和专题综述等);
    b. 新书及视听资料;
    c. 专利文献;
    d. 相关的类目参见条目。

     CA的文摘以报道型文摘为主,其报道的内容包括:
    a. 研究的目的和范围;
    b. 新的化学反应、化合物、材料、工艺设备和资源等;
    c. 已知物质的新性质、新来源及新应用;
    d. 观测的数据和结果以及作者的解释和结论。

     文摘内容以报道性文摘为主,因此,阅读CA文摘在某种程度上可以代替阅读原文。
     CA文摘本附有三种索引:关键词索引、专利索引和著者索引。

    ②CA索引本
    CA具有多种形式的索引本,包括卷索引、年索引和5年(10卷)累积索引,其中卷索引和累积索引中的索引类型是一致的,有:化学物质索引、普通主题索引、分子式索引、环系索引、著者索引、专利索引,年索引有登记号索引、来源索引(CASSI)。

    化学物质索引
    它是从1972年76卷起从CA的主题索引中分离出来而编制的索引,它所收录的化学物质具有以下特征:原子和原子数目已知;分子的价键清楚;主体化学结构稳定。
    化学物质索引由主、副二级标题组成。主标题由化学物质名称组成,副标题由表示主标题某方面或某类别的名词组成。使用该索引检索时,要注意其主标题并不是以所有的化学物质名称做标识词,特别是有机化合物通常只以母体化合物为索引标题(又称为化合物索引名称),而把母体化合物的化学功能衍生物,一般衍生物、化合物、聚合物,列于母体化合物为索引标题的条目之中。另外,一种化学物质可能会有多个名称,而化学物质索引中只用一个名称作索引标识词,该名称由CAS选用它认为是最合适的命名法来命名的。也就是说使用本索引检索前还要确定所要检索的化合物在CA中的名称,确定该名称的最好办法就是使用CAS出版的“索引指南”(Index Guide)。化学物质索引的副标题有普通副标题、类别副标题和专用副标题三类:普通副标题由比较通用的名词组成,起限定主标题的研究范围或方面的作用;类别副标题(Categories)都是表示化合物类别的词,以及取代基和官能团的词,起着把主标题(化学物质名称,即所谓化合物索引名称)的化学衍生物条目按类归并的作用;专用副标题严格专用于相应的主标题。

    环系索引
    它是专门用来查找环状化合物的索引。它首先按环状化合物环的数目由小到大排列,其次按环架上原子数和环架上元素的成分排列,并给出母体化合物名称,但不给文摘号,因此,该索引不能用来直接查找文献信息,必须再转查化学物质索引,所以我们称它为辅助索引。

    著者索引
    它与文摘本中的著者索引编排方法基本一致,所不同的是索引本中著者索引的著录项目除了作者姓名和文摘号外,还有文献篇名。通过文献篇名可以初步了解文献内容并可对同一作者的多篇文献进行区分。

    专利索引
    该索引与文摘本中的专利索引完全一致。
    来源索引(CAS Source Index 简称CASSI)
    CAS报道的化学信息来源广泛,它将CA所有的信息来源收录其中并指示给读者。
    登记号手册
    它是1974年以后出版的,原为登记号索引(Registry Number Index),专门收录化学文献中带有登记号的化学物质,每个有登记号的物质的化学成分和分子结构都是明确清晰的,每一个号码唯一地代表一种物质。

    ③检索语言
    CA没有严格意义上的检索语言,但它于1968年第69卷开始出版的索引指南就是对CA各种索引用法的指导,特别是对化学物质索引和普通主题索引的标题的规范以及标题之间关系的提示,成为使用CA的重要的辅助工具,因此,它在一定程度上起到了检索语言的作用。

    索引指南结构由两部分组成:正文部分和附录部分。
    正文部分主要帮助用户正确选择化学物质索引和普通主题索引的标题。
    正文部分使用的参照系统主要有:“见”(see)和“参见”(see also)参照项。 “见”项参照又可分为普通主题概念参照和化学物质参照,普通主题概念参照是对一些一般性的概念、混合物和一些结构不确定的化学物质的规范化控制,化学物质参照是对具有多个名称的化合物特别是有机化合物的规范化控制;“参见”参照项,将在内容上有联系的标题揭示出来,可以帮助使用者扩大检索范围;主要目的是帮助用户正确判断相关内容的含义,从而正确选择标题。

    3.CA数字版
    CA的数字化信息主要由联机数据库和光盘数据库资源组成。随着计算机和网络的发展,联机数据库进一步发展成网络化数据检索系统。

    CA的联机数据库收录从1967年至今的所有CA印刷本的化学文献,该数据库在主要的国际联机系统中均有收藏。CA的光盘数据库目前广泛使用的有由美国化学学会制作的“CA on CD”光盘和Compact Cambridge 科学文献服务社制作的“化学文摘累积索引及文摘”光盘两种。

    4.化学文献的相关检索
    化学化工相应的检索工具较多,如:《中国化学化工文摘》、《化工文摘》、《精细石油化工文摘》等,有些文摘刊物已发行了光盘版。
    网上化学、化工资源十分丰富,除DIALOG系统、ORBIT系统含有大量的化学化工文档外,还有许多专门的化工网站、各大学的化学化工学院等也是化学信息的重要来源。

    5.6.3 《科学文摘》

    1.概念
    英国《科学文摘》(Science Abstract,简称SA)由现名为国际物理学与工程信息部出版。目前具有三个分册:A辑:《物理文摘》,半月刊,报道范围包括基本粒子、核物理、原子物理、分子物理等有关物理学方方面面的研究,也包括测量与仪器等;B辑:《电气与电子学文摘》,月刊;C辑:《计算机与控制文摘》月刊。这三个分册除报道内容不同外,其结构与用法均相同。SA收录的文献类型以期刊论文为主,1977年后不再收专利。

    2.SA印刷版

    ①SA文摘本
    SA文摘本由分类目次表、文摘正文、辅助索引构成。分类目次表位于每期首页,每卷第一期还加一页主题分类表,此外每期分类目次表之后还有一个主题指南。由于SA的文摘本中没有主题索引,因此“分类目次表”是利用文摘本从主题内容角度检索文献信息的主要途径。SA的分类体系比较新,类目设置系统、完整,类目之间的参见注释多而且详细,因此,利用分类表查找文摘是比较便利的。SA文摘正文是按照分类组织的,其顺序与正文前的分类目次表一致。辅助索引有多种:著者索引、图书索引、会议索引、团体著者索引、参考书目索引,每个索引各有专门的用途,供读者快速查找那些特殊类型的文献(如专题书目、图书、会议文献,技术报告等),故又可称之为“专用索引”。

    ②SA索引本
    SA索引本有半年累积索引本和多年累积索引本,其索引的种类在文摘本基础上增加了主题索引。SA的主题索引是单级主题索引,每条索引款目由主题词、说明语和文摘地址构成,按主题词的字母顺序排列。主题词是规范化的词汇,词汇全部来自SA的叙词表(1NSPEC Thesaurus),索引中的说明语是由标引者自编的,说明语一般由一组关键词或短语构成,为节省篇幅,说明语中使用了许多缩写词。由于SA的主题索引中的索引词选自叙词表,因此,检索时应借助于叙词表选择主题词,这是检索主题索引的关键。

    ③SA检索语言
    SA检索语言由比较标准的叙词表构成,其主题索引就是以该表为基础编制的,因此,它是使用SA主题索引的重要助手。SA叙词表(INSPEC Thesaurus)由两部分组成:字顺表和词族表。字顺表是主体,有完善的词汇控制和参照系统。SA叙词词表揭示的完善的词间关系可以有效地帮助用户选择检索词。熟悉词表并充分利用词表对提高检索效率和效果都具有重要意义。

    3.SA数字版
      SA数字版包括联机版、光盘版和网络版。联机版早在1973年就投入使用,光盘版在1989年推出,网络版是在联机版基础上发展起来并进入网络化系统提供服务。SA光盘版(INSPEC数据库)每年出版一张光盘,每张光盘覆盖的文献时间跨度大约5年,每季度更新一次。SA网络版是在20世纪90年代后出版的,称为INSPEC数据库,其网址为 http://www.iee.org.uk,具体用法与光盘版数据库基本一致。

    4.相关的数理信息检索
      除了SA之外,还有以下工具可以检索数理方面的资源:美国《数学评论》(Mathematical Review,简称MR); 美国《应用力学评论》,(Applied Mechanics Review,简称AMR),另外,网上也有较多的数学物理信息资源。

    5.6.4 其他理科信息检索工具

    1.美国《科学引文索引》和《最新目次》
    美国《科学引文索引》(Science Citation Index,简称SCI)其主要报道生命科学、医学、生物、物理、化学、农业、工程技术领域内的科技文献,由“引文索引”、“来源索引”和“轮排主题索引”三部分组成,是目前国际上最具权威性的用于基础研究和应用基础研究科研成果的评价体系。《最新目次》(Current Contents,简称CC)按学科分多个分册,内容是各种期刊的目次汇集,周刊。

    2.《中国科学引文索引》
    由中国科学院文献情报中心于1995年创刊发行。分为引文索引、来源索引、机构索引和轮排主题索引四个部分。

    3.法国《文摘通报》
    简称BS,于1939年创刊,由法国国家科学研究中心编辑出版。

    4.俄罗斯《文摘杂志》
    (简称РЖ)创刊于1953年,由全俄科学技术情报研究所编辑出版。

    5.日本《科学技术文献速报》
    1958年创刊,是文摘性检索刊物。该刊现分为12个分册,报道的领域涉及科学技术各个部门。

    5.7 工科信息检索

    5.7.1 概念

    由于工程技术涉及的学科范围比较广泛,具有信息量大、学科界线不明显的特点,有相当一部分技术信息以专利发明的形式获得了专利保护,因此,本节以综合性的技术检索工具——美国《工程索引》和英国的专利信息检索工具《德温特世界专利索引》为例介绍工科技术信息的检索原理及方法。

    5.7.2 《工程索引》

    1.概念
      美国《工程索引》(The Engineering Index,简称Ei)创刊于1884年,距今已有100余年的历史。Ei是工程技术领域综合性的检索工具,也是我国科技人员经常使用的一种检索工具。Ei收录世界上50多个国家、10多种文字的工程出版物,期刊约3 000多种,此外还包括会议文献、科技报告、学位论文等,其中期刊文献和会议文献收录得比较全面。Ei不收录专利文献。在Ei的发展过程中,有过多种出版形式,如书本式、卡片式、缩微版、磁带版、光盘版,现在已发展到了网络版。

    2.Ei印刷版
      Ei的印刷型出版物有:工程索引月刊(The Engineering Index Monthly),1962年创刊,工程索引年刊 (The Engineering Index Annual),1906年正式出版,此外Ei还不定期地出版工程信息主题词表。

    ①Ei文摘本
    • Ei虽然名为索引,实为文摘刊物,其文摘本有月刊本和年刊本两种,这两种版本的正文编排方式完全相同。月刊本中的索引有主题索引、著者索引,年刊本除这两种索引外,还有出版物一览表、会议一览表。

    • Ei文摘正文是按主题词字顺编排的,主题词选自Ei的主题词表。Ei主题索引是从主题内容角度检索Ei文献的唯一途径。主题索引按主题词字母顺序排列。

    • 由于Ei主题词表在1993年由标题词表变为叙词表,所以Ei的主题索引也相应由标题词索引变为叙词索引,索引中的主题词由原来的二级主题词变为一级主题词,并且新的主题词增强了表达概念的直观性和完整性,使主题检索更加方便、快捷。

    • Ei著者索引是一种快速、准确的查找文献线索的途径。

    • 出版物一览表有2个作用,一方面它揭示了EI所收录的一次文献的数量和覆盖范围,另一方面给读者提供了出版物刊名缩写与全称转换的途径。

    • 会议一览表反映了EI当年收录的全部会议文献的会议情况,它按照会议名称字顺排列。

    ②Ei检索语言
    Ei的检索语言一直由规范化的主题词表构成,该主题词表中词的性质和形式都有过较大的调整。Ei原主题词表名为“Ei标题表”(Subject Heading for Engineering,简称SHE),1990年改名为“Ei Vocabulary”,1993年1月起,工程信息公司用一部新编的叙词表取代了以前所用的词表,新表名为“Ei叙词表”(Ei Thesaurus)。
      “Ei标题表”(SHE)是供检索1992年(91卷)以前的Ei文献时使用的一种规范化、权威性的标题表,是Ei根据多年的标引工作经验积累而成的,并不断修订。SHE全表由四部分组成,主表、副标题索引表、分类范畴表和主题指南。
      “Ei叙词表”是一部新表,收录大量的叙词和入口词(非叙词)。新表更好地满足了手检和机检两方面的需要,反映了Ei在文献处理技术上的全面变化。

    3.Ei数字版
    ① Ei光盘版
      Ei有光盘版、联机版、网络版。光盘版称为Ei Compendex,与联机数据库版相对应。Ei光盘版分Dos环境下和Windows环境下运行的两种软件系统,此外,Ei还分有Ei综合版本和专业版本。Ei Compendex有两个检索界面,菜单式检索和输入布尔逻辑检索。

    ② Ei网络版
      Ei网络版主要指20世纪90年代以来Ei公司发行的以World Wide Web为基础的网络版工程索引数据库Ei Compendex Web,它的收录范围大于Ei印刷版和Ei Compendex。1998年,国内清华大学等10所高校联合购买了Ei Compendex Web的使用权,使得这10所院校的师生在其各自校园网上均可免费检索Ei Compendex Web。目前,联合购买该数据库使用权的单位每年都有增加。
    该数据库在清华大学的镜像服务地址为:
    http://ultra2.lib.tsinghua.edu.cn/eivillage/plsql/switch
      与光盘版相比,有些检索功能在网络版中较难实现,如位置算符辅助检索手段、某些限定性检索以及对检索结果的排序功能等。但Ei Compendex Web的数据每周更新,检索结果更新更快,因而受到国内用户的普遍欢迎。

    5.7.3 Derwent 专利检索工具体系

    1.概念
    各国专利机构或国际专利组织在实施专利制度过程中都会产生各种与专利相关的文献或文件,我们称之为专利文献。
    广义的专利文献,包括与专利有关的一切文献,如申请说明书、专利说明书、专利公报、专利分类表等;
    狭义的专利文献仅指申请说明书和专利说明书。
      
    专利文献是技术文献,又兼有法律约束力和经济特性,它的技术内容新颖、先进、实用,所涉及的技术领域广泛,技术先进、应用性强,同时它还具有出版迅速、管理严格等特点。一般来说,专利文献可以满足技术内容、技术法律状态以及技术覆盖地域等具有较强应用性的查询要求,同时它也可以成为分析竞争对手的有力工具。

    使用专利文献时,应注意以下几点:
    第一,专利文献中报道的技术有时不够成熟,缺乏稳定性和可再现性;
    第二,技术发明的介绍不够全面或有所保留,因此需要作进一步的分析研究;第三,一项技术可能分散在多个专利文献之中,因为专利法规定,一件专利只能保护一项发明(专利法的单一性原则);第四,专利文献具有很强的法律性,因此,要注意专利文献的法律状态信息,如专利的有效期,专利权的转让、继承、撤销,同时也要关注那些提前失效专利和延长保护期的专利等。

    2.专利分类原则及国际专利分类法
      就分类的目的而言,专利分类更强调使用专利信息的方便性和高效性,这就决定了专利分类原则将以专利信息的应用为主,以其组织管理为辅。因此,从现行的专利分类法来看,专利信息的分类依据主要是发明的技术特征,包括功能、结构和用途,这种对技术特征的强调有助于专利文献的检索和利用,比如对某项发明的新颖性和先进性判断等。
    各国专利主要有两条分类原则:行业分类和功能分类。
      
      所谓行业分类原则就是根据发明的用途或应用领域分类,这种分类原则有利于按行业部门查找和使用专利文献,易于各行业人员接受和使用,是一种简便易用的分类方法。但这种分类法有一个最大的不足,就是在分类时会将功能相近的发明分散在不同的类。
    功能分类原则是根据发明的“直接功能、效用或产品”分类,即以装置、物质或工艺的本质效用作为分类依据。这种分类原则将实质功能相同或相似的发明归入同一类,因而也就出现了跨行业分类的现象,所以在某种程度上不利于从行业角度对专利文献的检索利用。在实际应用中,有时将这两种分类原则结合起来使用,以便适应各国不同的检索习惯。
    不同国家专利法不同,专利分类原则也不尽相同,目前,除少数国家外,各国普遍采用国际专利分类法作为本国的专利分类法,因此,国际专利分类法具有了真正的国际分类法的意义。美国专利分类法和德温特专利分类法在美国专利文献和英国专利文献中与国际专利分类法同时使用。
      
      国际专利分类表是经过长时间的倡导、酝酿和试用后形成的一部专利分类法,它于1968年正式形成完整的《国际专利分类表》(International Classification of Patent for Invention,正式简称为Int.C1,简写为IPC),每5年修订一次,以方括号中的数字表示版次。IPC的分类原则以功能分类与行业分类相结合,功能分类优先为原则。如对涉及两个技术领域的发明,应优先归入功能分类位置。IPC采用等级结构、逐级分类,形成完整的分类体系:其类目依次为部、分部、大类、小类、主组和分组。
      
      为了方便查找IPC分类号,每一版的国际专利分类表都配有一本单独出版的《IPC关键词索引》(Official Catchword Index to the International Patent Classification)。如果检索者不熟悉所查的技术内容在分类表中的位置,就需要借助《IPC关键词索引》,来确定分类范围和准确的分类号,然后再使用IPC分类表。该索引按关键词字顺排列,每个关键词对应着一个IPC分类号。该索引对于快速查找和使用IPC分类表具有很大帮助。

    3.德温特专利检索体系
      英国德温特出版公司(Derwent Publication Ltd.)所收录的专利文献来自世界30多个国家和2个国际组织,是检索世界专利文献的重要检索工具,在国际专利文献检索方面享有盛誉。Derwent对这些系列做了调整和重新命名,统称为世界专利索引,简称WPI Derwent检索刊物。目前WPI由两大系列构成:文摘本和索引本(或称为题录本),每部分按德温特专利分类体系又细分为多个系列,形成一套完整的的专利文献检索体系。除印刷本外,WPI还有多种版本,比如光盘、联机数据库和网络版等。
      
      德温特专利文献检索工具,具有以下特点:收录范围广,报道量大,报道速度快,文献加工标引质量高,可区分基本专利和相同专利,辅助索引种类多,可以多途径检索,索引本采用IPC分类体系,各国通用;整套检索工具实现了多系列+多品种和多媒体化,体系完备,可以满足多种检索需求。当然它也有不足之处,主要表现在:只能检索近几十年的专利文献;部分专利文摘写得令人费解等。

    ①Derwent文摘本检索刊物
    Derwent现在发展成了两大文摘体系:分国文摘和分类文摘。分国文摘报道8个国家2个专利组织的专利(仍用WPA名称),分类文摘按德温特专利分类体系组织专利文摘,共分为三个部分:化学专利索引(CPI),综合与机械专利索引(GMPI),电气专利索引(EPI),此外,电气专利文摘(EPA)实为EPI的累积本。

    《化学专利索引》(Chemical Patents Index,简称CPI)
    CPI分12个分册出版,每分册分别用A-M(I除外)中的一个字母表示。其内容与索引本(WPI)中的A-M分册(原名为CH分册)相对应。CPI文摘部分的著录项目与EPI相同,但编排顺序有所不同,文摘首先按德温特分类体系编排,再按专利号国别代码字母顺序排列,然后按专利号的版次与法律状态代码排列,最后按专利号大小顺序排列

    《综合与机械专利索引》(General & Mechanical Patents Index,简称GMPI)
    其前身为《世界专利文摘》(World Patents Abstracts,简称WPA)的前4个分册,即:P1-P3、P4-P8、Q1-Q4、Q5-Q7。从1996年起,GMPI也细分成国际卷和日本卷,日本卷仅报道日本专利。GMPI文摘部分的编排与著录均与CPI相同。

    《电气专利索引》(Electrical Patents Index,简称EPI)
    共有6个分册,分别用英文字母S-X命名,这六个分册与索引本(WPI)中的S-X分册相对应,从1996年起,EPI分成国际卷和日本卷两卷,日本卷仅报道日本公开专利。EPI的文摘正文首先按德温特分类体系排列;然后按专利文献的专利国别代码字母顺序排列;最后在同一国别下再按专利号大小顺序排列。

    ②德温特文摘本中的索引
    德温特三类文摘本都在文摘之后附有三个索引:专利权人索引、入藏号索引和专利号索引。这三个索引也是比较常用的索引类型。
    专利权人索引
    Derwent专利权人索引以专利权人的名称代码为标目,按字母顺序排列组织索引款目。
    专利号索引
    专利号索引是把当期报道的全部专利文献按专利号排列,供查找入藏号和专利权人代码,以便在需要时再转查其他相应的索引。
    入藏号索引
    入藏号是德温特公司对所收到的每件基本专利给予的唯一指定号码。基本专利一般是指最先到达德温特公司的专利,以后到达的该发明的相同和同族专利不再给入藏号,因此一件发明的所有基本专利、同族专利和相同专利只有一个入藏号。

    ③Derwent索引本检索工具
    Derwent在20世纪70年代创刊了《世界专利索引》(WPI),共报道33个国家和地区、2个国际专利组织的专利文献,周刊,分四个分册出版,目前这四个分册是:A-M:化工,P:综合,Q:机械,S-X:电气,此外,还出版与上述各分册对应的累积索引本。在WPI出版物体系中,索引本和累积索引的各个分册每期都有四种索引:专利权人索引、入藏号索引、专利号索引和IPC分类索引。除上述索引刊物外,Derwent公司还出版独立的《优先案索引》。

    IPC分类索引
    IPC分类索引是德温特公司按照国际专利分类法(IPC)编制的索引,因此使用该索引应结合国际专利分类表。IPC分类索引按IPC分类号的前四级类号顺序排列,同类下再按专利国别代码顺序和专利号大小排列。

    Derwent优先案索引
    Derwent优先案索引(Priority Index),集中了Derwent索引本中的所有专利的优先案。优先案索引先按优先权申请国代码及年代顺序排列,再按优先申请号和申请日期顺序排列。该索引在每个优先案下列出全部同族专利。优先案索引给人们提供了从优先权查找同族专利的有效途径,它还能在有多项优先权情况下指明相关优先权,部分接续申请及其相同专利。另外,国外著者在引用专利文献时,有时只提到国别和申请号,优先权索引也为通过国别和申请号追踪检索专利文献提供了便利。

    ④Derwent专利权人代码手册
    在Derwent出版物中,专利权人名称通常用专利权人代码来表示,该代码由四个大写的英文字母组成。为了方便用户查找和使用专利权人代码并了解其编码的规则与方法,德温特公司出版了《公司代码手册》(Company Code Manual)。该手册按两种排序方法将内容分成两大部分,专利权人名称排序和专利权人代码排序。

    4.专利文献的其他检索工具
    凡是实施专利制度的国家都有自己的专利出版物,这些出版物都可以用来检索专利文献。美国具有丰富的专利文献,受到高度的重视。我国专利文献量并不很大,但随着我国专利的申请和需求迅速增长,也应给以一定的重视。

    ①美国专利文献检索
    查找美国专利文献可以在德温特检索工具查找,也可以利用美国专利局出版的专利文献进行检索,其检索工具主要包括三类:专利局公报,专利分类表,专利索引。

    美国专利局公报
    专门公布美国专利局批准的专利申请说明书的摘要。每期公报按专利类型划分,发明专利进一步按学科领域分为“一般与机械”、“化学”和“电气”三大部分,然后按专利号大小顺序排列。每期专利公报后附有专利权人索引和分类索引。

    美国专利分类表
    整部分类表由3种出版物构成:分类手册、分类定义和分类表索引。分类手册由大类类表和大类展开表(详表)组成,分类号采用顺序制数字类号,类目等级靠排印位置和错位圆点数表示。分类定义是一部手册,对各个类进行详细定义,限制各类的内容范围。分类表索引按所收技术词汇字母顺序排列,其后列出相关的美国专利分类类号。

    美国专利索引体系
    美国专利索引由美国专利公报索引和美国专利年度索引构成,是检索美国专利的主要检索工具。

    ②中国专利文献检索
    我国专利文献最早始于1985年,经过近二十年的发展,目前印刷本有两大检索系列:文摘本和索引本。

    文摘本
    由中国专利局出版,分为专利公报和中国专利分类文摘两种类型。专利公报又按专利类型不同划分为三个分册:发明专利公报、实用新型专利公报、外观设计专利公报,现均为周刊。专利分类文摘按发明专利和实用新型专利分为两个分册,分类法采用国际专利分类法(IPC),每年出版一次。

    索引本
    中国专利索引本是累积出版的题录型专利文献检索工具,该索引将当年公开公布的全部专利累积起来,按专利类型划分后编排索引,每卷提供3种索引:国际专利分类索引、申请人•专利权人索引、申请号•专利号索引。

    5.专利文献的计算机检索
    除印刷本外,专利文献也有光盘版、联机版、网络版,世界著名的联机检索系统中都有专利文献的联机检索,如DIALOG、STN、ESA等。

    ①专利文献的光盘版
    世界上很多国家和专利组织都有专利文献光盘数据库,以满足计算机检索的要求。

    中国专利光盘数据库
    中国专利局、专利文献出版社和中国专利信息中心等部门相继出版了一些专利文献光盘数据库,如中国专利数据库光盘(CNPAT)、中国专利说明书光盘、中国专利公报光盘和中国失效专利数据库光盘等,这些光盘容纳了我国实施专利制度以来的全部专利文献。

    外国专利光盘数据库
    外国专利光盘数据库非常丰富,如欧洲专利组织、专利合作条约组织、非洲知识产权,以及美国、日本、德国、法国、英国、奥地利、瑞士等国家都有自己的专利光盘数据库。与我国一样,各国专利光盘也有多种数据库,使用专利光盘检索时应注意根据需要选择不同的数据库。

    ②专利文献的网络版
    各国专利局的网址都是网上专利信息的重要来源,此外一些专门的专利出版机构所在网址也是其重要的来源。如:中国发明专利技术信息网(网址:http://www.Lst.Com.cn);中华人民共和国专利局的中国专利信息网(http://www.Cpo.cn.net);中国专利信息网(http://www.atent.com. cn)等。各国专利局网址可以通过各国政府网站查询。

    5.7.4 其他工科信息检索工具

    工科信息检索除涉及书刊和专利文献外,还涉及技术标准、科技报告、会议论文、学位论文等特种文献,常用检索工具如下:

    1.标准文献
      检索工具有ISO Catalog、IEC Catalog、《美国材料与试验协会标准年鉴索引》、日本的《JSO总目录》、英国的《BSI目录》等。

    2.科技报告
      检索美国四大报告(即AD报告、PB报告、DOE报告、NASA报告)的工具是:检索AD报告、PB报告用《政府报告通报与索引》(GRA&I),检索DOE报告用《能源研究文摘》(ERA),检索NASA报告用《宇航科技文摘》(STAR)。检索中国科技报告的工具有:《科学技术研究成果公报》、《中国国防科技报告通报及索引》、《中国机械工业科技成果通报》等。

    3.会议文献
    检索国际会议可用美国的《世界会议》(WM)、《会议论文索引》(CPI)、《科技会议录索引》(ISTP)等。检索国内学术会议文献的检索工具主要是《国内学术会议文献通报》。

    4.学位论文
    检索欧美学位论文可用《国际学位论文文摘》(DAI)、《美国博士论文索引》等。检索中国学位论文的检索工具是:《中国学位论文通报》,《中国科学院博士学位论文文摘》等。

    5.8 医药信息检索

    5.8.1 主要医药检索工具及其发展

    1.医药信息检索概况
      作为科技信息检索中的特殊分支,医药信息检索也同样走过了从最初的手工检索为主发展至今日的计算机检索为主的历程。如题录型《中文科技资料目录》(医药卫生)是手检检索工具;《中国生物医学文献数据库》(CBMdisc)则是医学检索光盘;《万方医药子系统》以及中国期刊网专题全文数据库(Web版)的医药卫生专辑是Web环境下的核心全文医学检索工具。
      国外医药检索工具著名的有美国《医学索引》(Index Medicus, 简称IM)和荷兰《医学文摘》(Excerpta Medica,简称EM)。IM和EM与CA(Chemical Abstract)、BA(Biological Abstract)一道被誉为四大著名生物医学检索工具。

    2.主要医药信息检索工具简介
    ①国内医药信息主要检索工具:见教材表4.1
    ②国外医药信息主要检索工具:见教材表4.2

    5.8.2 美国《医药索引》与PubMed数据库

    1.美国《医学索引》(Index Medicus,简称IM)

    ①美国《医学索引》概况
    美国《医学索引》(Index Medicus,简称IM)是最常用的综合性医学文献检索工具之一。IM收录世界各国主要的生物医学及其相关学科的期刊,到2003年为止,已收录世界上72个国家和地区的46种文字出版的生物医学期刊及与医学有关的科技期刊4 521种,其中收录中国期刊64种。IM的特点是历史悠久,报道速度快,检索效率较高,检索方便,内容全面,侧重于临床医学。

    ②检索体系
    IM设置了两种索引:主题索引(Subject Section)和著者索引(Author Section)。
    主题索引:供用户从拟查课题的主题概念入口检索文献。
    著者索引:供用户从著者姓名入口检索文献。

    ③《医学主题词表》(Medical Subject Headings,MeSH)
    是NLM对生物医学文献进行主题分析、标引的权威性检索工具,也是指导用户使用主题索引进行文献检索的工具。

    3.PubMed
    ①PubMed数据库概
    PubMed是美国国家生物信息中心(National Center for Biotechnology Information, NCBI)1997年5月推出的基于Web的检索软件。NCBI提供许多特色性的生物医学类数据库信息服务,PubMed 只是其提供的数据库服务之一,并实现了与系统内其他数据库之间的交叉链接。
    通过网址:http://www.ncbi.nlm.nih.gov/entrez/query.fcgi或进入http://www.ncbi.nlm.nih.gov主页后选择PubMed即可。

    ②数据库覆盖的范围及提供的主要服务
    MEDLINE 数据库的核心与印刷版的题录型检索工具Index Medicus(IM)对应,但其在收编内容和文献记录方式上都进行了扩充与发展,MEDLINE共包含三种重要索引Index Medicus(医学索引),Index to Dental Literature(牙科文献索引) 和International Nursing Index(国际护理学索引)。PubMed可检索的数据库实际上是MEDLINE数据库扩充版,内容包括MEDLINE记录、PreMEDLINE记录(未完成MeSH标引的最新记录)以及出版商直接提供的其他记录(Record Supplied by publisher)。

    ③PubMed 检索技术及检索功能
    PubMed系统主要提供了两种检索界面:基本检索和主题词检索。此外,还设置了一些特色检索服务。

    基本检索(Search)
    PubMed 的主页面就是基本检索界面。该界面设置了一个查询输入框,用户只需要在提问框中输入任意的检索提问,系统就会以其识别的语法规则进行运算并返回检索结果。值得一提的是,有别于其他检索系统,PubMed的“Search”检索功能非常广泛,既可以输入简单的任意词或词组查询,也可以实现类同于其他检索系统的高级检索和专家检索功能。
    基本检索的主要检索功能有:逻辑组配检索;自动转化提问词;截词检索;作者姓名自动截词检索;检索有摘要或全文的记录;字段检索等。

    主题词浏览(MeSH Browser)
    为了在检索过程中控制检索的精确度,系统设置了主题词浏览检索(MeSH Browser),即查询并选择主题词进行检索。

    辅助检索功能键
    “Limits”功能键,限制条件进行检索;“Previews/Index”功能键,预检索和Index检索;“History”功能键,查看检索史并利用已有的检索提问式进行检索;“Details”功能键,单击该键后,系统会将用户的提问词及PubMed转换后的检索词与完整检索表达式详细地显示在“PubMed Query”提问栏中,用户可在该提问栏内直接对检索表达式进行修改,然后单击“Search”再次发出检索请求。

    检索策略的修正
    PubMed在许多检索页面都提供了处于查询状态的检索提问框,用户可以根据上一次的检索结果随时进行修正。在调控和修改过程中,可以调用检索系统中的所有功能键与辅助功能键,灵活运用检索技术与检索技巧,达到与具体需求的统一。

    其他检索服务
    包括:期刊数据库查询,查找指定期刊上的论文;临床咨询,查找临床相关文献;引文匹配检索,查找特定记录等。

    ④检索结果显示及相关资源链接
    包括检索结果显示,获取记录相关资源,检索结果输出等。

    5.8.3 荷兰《医药文摘》

    1.荷兰《医学文摘》印刷本

    ①荷兰《医学文摘》(Excerpta Medica,简称EM) 概况
    荷兰《医学文摘》(Excerpta Medica,简称EM),创刊于1947年,收录全世界110个国家和地区的生物医学、药学及其相关学科期刊4 000多种,年报道文献量40万篇。特点:文摘质量高;按专题分册出版;收录范围广泛,偏重于欧洲、日本文献;卫生学、药学文献量大,但无护理、口腔、兽医及心理学分册。现有44个分册(其中43个文摘分册,1个题录分册)。按照统一的版式编排并具有相同的索引系统。《医学文摘》各分册目录一览见教材。

    ②编排结构及检索体系
    EM各分册均按各自学科体系单独编排,结构较为统一,依次包括以下几部分:分类目次、文摘正文、主题索引、著者索引。EM各分册均提供分类、主题和著者三种检索途径。

    2.荷兰《医学文摘》联机数据库

    ①概况
    荷兰《医学文摘》联机数据库(EMBASE)由Elsevier出版,其对应出版物是印刷版荷兰《医学文摘》的43个分册和1册题录索引。数据库中有近30%的记录未编入印刷本。目前,EMBASE拥有光盘版和网络版,国内引进的光盘数据库主要有美国银盘公司的EMBASE:Drugs&Pharmacology。网络版EMBASE则可以通过EMBASE公司的主页(http://www.embase.com/)进行检索。

    ②EMTREE Theraurus
    1991年EBMASE正式使用的树状词表(EMTREE),是用于文献主题标引和检索的等级词表。该词表在42 000个主要等级叙词的基础上,增设了180 000个同义词。并将所有词按概念关系逐层按等级排列。检索时可以通过页面的功能键进行精确控制。点击主页上方的“EMTREE keywords”,即可以按等级浏览选词检索。

    ③检索功能
    EMBASE的检索技术和逻辑运算与PubMed有些类似,但又有其特点。可提供:快速检索、高级检索、药物检索、疾病检索、文章检索等检索方法。

    ④其他辅助检索
    内容有树状结构关键词检索、期刊浏览、著者检索。

    5.9 农业信息检索

    5.9.1 农业信息检索体系发展概况

    农业信息检索工具和检索系统是检索体系中的重要分支。由于农业与生物学以及林业、畜牧业和渔业的天然联系,农业信息必然与这些相关领域的信息相互融合,因而它们的检索工具也相互融合,有时甚至成为一体。这种现象在世界三大农业信息数据库CABI、AGRIS、AGRICOLA和我国的农业信息检索系统中均有所体现。
    与其他检索工具一样,农业检索工具也有多种版本形式,如印刷版、光盘版和网络版。印刷版中的国外与国内的主要检索工具见教材表4.4和表4.5。

    5.9.2 世界三大农业文献数据库检索

    世界三大农业文献数据库CABI、AGRIS、AGRICOLA是当今世界收录农业文献量最大、专业覆盖面最广、利用率最高的农业文献数据库。CABI是国际农业和生物科学中心(Centre for Agriculture and Bioscience International) 出版的文摘型数据库;AGRIS是联合国粮农组织(FAO)所属的国际农业科技信息系统建立的农业书目数据库;AGRICOLA(Agricultural Online Access)数据库为美国农业图书馆编制的农业文献联机存取书目数据库。
      下面以网络版WebSPIRS为例介绍农业信息数据库的检索方法与技巧。WebSPIRS是检索农业数字化信息资源的主要系统,它包括多种不同内容的数据库,因此,在进入检索界面前,首先要勾选本次检索所需的数据库,进入检索界面。WebSPIRS检索界面比较清晰,它提供的检索功能主要有基本检索和辅助检索,可以选择检索结果显示与输出形式,同时还有一些附加功能。下面分别介绍。

    1.基本检索:
      有全文检索(即全记录检索);限制检索;语种限制;Search Builder(简易的检索方式)等。

    2.辅助检索
    ①Index(索引表)
    Index是数据库中所有可被检索的词或词组构成的一个索引表。该索引表可帮助用户解决两方面的问题:一是帮助用户选择能够反映课题内容的关键词;二是帮助用户解决对某个单词或词组拼法不熟悉的问题。

    ②Thesaurus(叙词表)
    Thesaurus是一个生物叙词表,该表中的所有词和词组都是经过规范化处理的。Thesaurus有三个作用:帮助用户选择规范化的主题词,Thesaurus中的“see”(见)和“used for”(代),可起到核对(选准)主题词的作用,提高文献查准率;选用叙词表中的上位词或相关词,可实现扩检,提高文献的查全率;选用叙词表中的下位词,可实现缩检,提高查准率。

    3.结果显示与输出
    检索完成后,系统即自动显示检索结果和总记录数,并在检索历史区(Search History)生成一个检索项。点击每个检索项后的“Display”显示先前执行过的检索结果。

    4.系统附加功能
    ①Search History(检索历史)
    每完成一次检索,在检索历史区就会生成一个检索项号(#),并显示检索策略及检中记录数。每个检索项前有复选框可供勾选。

    ②Save History(存储检索历史)、Load Search History(载入检索历史)
    通过“Save History”功能键,可将用户经常使用的检索策略储存起来,只需键入自己的E-mail地址,选择保存的有效期即可。而“Load Search History”则将保存的检索策略调出重新进行检索。

    ③链接馆藏和整合电子期刊馆藏
    在检索结果界面中,某些记录后有“Link”按钮,可链接至本馆所订购的电子期刊全文。

    5.检索技术要点
    ①布尔逻辑算符:为“and”、“or”、“not”。
    ②截词算符:“?”为有限截词符,可用1到n个“?”表示0到n个字符;“*”为无限截词符,表示0到无数个字符。
    ③字段限定符:WebSPIRS提供字段限定符功能以提高查准率,限定符为“in”。
    ④位置算符:WebSPIRS提供的位置算符有三个,“with”、“near”和“ADJ”,其作用是缩小检索范围,提高文献的查准率。

    5.10 重要数据图谱

    在科技信息检索中,许多科技数据经过长期的积累形成了许多专业数据资源,并以数据、图形、表格等形式记录于工具书中,包括数表、谱图、星图、地图、图谱、图录、年表、历表等,形成了独具特色的一类信息资源。下面是几种特别重要的大型数据图表。
    1.LBT
    LBT是Landolt-Bornstein’s Zahlenwerte und Functionen aus Physik, Chemie, Astronomie, Geophysik und Technik(兰多特-波斯坦科技数据表)的简称。LBT是世界上公认的最好的科技数据大全,LBT的检索方法一般是按照其固有的体系结构查阅。

    2.Sadtler波谱
    Sadtler波谱全称为Sadtler Standard Spectra Collections(沙特莱标准波谱汇集),自1947年以来以活页本和汇编本形式连续编号出版,是世界上最庞大的一套查检光谱资料的标准工具。

    (1)Sadtler标准波谱印刷本
    Sadtler标准波谱印刷本由两部分组成,正文和索引。正文收录有关化合物的各种波谱数据及一些相关数据。使用Sadtler波谱的方法是通过索引查检,最重要的索引是1980年出版的标准光谱总索引和1981-1995年标准光谱累积索引。

    (2)Sadtler标准波谱网络版
    现在已经可以通过网络检索最新的Sadtler波谱资料,URL为http://www.sadtler.com。

    5.11 常用科技参考工具书

    除上述检索工具及数据库外,科技信息检索中也使用辞典、百科全书、年鉴、手册等参考工具书,
    (1)辞典:如《物理科学词典——术语、公式、数据》、《麦格劳- 希尔科学技术术语词典》、《单位换算词典》、《道兰氏英汉插图医学辞海》等(详见教材)。
    (2)百科全书:如《麦格劳-希尔科学技术百科全书》、《美国学术百科全书》、《电子电路百科全书》、《国际机器人学——应用和自动化百科全书》等(详见教材)。
    (3)年鉴:如《麦格劳-希尔科学技术年鉴》、《科学年鉴》、《国际电子学数据年鉴》等(详见教材)。
    (4)手册 :如《CRC化学物理手册》、《国际半导体数据手册》、《集成电路应用手册》等(详见教材)。
    (5)科技工具书指南:如《麦格劳-希尔基本科技书目》、《数学/科学使用者指南》、《国外科技工具书指南》等(详见教材)。

    展开全文
  • 于是我们提出了“Human Mobility Signature Identification”,即通过轨迹信息的挖掘,进而分析驾驶人的驾驶行为,最终判断驾驶人是否是同一人。 图3 驾驶人员身份识别应用场景 驾驶人员身份识别问题有很多相关工作...
  • 来代表集合,以提高准确性 可以使用 更多的 hash 函数 来代表集合,以提高准确性 minHash 可以量化评判相似度 文章库中的哈希值都可以提前计算   minHash 可以检测集合相似度,它与文章相似度有啥关系? 答 :如果...
  • 我想实现如下的场景,判断当前Android手机上是否正在播放音乐,如果是,通过某个特定的手势, 或者点击某个按键,将当前我正在听的音乐共享出去。 第一步,就是判断当前是否有音乐正在播放。 最开始我想得有点复杂,...
  • 信息系统可行分析

    千次阅读 2020-03-24 16:26:39
    参考国家标准《计算机软件文档编制规范》(GB/T 8567-2006),在信息系统建设项目中,可行研究通常从经济可行、技术可行、法律可行和用户使用可行四个方面来进行分析,其中经济可行通常被认为是项目的...
  • 信息论:熵与互信息

    万次阅读 多人点赞 2016-11-25 21:18:43
    这篇文章主要讲:熵, 联合熵(joint entropy),条件熵(conditional entropy),相对熵(relative entropy,KL 距离),互信息(mutual information),交叉熵(cross entropy),困惑度(perplexity)。 ...
  • 判断事务结束方法

    千次阅读 2016-02-29 18:51:39
    事务状态如果按照Loadrunner默认的LR_AUTO状态,则返回的状态就不受测试人员控制,并且主要是对服务器返回数据的准确性脱离了人为判断,几乎脱离了性能测试的真实性。 对结束事务的判断最常用的方法就是获取服务器...
  • 原文:敏感和特异 以糖尿病人的筛查为例。第一个钟形代表正常人,第二个钟形代表糖尿病人。理想中,如果正常人和糖尿病人的血糖范围完全没有重合就好了。这样我就把标准定在中间那个最低点。低于此点的,就是...
  • 信息论基础

    千次阅读 多人点赞 2018-10-11 21:56:31
    信息论基础知识 信息 熵,条件熵,KL散度,三... 一般来说,可判断是否获得信息,但无法准确度量信息。 应用数学工具,通过数学运算来度量信息信息的度量 信息的度量和不确定消除的程度有关 不确定的程...
  • 我想在大地上画满窗子,让所有习惯黑暗的眼睛习惯...本节的内容如下:SQL Server统计信息列级统计信息统计信息与执行计划统计信息与内存分配开销预估模型SQL Server统计信息 说到统计信息,就一定要提到查询优化器,
  • 不确定下的判断:启发法和偏见

    千次阅读 2014-09-30 11:52:40
    代表: 1.对结果的先验概率不敏感 2.对样本
  • 信息系统分析与设计课程心得

    万次阅读 2017-02-28 13:41:39
    信息系统分析与设计课程心得此博客为信息...知识、信息、数据是具有层次关系的概念,数据是对客观事实的记录、而信息则是对数据的解读,知识就是那些可用于指导行动的信息。所以不同人对于数据,可能会获取到不同的信
  • 如何判断一家软件公司是否靠谱

    千次阅读 多人点赞 2017-08-01 07:00:00
    所以,正确的做法是先搜集相关信息,从基本信息、行业、产品、公司前景等方面判断它是否适合自己,然后再在面试时根据对环境、面试官的观察自己判断下这个团队是不是和自己匹配,最后再辅助参考别人的评价信息,看看...
  • 简单来说,个性化推荐系统是一种解决信息过载问题的技术,它是根据用户的兴趣爱好,推荐符合用户个性化的对象,可以帮助用户找到想要的商品/新闻/音乐等、能降低信息过载问题、提高站点的点击率/转化率、加深对用户...
  • 网站中的表单是和用户交互或收集用户信息的窗口,为了准确高效的工作,就要对用户键入的内容进行有效判断,和及时做出人性化的提示! 下面是表单内容判断中经常用到的语句,有判断输入的内容是否为空的(可以判断...
  • 信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了...信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision R
  • PHP函数判断移动端和PC端

    千次阅读 2018-04-25 10:06:51
    自定义PHP函数判断访问者的使用终端是移动端还是PC端。
  • win10系统5小时休眠—windows日志查看 判断非法关机1 分析2 操作3 日志介绍参考 1 分析 自己设置从不休眠模式,还是进入了休眠模式,原因是电源不稳定或者是散热的问题或者是设置不全 2 操作 win快捷键后,输入...
  • 信息检索复习笔记

    万次阅读 多人点赞 2020-12-17 17:14:46
    信息检索复习 第一讲 搜索 IR(信息检索是什么样的学科): 实质上是融合了文本及多媒体检索、数据挖掘、机器学习和自然语言处理的综合学科 为什么要进行信息检索?信息过载 搜索 搜索的过程 从大规模非结构化数据...
  • P/R和ROC是两个不同的评价指标和计算方式,一般情况下,检索用准确率、召回率、F1、AP和mAP,分类、识别等用ROC和AUC(特异和敏感是ROC当中的一个部分)。 准确率、召回率、F1、AP和mAP这几个指标需要依次看,...
  • Python3 识别判断图片主要颜色,提取指定颜色的方法   HSV颜色识别-HSV基本颜色分量范围     一般对颜色空间的图像进行有效处理都是在HSV空间进行的,然后对于基本色中对应的HSV分量需要给定一个严格的范围...
  • 图片相似度量与信息

    千次阅读 2008-04-03 11:59:00
    1、在同一问题域,信息熵越小,包含的信息量越大。 由熵公式(略)可知,当公式中所有事件的发生概率P[i]都相等时,计算出的信息熵最大。下面以赛马为例说明。如果张三告诉你,全部7匹马得第一的概率都是相等的;而...
  • ctf.show 网络迷踪模块第3关,题目中给了一张图片,图片最显眼的地方有一张海报,需要根据信息提交经纬度,图片中的位置应该是外国,这里推荐使用谷歌地图来查经纬度 ...百度百科确认了信息准确性 既然是丹麦...
  • 不用看下面的了。。。 最近要做一个api,返回内容要区分pc还是wap,于是想到了用 http 请求...难点在于移动端设备繁多,浏览器几乎一种设备一个版本,要全部兼容判断,有难度。于是,在网上搜罗了很多资料,尽量...
  • 回归模型的一些判断方法

    万次阅读 2017-04-05 23:04:42
    R平方:表示Y变量中的方差有百分之多少是可以预测的,R平方越高,Y中的方差就预测得越准确,模型的拟合程度也就越高。 举个例子,R平方=10%,表示Y中有10%的方差是可以通过X预测出来的。   F检验(F - test):...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 193,470
精华内容 77,388
关键字:

如何判断信息的准确性