精华内容
下载资源
问答
  • 笔者从检索式数字水位数据采集系统节能降耗出发,分析了影响系统功耗的各种因素,提出了将电源管理、低工作电压、芯片器件的选择、电路板紧凑布线、微处理器时钟及工作方式的管理等措施应用于检索式数字水位数据采集...
  • 为了适应当前临床途径的应用需求,改善临床途径的管理,组织搜索方式,本文提出建立临床途径数据库来管理存储临床途径。 根据临床途径的结构特点,提出了一种新的基于Lucene的方法框架。 基于Lucene的方法...
  • 大学文献检索资料 DOC

    2009-11-28 10:35:24
    4.能够提供多种检索途径。 三、信息检索工具的职能: 1.报道职能。 2.存储职能。3.检索职能。 四、检索工具的类型: 1.按检索方法划分:手工、机械 2.按收录的文献范围划分:综合性、 专业性、 单一性 3.按出版形式...
  • sql2005全文检索.doc

    2009-09-09 10:31:46
    它们无非是不断充斥设备网络的比特而已,但是如何把数据挖掘出来提供给需要的人员,检索技术是其中非常有效的途径之一。  现基于微软平台,针对SQL Server 2005提供的全文检索技术进行介绍。与关系数据查询、多维...
  • netlibrary数据库的检索应用

    千次阅读 2012-11-19 23:46:46
    17.3 netlibrary数据库的检索...它以自行开发的技术平台为基础,与出版商合作,通过购买版权的方式,合法生产电子图书,既保护了出版商的权利收益,为图书馆的网络电子图书服务开辟了一条崭新的途径。由于它具有独

    17.3 netlibrary数据库的检索应用

    17.3.1概述

    NetLibrary创建于1998年,是全球最大的在线计算机图书馆中心OCLC(Online Computer Library Catalog)的下属一个部门,它以自行开发的技术平台为基础,与出版商合作,通过购买版权的方式,合法生产电子图书,既保护了出版商的权利和收益,为图书馆的网络电子图书服务开辟了一条崭新的途径。由于它具有独特的技术优势,因而在短短的几年时间内得到了迅速的发展,成为当前世界上eBook的主要提供商。它提供来自400多个出版商的60,000多种高质量电子图书,这些电子图书的90%是1990年后出版的,每月均增加约2 000种。我国于2004年由Calis和上海图书馆组织的57个高校图书馆及5个公共图书馆参与的集团订购。访问方式:通过专线访问,无需支付国际流量费。采用校园网IP控制访问权限,不需账号与口令。NetLibrary电子图书覆盖了以下主要学科:科学、技术、医学、生命科学、计算机科学、经济、工商、文学、历史、艺术、社会与行为科学、哲学、教育学等,其中80%的电子图书面向大学读者层。在Netlibray中,商业与经济类的图书是收藏量最多的学科,占总收藏量的25%,其他科类图书数量占比例超过10%的学科是:文学(14%)美国历史(11%)、医学与健康10%。

    美国NetLibrary图书系统藏书量大,所涉及的学科种类齐全,有不少图书的学术价值较高,而且价格合理,检索和使用、下载方便,深受广大读者及图书馆的欢迎。

    17.3.2检索方法

    访问方式: 通过专线访问, 无需支付国际流量费。采用校园网IP 控制访问权限, 不需账号与口令。

    NetLibrary 没有浏览检索界面, 只能从检索窗口输入检索词进行检索, 它提供/ Basic Search0 ( 一般检索) 和/ Advanced Search0 ( 高级检索) 两种检索方式。一般检索方法是在检索界面的左侧检索框内, 输入一个或多个关键词, 使用逻辑算符或位置算符组配, 点击/ Search0 ( 检索) 按钮。一般检索的范围为关键词、书名、作者或全文。高级检索界面输入的词语可在关键词、书名、作者、全文、主题、I SBN 几个字段进行检索。可以在高级检索界面按出版日期进行检索, 还可以用多种不同的语种进行检索。NetLibrary 电子图书采用通用的HTML 格式, 所以无需下载特殊阅读软件就可以在线阅读全文。所有电子图书都内嵌了American Heritage( r) Dictionaryof the English Language( 4th Edition) , 方便读者查询词义和读音。全文内容不能下载, 但允许复制和打印( 一次一页) , 持续打印数量过大会收到系统发出的警告。而且每一本书同时只能供一个用户在线阅读, 多用户阅读同一本书时, 系统会出现以下提示:/ 非常抱歉, 此电子内容中的每一本都已被借用, 请稍等一下再试或者选用下列的方法。(We. re sorry,your library. s copies of this Content are current ly inuse. Either t ry again later or use one the opt ions below. ) 

    由检索界面功能介绍表可以看到, Netlibrary 的检索功能较强, 它不需要安装任何浏览器就可以直接进行检索、打印等操作, 非常方便。它将出版商、图书馆、图书经销商的功能融为一体, 既在网上售书, 又为读者提供有偿及无偿的借阅服务, 并与图书馆建立广泛联系, 以会员制的形式向入会图书馆提供网络图书的生机盎然服务, 向其读者提供网络图书借阅服务。不足之处是它不提供浏览途径, 而这一途径往往是读者在不了解一个电子图书系统时最方便的查找途径, 就像在书店浏览书架上的书一样。

    1.数据库登陆方法 

    在图书馆主页,鼠标点击“数据库导航”,在“关键词”中输入“netlibrary”即可进入检索界面,如图17-1所示是登录netlibrary出现的界面。

    图17-1 登录netlibrary的界面

    点击Netlibrary,即可出现如图17-2的界面。

    图17-2  netlibrary的首页

    点击“EBSCO学术资源统一检索平台”,进入的搜索界面如图所示。在搜索界面中,“检索浏览”、“基本检索”、“高级检索”、“视觉搜索”等。还可以对语言进行选择,结果如图17-3所示。 在右上角可以对显示的言语进行选择。

    图17-3 netlibrary的检索界

    2.基本检索(Basic Search)

    在如图17-4所示的页面中间检索框内,输入一个或多个关键词,使用逻辑算符组配,点击“检索”按钮。关键词检索的范围为关键词(Keyword)、书名(Title)、作者(Author)、全文(Full Text)。

    例如:输入“computer”和“technology”点击搜索即可。基本检索比较简单,但是搜索的结果范围比较广,要是需要缩小检索的范围,则可以使用高级检索。

    图17-4 基本检索的界面

    3.高级检索(Advanced Search)

    在netLibrary的搜索界面,点击 “高级检索”即进入高级检索界面。检索途径有Title(书名)、Author(作者)、Subiect(题目)、Categary(种类)、ISBN(国际书号)等,可以在一个或多个检索字段中输入检索词,字段之间的逻辑关系可使用布尔运算符(与、或、非)以及限制(年份、出版商、语种、排序)等方法来建立较为复杂的检索,如图17-5所示。

    图17-5  高级检索界面

    在高级检索的时候,可以对检索结果进行限制。如图17-6所示,限制的条件可以是“Full Text”、“Published Date from”、“Publish”、“ISBN”等。只要设定相应的限制条件即可。

    图17-6 高级检索的限制条件

    4.视觉检索

    在查找字段中输入搜索词语,然后单击搜索。这时会显示一个视觉导航图,其中包含:

    A.柱形,表示结果的类别。类别中可以包括表示子类别的圆柱。单击某柱形(类别)可查看其内容。 

    B.矩形,表示文章的链接。单击某矩形可将该文章加载到窗格中。要在导航图中向后(或向上)移动,可单击柱形或矩形的外部。单击顶部,可查看整个导航图。检索的结果如图17-7所示。

    图17-7 视觉检索的界面

    检索字段与限制

    (1)关键词字段:是在书名、作者、美国国会图书馆主题标目、出版商和ISBN字段中查寻要找的词语。可以输入一条检索词(例如:programming)或者多条检索词,然后在相同的或者不同的字段中进行查寻(例如:pride prejudice 或者midsummer Shakespeare)。

    (2)书名字段:在所有的书名中查寻所输入的检索词。可以输入确切的书名(例如:A Tale of Two Cities),也可以不考虑顺序而输入书名中的任何部分(例如:Huckleberry adventures )。不必输入书名开头的冠词(例如:the、a和an等)。

    (3)作者字段:在所有的作者中查寻所输入的名字。可以按任何顺序输入名字,有没有标点符号和是不是大小写都没有关系(例如:Twain, Mark,或者mark twain,也可以是Twain Mark)。

    (4)全文字段:是从各电子书中逐字查寻所键入的检索词,目的是查看所要的词语是否出现在电子书的文本中,但是全文字段并不查寻书名或者其他的字段。使用时,检索词越明确越好。可以使用引号来查寻全文中的词组。例如:将remote authentication放在引号中构成“remote authentication”的词组,然后进行全文查寻,这样找到的所有电子书都会带有与remote authentication完全一样的词组。

    (5)主题字段:是在美国国会图书馆主题标目中查寻所输入的检索词。可以输入一个检索词(例如:computer),也可以输入多个检索词(例如:civil war history)。

    (6)ISBN字段:是在印刷版和电子版的书中查寻所输入的ISBN。

    (7)出版年份字段:是查寻所输入的出版日期或者日期范围。输入的日期必须是整年。例如:1998是指1998年出版的,1955-1995指1955年到1995年之间出版的,-1960指1960年或者1960年之前出版的,而1960_指1960年或者1960年之后出版的。

    (8)出版商字段:是查寻所输入的出版商名字。

    (9)语种字段:是查寻所选择的语种。

    (10)格式字段:是查寻所选择的格式,即选择“ebooks”或“ejournals”。

    在检索中使用布尔运算符

    下面的布尔运算符是用来建立较为详细的检索。如果键入了好几个检索词而又没有规定在检索中用哪一个布尔运算符,一般说来,用的是“与(and)”。

    “与(AND)”所取得的结果会同时包括两个检索词(例如:history  and  European)。

    “或(OR)”所取得的结果是在检索词中只选一个(例如:heart  or  cardiac)。

    “非(NOT)”所取得的结果会包括第一个而不是第二个检索词(例如:nursing  not  home)。

    双引号""可以用来表示词组(例如:"civil rights")。

    单星号*可以用来表示通配(例如:cook*检索的是:cook,cooks,cooking,cookery,cookbook等等)。

    双星号**可以用来检索某个字的所有形式(例如:drive**检索的是:drive,drove,driving,driven等等)。

    检索结果

    检索结果是一份经过排序后的列表,既有符合检索的结果,又有其它功能和选项:

    (1)结果:显示检索的结果数量,以及修改检索(Revise Search)和进行新的检索(New Search)的选项。

    (2)排序(Sort):告诉我们列表中的结果是如何排序的。如目前的排序是按“Title”排序。如果要重新排序,可以点击其他的选项链接,如按最新排序(Newest First)、按最旧排序(Oldest First)或按著者排序(Author)。

    (3)页面导航选项:位于页面的底部。可使用下页和页号的链接,也可以选择“进入某页”的方法在检索结果的页面中浏览。

    (4)“书名一览表”:包括书名、作者以及每一篇著作的出版信息。

    (5)阅读这本电子书(View this eBook):会直接进到“联机阅读”中去阅览电子书的全文。

    (6)显示详细书目(Show Details):会直接进到详细书目的页面中,从中可以看到这篇著作中其他的信息以及选项。

    (7)放入我的书单(Add to My List):会将著作放入书单中供以后参考。必须要有帐号才能使用这项功能。

    17.3.3 检索实例

    下面以检索“computer science”为例。

    1.采用基本检索的方式,在关键字中输入“computer science”,点击“搜索”,出来的界面如图17-8所示:

    图17-8 基本检索的检索实例界面

    结果中出现多条检索的结果,可以通过左边的选择栏对结果进行筛选,例如按照“出版日期”,或者“搜索的类型”例如:期刊,新闻,书籍等。

    在检索的结果中,点击“Computer Science and the Three Rs”,就能看见详细的信息,如图17-9所示:

    图17-9 论文详细信息界面

    在左边的导航栏中,可以对文章进行详细的操作,例如:添加到文件夹,打印,电子邮件等。方便操作。

    2.采用高级检索的方式

    在关键字中输入“computer science”,and “the three”,点击搜索,出现的搜索界面如图17-10所示:

    图17-10 高级检索界面

    高级检索能够根据“AND”或者“OR”等运算符以及根据所要查询的目标文章的详细的信息,输入要查找的内容,就能够更加准确的查找去所要需要的信息。



    展开全文
  • PCT申请途径介绍

    千次阅读 2019-04-17 11:11:35
    文章目录第一节 PCT申请途径申请资格受理局选择中国人的选择:选择技巧申请语言递交方式第二节 审查程序流程申请及受理国际检索国际检索目的:国际检索审查内容:检索期限:应对审查员策略:缺乏单一性:一个发明...

    第一节 PCT申请途径

    PCT程序简单,是申请人向多个国家申请专利的首选途径

    申请资格

    资格:缔约国的国民或者居民
    特点:一种语言,一套申请材料,一组费用,一个受理局得到所有PCT缔约国的法律保护。

    受理局选择

    中国人的选择:

    1 国家知识产权局
    2 国际知识产权局
    3 其他受理局
    中国人和其他外国人合伙发明或者中国人在外国有工商营业场所。

    选择技巧

    受理局决定国际检索单位;
    中国只能由中国国家知识产权局国际检索单位。美国可以指定美国,俄罗斯,韩国,欧洲,以色列,澳洲的专利局进行检索
    考虑时差问题

    申请语言

    语言取决于受理局,中国接受中文和英文。国际局接受国际主流语言

    递交方式

    电子,纸张,传真;

    第二节 审查程序和流程

    申请及受理

    申请时间: 12个月优先权期限内提交PCT申请,或者直接提交PCT申请。
    申请资料:按顺序:请求书,说明书,权利要求书,摘要以及附图
    申请人获得申请日条件: 资料达标,申请身份达标,语言达标,国际申请达标;
    国际申请达标要求: 提出国际申请的说明,指定一个缔约国,申请人姓名按规定写明,一部分看上去是说明书,一部分看上去是权利要求
    申请日和申请号同时给出。

    国际检索

    优先权16个月内得到检索报告

    国际检索目的:

    提供决策依据;减少重复劳动

    国际检索审查内容:

    保护主题,单一性,发明名称和摘要,权利要求和说明书是否清楚,权利要求能否得到说明书支持;

    检索期限:

    收到检索本3个月内;或者 优先权日起9个月内

    应对审查员策略:

    缺乏单一性:一个发明只能对应一件申请。

    1 应对继续缴费策略:
    a提出异议,说明符合单一性,指出收费不合理,
    b 放弃附加声明 ,如果认可审查员的意见,就放弃附加的发明,只留一个发明

    指出缺乏单一性,没有让继续缴费

    审查员稍微多点劳动就可以检索结束,申请人修改,删除,附加发明

    缺乏新颖性,创造性

    修改权利要求

    国际公布

    公布时间

    自优先权满18个月公布,可以申请提前公布

    公布语言

    主流语言,阿拉伯,汉语,英语,法语,德语,日语,韩语,葡萄牙语,俄语,西班牙语

    公布内容

    著录项目,摘要首页,说明书,权利要求书,附图和国际检索报告

    某些信息不公布

    申请人提交请求和替换页申请不公布

    阻止国际公布

    撤回申请撤回公布

    推迟公布

    撤回优先权推迟公布

    国际公布效力

    指定国获得临时保护

    补充国际检索

    自优先权日起22个月内可以请求补充检索

    国际初步审查

    初审目的

    给申请人改正说明书,附图和权利要求书的机会

    提交期限

    自国际申请优先权日22个月内或者得到检索报告和书面意见3个月内,申请人可以提交初步审查请求。

    提交方式

    提交请求书,替换页,修改声明

    国际检索审查内容

    国际检索和补充检索

    完成时限

    自优先权28个月内或者收到初步审查要求书6个月内

    报告附件

    申请文件被修改过,报告有附件,包括替换页,信函

    进入国家阶段

    考虑因素

    是否进入,进入哪些国家;何时进入国家阶段

    进入国家阶段的准备

    修改翻译文本和修改申请文件

    进入方法

    传统PCT,美国非常规PCT

    PCT特色申请

    援引加入

    相比优先权文件,在后申请漏掉了某些东西,

    补充国际检索

    1 定义:
    除了主检索,申请人还可以要求一个,多个国家的补充检索
    2 基础
    以原始申请为基础,自优先权日起28个月内完成
    3 报告
    形势和内容都和主报告类似,但是也有一点区别
    4 请求期限的修改
    从19个月延长到距离优先权日起22个月
    5 期限延长的影响
    更长准备时间,让补充检索更有价值;
    缩短补充国际检索时间,对申请文件提出更高要求
    降低补充报告对初步审查的影响
    6 如何应对补充检索期限延长
    用户不同,策略不同;

    第四节 申请费用和期限

    收费单位包括:受理局,国际局,国际检索单位,国际初步审查单位

    缴纳费用

    受理局费用

    传递费,国际申请费,检索费;申请费1330法郎,每页15法郎,当超过30页;传送费由受理局确定,和国家经济水平有关;申请费全球统一价;中国受理费500元每份。中国国家知识产权局作为国际检索单位,收取2100元每份;优先权也要收费,150元每项

    国际局费用

    提前公布费,补充检索费,补充检索手续费,更正明显错误请求费,优先权改正费,文件副本费。

    国际检索费用

    附加检索费,单一性异议费,序列表费用,

    国际初步审查单位费用

    初步审查费,200法郎,特殊情况下还要缴纳滞纳金,附加审查费,异议费,文件副本费,后提交费。

    费用减免

    申请提交方式合规,可以减免申请费

    费用退还

    受理局退费

    没有给出国际申请日或者国家安全理由不让申请;或者申请撤回

    初步审查单位退费

    全额退款条件:递交给国际局之前被撤回或初审要求书未提出

    缴费期限

    自受理局收到起1个月内

    第五节 PCT 申请策略

    优先权请求

    申请优先权条件:

    1 首次申请是《巴黎公约》成员国
    2 在后申请人为和在先申请是同一人或者继承人
    3 12个月内提出
    4 首次申请为合格申请
    5 前后申请主体一致

    享受优先权的办法
    1 优先权的改正或者增加
    2 优先权的恢复
    3 优先权转让
    4 撤回,放弃最早申请

    优先权文件

    申请人在优先权日16个月内提交在先申请的副本:
    副本提交方式:
    请求受理局准备并传送
    利用文档数字获取服务
    提交在先申请副本

    申请文件的改正和修改

    请求书的改正

    提交信函改正,不影响申请日。

    说明书,权利要求书的修改

    1 遗漏项目或部分的补入

    补交遗漏内容,改变申请日
    放弃遗漏内容
    利用“援引加入”途径补入遗漏内容

    2 明显错误更正

    明显错误适用范围

    明显错误更正方式

    根据PCT条款19条的更改

    修改时机:收到检索报告2个月内后者自优先权16个月内
    修改对象:权利要求书
    修改方式:完整的权利要求替换页和修改说明,一份声明
    修改效力:修改文件和原始文件会被公布,确定临时保护范围。
    例外:国际检索单位作出不检索的决定,就无法修改

    根据PCT条款34条的更改

    修改时机:检索报告后3个月内或者自优先权日起22个月内
    修改对象:权利要求书,说明书,附图
    修改方式:提交完整权利要求替换页,说明书或者附图提交以页为单位的替换页,修改说明,修改基础
    修改效力:不会再国际阶段公开,不会构成初步审查基础。

    这份总结来自《国外及我国港澳台专利申请策略》,主编,马天旗
    整理by 湾区人工智能

    以下来自官网

    专利合作条约(PATENT COOPERATION TREATY),简称PCT。按照PCT提出的申请称为PCT国际申请。
    传统的专利体系与PCT体系的比较

    传统的专利体系:国家申请提出后12个月内,按照巴黎公约规定,向其他不同国家提出的申请可以要求优先权,由于各个国家有不同的本国专利法,就会产生如下问题:
       多种形式要求
      Ø 多种语言
      Ø 多次的检索
      Ø 多次的公开
      Ø 申请的多次审查
      Ø 12个月所要求的翻译费和国家费
      PCT体系:国家申请提出后12个月内按照PCT规定提交国际申请,要求巴黎公约的优先权,在完成国际阶段程序后,在30个月进入国家阶段
       一种形式要求
      Ø 国际检索
      Ø 国际公布
      Ø 国际初审
      Ø 国际申请可按需要进入国家阶段
      Ø 可在30个月缴纳所要求的翻译费和国家费,而且只有在申请人希望继续时才缴纳
      PCT体系的简介(1)
      Ø PCT体系是专利申请体系,不是专利授权体系,不存在PCT专利
      Ø 通过PCT途径提出的国际申请的流程分为两个阶段
        u 国际阶段,由下列部分构成
          l 国际申请的提交
          l 国际检索
          l 国际公布
          l 国际初步审查(根据申请人的要求)
        u 国家/地区阶段
      授予专利的决定完全由进入其国家/地区阶段的国家局、地区局做出
      PCT体系的简介(2)
      Ø 只有发明可以通过PCT申请,专利、实用新型和其他类似的权利保护
      Ø 外观设计和商标不能通过PCT途径获得保护
      Ø PCT和工业产权领域的其他国际公约如巴黎公约一样,由世界知识产权组织管理

    展开全文
  • 本系列中将先描述基于条目描述信息的全文检索实现方式,然后描述基于元数据的内容推荐引擎实现方式。 对于基于条目文本描述信息的内容推荐引擎,目前有很多资料可以参考,基本步聚是先对文本内容进行分词,包括提取...

    基于内容的推荐引擎有两种实现途径,一种是根据条目的元数据(可以将元数据理解为属性),另一种是根据条目的文本描述信息。本系列中将先描述基于条目描述信息的全文检索实现方式,然后描述基于元数据的内容推荐引擎实现方式。

    对于基于条目文本描述信息的内容推荐引擎,目前有很多资料可以参考,基本步聚是先对文本内容进行分词,包括提取出单词、去掉常用词如的地得、加入同意词、对英语还有去掉复数形式和过去分词形式等;第二步是计算各个词在每篇文章中的出现频率,以及在所有文章中的出现频率,即TF/IDF;第三步计算文章向量;最后是利用自动聚类算法,对条目进行聚类,这样就可以实现向用户推荐同类产品的需求了。

    但是在这里有一个非常重要的问题没有解决,就是中文分词的问题,这些文章中绝大部分都是以英文为背景的,而英文分词方面,分出单词很简单,只需要空格作为分隔符就可以了,而中文中词与词之间没有空格,其次是英文中单复数、过去分词等比较多,需要还原成单数现在式,但是中文中这个问题基本不存在,再有就是英文需要在分词后识别长的词组,而中文这一步也不需进行。

    针对以上这些难题,在我的项目中,采用了MMSeg4j中文分词模块,这个项目集成了据说是搜狗输入法的10万多词库(大家知道中文分词的关键是中文词库)。

    另外,我还希望中文分词可以在全文检索引擎和全文内容推荐引擎共用,由于全文检索引擎采用了Apache Lucene 3.x版本,需要中文分词模块符合Lucene的体系架构,幸运的是MMSeg4j提供了Lucene所需的Tokenizer实现类,同时还需要重点解决如下问题:

    • 由于打开索引文件比较慢,所以整个程序共享一个indexer和searcher
    • 考虑到准实时性需求,采用了Lucene新版本中reopen机制,每次查询前读入索引增量
    • 采用Lucene默锁机制

    在项目中我定义了全文检索引擎类:

    public class FteEngine {

        public static void initFteEngine(String _indexPathname) {
            indexPathname = _indexPathname;
        }

        public static FteEngine getInstance() {                         // Singleton模式
            if (null == engine) {
                engine = new FteEngine();
            }
            return engine;
        }

        public IndexWriter getIndexWriter() {
            return writer;
        }

        public IndexSearcher getIndexSearcher() {
            try {
                IndexReader newReader = reader.reopen();      // 读入新增加的增量索引内容,满足实时索引需求
                if (!reader.equals(newReader)) {
                    reader.close();
                    reader = newReader;
                }
                searcher = new IndexSearcher(reader);
            } catch (CorruptIndexException e) { ....      

            } catch (IOException e) {....
            }
            return searcher;
        }

        public Analyzer getAnalyzer() {
            return analyzer;
        }

        public void stop() {
            try {
                if (searcher != null) {
                    searcher.close();
                }
                reader.close();
                writer.close();
                indexDir.close();
            } catch (IOException e) {....
            }
        }

        private FteEngine() {
            analyzer = new MMSegAnalyzer();                                                                               // 初始化中文分词模块,会读入中文字典
            IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_31, analyzer);
            iwc.setOpenMode(OpenMode.CREATE_OR_APPEND);
            try {
                indexDir = FSDirectory.open(new File(indexPathname));                   
                writer = new IndexWriter(indexDir, iwc);                                           // writer和reader整个程序共用
                reader = IndexReader.open(writer, true);
            } catch (CorruptIndexException e) {......
            } catch (LockObtainFailedException e) {......
            } catch (IOException e) {.....
            }
        }
        private static FteEngine engine = null;
        private static String indexPathname = null;
        private Directory indexDir = null;
        private IndexWriter writer = null;
        private IndexSearcher searcher = null;
        private Analyzer analyzer = null;
        private IndexReader reader = null;
    }

    具体中文分词可以使用如下代码:

    FteEngine fteEngine = FteEngine.getInstance();
            Analyzer analyzer = fteEngine.getAnalyzer();
            String text = "测试2011年如java有意见 分岐其中华人民共合国,oracle咬死猎人的狗!";
            TokenStream tokenStrm = analyzer.tokenStream("contents", new StringReader(text));
            OffsetAttribute offsetAttr = tokenStrm.getAttribute(OffsetAttribute.class);
            CharTermAttribute charTermAttr = tokenStrm.getAttribute(CharTermAttribute.class);
            String term = null;
            int i = 0;
            int len = 0;
            char[] charBuf = null;
            try {
                while (tokenStrm.incrementToken()) {
                    charBuf = charTermAttr.buffer();
                    for (i = (charBuf.length - 1); i >= 0; i--) {
                        if (charBuf[i] > 0) {
                            len = i + 1;
                            break;
                        }
                    }
                    //term = new String(charBuf, offsetAttr.startOffset(), offsetAttr.endOffset());
                    term = new String(charBuf, 0, offsetAttr.endOffset() - offsetAttr.startOffset());
                    System.out.println(term);   
                }
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }

    打印的内容如下:

    测试 2011 年 如 java 有 意见 分 岐 其中 华 人民 共 合 国 oracle 咬 死 猎人 的 狗

    当我们在缺省词库中加入单词:分岐 中华人民共合国后,那么分词结果可以变为:

    测试 2011 年 如 java 有 意见 分岐 其 中华人民共合国 oracle 咬 死 猎人 的 狗

    由此可见,可以通过完善中文词库,得到越来越好的中文分词效果。

    转载于:https://www.cnblogs.com/javatec/archive/2011/08/12/2152482.html

    展开全文
  • 就是根据用户使用搜索引擎的方式利用用户检索信息的机会尽可能将营销信息传递给目标用户。简单来说,搜索引擎营销就是基于搜索引擎平台的网络营销,利用人们对搜索引擎的依赖使用习惯,在人们检索信息的时候将信息...

    搜索引擎营销——被企业严重低估的网络营销途径

    首先,今天让我们来了解一下搜索引擎营销这个熟悉和陌生的词,通过查阅一些资料,我们可以知道它简称为“SEM”。就是根据用户使用搜索引擎的方式利用用户检索信息的机会尽可能将营销信息传递给目标用户。简单来说,搜索引擎营销就是基于搜索引擎平台的网络营销,利用人们对搜索引擎的依赖和使用习惯,在人们检索信息的时候将信息传递给目标用户。搜索引擎营销的基本思想是让用户发现信息,并通过点击进入网页,进一步了解所需要的信息。企业通过搜索引擎付费推广,让用户可以直接与公司客服进行交流和了解,实现交易。

    搜索引擎营销的基本思想是让用户发现信息,并通过(搜索引擎)搜索点击进入网站/网页进一步了解他所需要的信息。在介绍搜索引擎策略时,一般认为,搜索引擎优化设计主要目标有2个层次:被搜索引擎收录、在搜索结果中排名靠前。这已经是常识问题,简单来说SEM所做的就是以最小的投入在搜索引擎中获最大的访问量并产生商业价值。多数网络营销人员和专业服务商对搜索引擎的目标设定也基本处于这个水平。但从实际情况来看,仅仅做到被搜索引擎收录并且在搜索结果中排名靠前还很不够,因为取得这样的效果实际上并不一定能增加用户的点击率,更不能保证将访问者转化为顾客或者潜在顾客,因此只能说是搜索引擎营销策略中两个最基本的目标。

    随着搜索引擎用户的不断增长,搜索引擎将逐渐成为细分覆盖最高的媒体。虽然还是有企业把网络营销、搜索引擎营销和传统营销在经营思想上分开处理,但是无论中小型企业还是大型企业,都在关注网络营销和搜索引擎营销,他们积极与技术先进的第三方公司合作,完善他们的搜索引擎营销服务体系,共同驱动未来中国的搜索引擎市场。我发现搜索引擎营销渐成营销战略组成部分。
    信息化和网络营销得到企业重视程度加深,越来越多的企业不仅仅购买搜索引擎广告或者搜索引擎优化。

    目前国内现状,搜索引擎营销当属百度、360、搜狗为主。

    不管是PC端还是移动端百度市场份额都是绝对的国内第一,跟国内目前其他搜索引擎相比,也不提竞价广告的乱象丛生,但从信息获取效率以及用户体验来比,百度也是当之无愧的。

    搜索引擎营销最重要的就是关键词。关键词是什么呢?举例,有人想买车,但用户处在不同需求阶段时搜的词是不一样的…下面图片里也是一些关键词的举例。

    展开全文
  • 谈谈科研论文的追踪、管理阅读

    千次阅读 2019-06-21 14:33:37
    当前,检索文献的主要方式是直接在数据库,特别是谷歌学术搜索关键词,找到关键论文后,再查看引用这些论文的论文,下载pdf全文,甄选后阅读。 随着研究工作的深入,文献也逐渐积累,绝大多数研...
  • 摘 要 本文讲述了基于SSH框架的网上商城购物系统的设计与实现。所谓的网上商城购物...网上商城购物提供了多种检索途径,可以从分类、新品、特价等途径进行检索,快捷准确。与传统销售方式相比,在线销售能够提供海量
  • 例, 从界面、检索途径、收录范围、检索方式、检索结果、资源点击率等方面来比较分析不同数据库的检索特点利用 情况。 关键词: 高校; 图书馆; 中国期刊网; 万方数据库通过对图书馆电子资源使用情况的调查, 将具有...
  • 而SEM在百科的解释是:搜索引擎营销,它是除了对网站做优化以外,也可以用便捷的途径来更快的让客户找到你的网站,这种便捷的方式就是通过付费的手段。根据用户使用搜索引擎的方式利用用户检索信息的机会尽可能将...
  •  主要作用包括:联系人概况的记录、存储和检索;跟踪同客户的联系,如时间、类型、简单的描述、任务等,并可以把相关的文件作为附件;客户的内部机构的设置概况。  3.时间管理。  主要功能有:日历;设计约会、...
  • 华赛USG2100说明书

    2013-06-08 16:04:14
    介绍文档的组成、检索方式、文档约定、修订记录、获取方式和意见反馈途径,帮助您快速了解产品文档体系。 产品版本 介绍文档对应的产品版本。 文档组成 介绍USG2100/2200/5100产品文档分类以及各类文档的主要内容...
  • sql试 题答案试题

    2009-12-11 16:40:54
    9、视图是一种常用的数据对象,它是提供(1___)(1___)数据的另一种途径,可以简化数据库操作,当使用多个数据表来建立视图时,表的连接不能使用(2___)方式,并且不答应在该语句中包括(3___)等要害字。...
  • 技术:Java、JSP等摘要:本文讲述了基于JSP技术的宠物猫销售系统的设计与实现。所谓的宠物猫销售系统是...商品在线销售提供了多种检索途径,可以从分类、新品、特价等途径进行检索,快捷准确。与传统销售方式相比,在线
  • 基于B/S模式的珠宝首饰在线销售系统的设计与实现。所谓的珠宝首饰在线销售系统是...珠宝首饰在线销售提供了多种检索途径,可以从分类、新品、特价等途径进行检索,快捷准确。与传统销售方式相比,在线销售能够提供海
  • 在ASP.NET Core中,由多种途径可以对应用程序状态进行管理,使用哪种途径,由检索状态的时机和方式决定。 应用程序状态指的是用于描述当前状况的任意数据。包括全...
  • 本文讲述了基于B/S模式的PHP技术mysql数据库制作的咖啡网站,本网站不仅是咖啡服务的推广,咖啡网站提供了多种检索途径,可以从分类、新品、特价等途径进行检索,快捷准确。与传统销售方式相比,在线销售能够提供...
  • 所以网上书城就出现了,与传统的销售方式相比线上销售有很多优点,比如:检索便捷,线上销售提供了多种检索途径,可以从分类、新品、特价等途径进行检索,快捷准确;信息量大,与传统相比较,线上销售能够提供大量的...
  • Java、JSP等在线书店

    2021-04-14 10:40:59
    随着网络的发展,网上书店...图书在线销售提供了多种检索途径,可以从分类、新品、特价等途径进行检索,快捷准确。与传统销售方式相比,在线销售能够提供海量数码产品信息。图书在线销售最突出的优点是:不再限制消费者
  •  2017年中国人民大学教授在大数据期刊发表的《大数据价值发现方法》一文中指出,大数据的价值呈现有3种途径:数据检索、数据分析数据探索。当前主流的数据分析工具主要提供数据检索和数据分析能力,在数据探
  • 本系统提供了多种检索途径,可以从分类、新品、等途径进行检索,快捷准确。与传统销售方式相比,商品在线销售最突出的优点是:不再限制消费者的购买时段,节省实际开店时需要投入的成本租用费用。《科大学工在线...

空空如也

空空如也

1 2 3 4 5 6
收藏数 115
精华内容 46
关键字:

检索方式和检索途径