精华内容
下载资源
问答
  • 如何解决EXCEL中弹出“信息检索信息 ...我们一阵操作,不晓得什么时候又弹出了烦人信息检索”; 而且还输入不了数据内容,也进行不了删除等操作,点击关闭按钮,你随便点击一个单元格又弹出来...

    如何解决EXCEL中弹出“信息检索”的信息

    在我们办公中有时候莫名其妙的会自动弹出“信息检索”,点击关闭又弹出来,有时候还输入不了内容,甚至执行不了删除等操作,该怎么解决?

    方法/步骤

    1. 打开我们需要的电子表格,这是正常的电子表格,可以正常的操作;
      在这里插入图片描述
    2. 我们一阵操作,不晓得什么时候又弹出了烦人的“信息检索”;
      在这里插入图片描述
    3. 而且还输入不了数据内容,也进行不了删除等操作,点击关闭按钮,你随便点击一个单元格又弹出来,消去不掉;
      在这里插入图片描述
    4. 经过多次尝试学习,原来我们按住Alt再进行关闭的话,就可以真正的关闭这样一个“信息检索”的弹出框;
      在这里插入图片描述
    5. 消失后,我们又可以进行正常的操作了,当然,如果我们按住Alt,任意点击一个单元格就会弹出“信息检索”,原来Alt+任意单元格,就是调出信息检索的快捷键;
      在这里插入图片描述
    6. 我们可以使用“信息检索”实现翻译、搜索参考资料、所有网站检索等多种功能,合理使用可以帮助我们大大提高效率;
      在这里插入图片描述
    展开全文
  • 信息检索的技术基础及基本原理 用了什么技术?怎么实现的? 文献信息的基本结构(略)、信息资源存储和组织方法 信息资源如何存储与组织的?...信息检索技术和信息检索的基本方法和步骤 如何进行检索的? ...

    信息检索的技术基础及基本原理

    用了什么技术?怎么实现的?

    文献信息的基本结构(略)、信息资源存储和组织方法

    信息资源是如何存储与组织的?

    信息检索的检索算符和检索表达式构建

    一些检索的常识

    信息检索技术和信息检索的基本方法和步骤

    如何进行检索的?

    展开全文
  • 操作游标四个步骤? 如何判断游标提取状态? 关闭游标就可以了为什么还要释放呢?他们有什么区别? 游标是什么? 是一种数据访问机制,它允许用户单独操作数据行,而不是对整个行集进行操作。用户可以通过...

    目录

    游标是什么?

    如何创建一个游标?

    操作游标的四个步骤?

    如何判断游标的提取状态?

    关闭游标就可以了为什么还要释放呢?他们有什么区别?


     

    游标是什么?

    是一种数据访问机制,它允许用户单独的操作数据行,而不是对整个行集进行操作。用户可以通过单独处理每一行逐条手机信息并对数据逐行进行操作,这样可以降低系统开销和潜在的阻隔情况。用户也可以使用这些数据生成SQL代码并立即执行或输出

    可以把游标当成一个指针,它可以随意移动到指定的行,允许用户对指定位置数据进行处理


     

    游标包括哪些部分?

    • 游标结果集:由定义游标的select语句返回的行的集合
    • 游标位置:指向这个结果集中的某一行的指针

     

    游标有什么特点?

    • 返回一个完整的结果集,但允许程序设计语言只调用集合中的一行
    • 允许定位在结果集的特定行
    • 从结果集的当前位置检索一行或多行
    • 支持对结果集中当前位置的行进行数据修改
    • 可以为其他用户对显示在结果集中的数据库数据所做的更改提供不同级别的可见性支持
    • 提供脚本、存储过程、触发器中使用的访问结果集中数据的T-SQL语句

     

    如何创建一个游标呢?

    第一步、声明游标

    --声明student_cursor游标,scroll指定可以获取任意数据行
    declare student_cursor scroll cursor
    for

    第二步、查询语句

    --查询student表中的所有信息
    select * from student

    第三步、声明游标类型

    --声明游标类型为只读型
    for read only

     

    如果操作一个完整的游标我们可以怎么做呢?需要有哪些步骤呢?

    操作游标的四个步骤?

                            

    声明    declare

    打开   open

    检索   fetch(first,last,next,prior,absolute行数)

    关闭   close

    需求:执行一个完整的游标过程

    数据表如下图:

                    

    第一步、声明

    declare stu_cursor scroll cursor      --声明
    for
    select sname from student             --查询语句

    第二步、打开

    open stu_cursor

    第三步、检索

    declare @name varchar(10)          --声明变量@name
    fetch first from stu_cursor        --检索游标里面的第一行数据
    into @name
    print @name                        --打印值

    执行的效果是什么样的呢?

                                 

     

    如果想要看其他行的呢?

    fetch first from stu_cursor           --检索游标
    fetch last from stu_cursor            --检索最后一行
    fetch next from stu_cursor            --检索下一行
    fetch absolute 3 from stu_cursor        --检索第3个位置的值
    

    第四步、关闭

    close stu_cursor

    第五步、释放

    deallocate stu_cursor

     

    如何判断游标的提取状态?

    0  fetch   语句成功

    -1 fetch  语句失败或行不在结果集中

    -2 提取的行不存在


     

    关闭游标就可以了为什么还要释放呢?他们有什么区别?

    关闭游标:关闭当前游标的运行,要用的时候打开就可以直接使用了

    释放游标:将游标占用的资源释放了,如果还想用游标,就必须重新建立

     

    总结:游标就是我们平常学的指针,它可以随意的移动到指定的行

     

     

    展开全文
  • 文本预处理(1)文本预处理的时机(2)文本预处理的步骤2:词汇分析(1)英文词法分析(2)中文分词技术3:排除停用词4:词干提取三、文本索引1:索引在IR系统的位置(1)为什么需要索引(2)什么样的数据结构合适...

    一、文本特性

    1:文本的统计特性-zipf定律

     不同词的频率是如何分布的?
     当文档集增大时,词汇表的大小如何变化?
     以上这些因素影响信息检索的性能,包括词的权重,以及检索系统的其他方面
    在这里插入图片描述
    Zipf定律经常可以用来预测词频,因为词频*rank=k,那么只要知道k和词频就可以计算该词的rank。
    在这里插入图片描述
    D是词汇表长度,N是文档集的大小,对末尾的单词(rank为D的词大概率只会出现一次),他的rank如果等于D,词频等于1,那么有D1N=k=>D=kND*\frac{1}{N}=k=>D=kN。把D=kND=kN代入上面的In=Dn(n+1)I_n=\frac{D}{n(n+1)},I1=D2I_1=\frac{D}{2},即几乎有一半的单词只出现过一次。而大量的文档形成的文档库中只出现一次的词是罕有词,对我们的索引帮助不大,同样的出现频率非常高的词(the,a)这些也帮助不大。
    在这里插入图片描述
    在这里插入图片描述
     好消息: 停用词占文本中的很大一部分,因此删除停用词可以大量减少索引文档的存储空间
     坏消息: 对大多数词来说,进行词汇之间的相关分析并不容易,因为它们出现的次数比较少

    2:词汇表的变化规律-Heaps定律

    在这里插入图片描述
    在这里插入图片描述
    随着语料库的增长,词汇量是以平方根的速度扩展的,是可以扩展和预测的。

    二、文本操作

    1:文本预处理

     在索引之前对文档集合进行预处理
     在检索之前对查询进行预处理

    (1)文本预处理的时机

    在这里插入图片描述

    (2)文本预处理的步骤

    在这里插入图片描述
    (i)网页噪声去除

    • 网页中的内容除了主题内容外,还通常包含广告、版权声明、导航条等噪音信息,这些噪音内容会对基于网页内容的应用造成影响
    • 网页噪声:主题内容无关的导航条、广告信息、版权信息以及调查问卷等内容,被称为“噪音”内容,或噪声网页
    • 网页噪声干扰了网页原本的内容表现,影响了检索性能,必须去除
    • 网页去噪过程就是保留网页中包含主题内容的内容块而去掉包含噪音内容的内容块

    那么最重要的步骤就是确定内容块
    在这里插入图片描述
    标签密度(标签数与总文本数的比):非正文区域的标签密度较稠密(广告地区的超链接一个接一个,肯定多)
    在这里插入图片描述
    token既包含tag也包含我们需要的content,在主内容区域只有word没有tag,也就是说超链接比较少,都是核心内容。

    2:词汇分析

    在这里插入图片描述

    (1)英文词法分析

    在这里插入图片描述

    (2)中文分词技术

    在这里插入图片描述
    一般都会将双子词先找出来

    (i)统计方法
    重点是分割中文双字词
    在这里插入图片描述
    在这里插入图片描述
    (ii)基于规则的方法
    在这里插入图片描述
    在这里插入图片描述
    对这个例子,我们设一个最大匹配长度,先拿出来五个字,“搜索引擎是”,如果匹配上就ok,如果每匹配上就减小字串长度(从最后面去掉一个字“是”),然后再到字典匹配就匹配上了。然后拿到“是上网工具”五个字,没找到,依次减去“具” “工”,“网”,“上”,剩下“是”没匹配到,我们再拿出最后四个字“上网工具”,然后就匹配到了上网和工具。

    但是汉字博大精深啊,正向逆向的结果很可能差别非常之大
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    (iii)混合方法

    3:排除停用词

    在这里插入图片描述
    在这里插入图片描述

    4:词干提取

    把各种时态的词语转化为单一的形式,我们不care时态问题。对英文来说很重要。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    三、文本索引

    1:索引在IR系统的位置

    在这里插入图片描述

    (1)为什么需要索引

    在这里插入图片描述
    之所以要半静态更新,是因为每次建立索引的代价还是蛮大的。

    (2)什么样的数据结构是合适的?前向索引?

    在这里插入图片描述
    文档数目超多,要遍历所有的文档,每个词要在每个链表中进行顺序查询,效率也是极低的。

    2:倒排索引的思想

    • 都不在查询和文档中出现的词一般不影响cosine相似度
    • 通常查询很短,因此查询矢量是非常稀疏(sparse)的
    • 利用倒排索引来发现包含至少一个查询词的有限文档

    既然我们需要的词很少,不如从词构建索引,而不是从文档构建索引。
    在这里插入图片描述在这里插入图片描述
    每个词构建一个链表,输入一个查询词我们就可以找到所有出现的文档。从前向索引到倒排索引是一个性能上的飞跃。
    在这里插入图片描述
    在这里插入图片描述

    (1)词汇表结构

    在这里插入图片描述

    (2)事件表的内容

    在这里插入图片描述
    时间表存储的信息决定了IR系统的功能强弱,
    在这里插入图片描述
    至于为什么支持短语查询,比如中国两个字,在一个文档中,我们查询了词出现的位置,那么只要这两个字是相邻出现的,那么就成功组成了一个短语。

    (3)倒排文档的一般性质

    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • solr部署步骤

    2018-03-18 13:08:00
    1、什么是lucene:全文检索工具包 2、Lucene工作原理: 索引数据创建 从原始文件中提取一些可以用来搜索数据(封装成各种Field),把各field再封装成document,然后对document进行分析(对各字段分词),...
  • 网上千篇一律的是重复登录 Google 账号 当然我相信这肯定对大部分人有用 不过还有一部分人弄不好,因为这样弄好的的大多 [RPC:S-7:AEC-...如果遇到 [RPC:S-7:AEC-7 …这里还有个什么ROM提示],请操作所有步骤
  • 第二节里我们了解了倒排索引基本知识,包括构建、合并、查询等。课件里有个关于google中是否使用布尔模型?...当时只是一笔带过,现在应该去思考为什么这样。先说下步骤吧: 我们构建索引输入一般
  • 大学文献检索资料 DOC

    2009-11-28 10:35:24
    二、信息检索的步骤: 1.分析研究课题: 2.选择检索工具: 3.确定检索途径:分类途径、主题途径、题名途径、著作途径、号码途径、其他途径。 4. 选择检索方法:常用法(顺查法、倒查法、抽查法)追溯法 综合法...
  • 什么是数据挖掘

    千次阅读 2017-07-17 21:11:41
    数据挖掘一般指从大量数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去经验法则)和模式识别等诸多方法来实现上述...
  • 数据可视化起源于图形学、计算机图形学、人工智能、科学可视化以及用户界面等领域相互促进和发展,当前计算机科学一个重要研究方向,它利用计算机对抽象信息进行直观表示,以利于快速检索信息和增强认知能力...
  • 数据挖掘,什么是数据挖掘?

    千次阅读 2017-08-14 11:58:21
    数据挖掘一般指从大量数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去经验法则)和模式识别等诸多方法来实现上述...
  • 数据可视化起源于图形学、 计算机图形学 、人工智能、科学可视化以及用户界面等领域相互促进和发展,当前计算机科学一个重要研究方向,它利用计算机对抽象信息进行直观表示,以利于快速检索信息和增强认知...
  • 一点补充 什么叫模态:每一种信息来源都可以认为是一种模态...文章目录一点补充前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结 前言 提示:这里可以添加本文要记录大概内容: 例如:随着人工智能不断
  • 使用应用程序的步骤 首次使用Google帐户登录 您将看到所有详细信息和专业照片 然后滚动到帖子 在故事卷的下方,您将找到消息发件人组件 在这里您可以键入post(蚂蚁文字...)并粘贴任何图片的网址 现在输入回车上传...
  • 目录 一、什么是BIG6 二 、具体步骤 2.1 确切地了解问题、定义问题(一句话:什么情况、要干什么) 2.2 确定信息检索范围,确定内容范围和...中国大学慕课有一门华东科技大学的信息检索课,里面第一章就介绍了这...
  • Linux用处越来越多,不少朋友相信已经用它架设过各种服务,比如什么Web、FTP、BBS等等等啦,这次我向大家介绍另外一个在linux下运行的服务器软件----NoseyParker,这一个强大的FTP搜索引擎,只要一些简单的步骤,一...
  • Linux用处越来越多,不少朋友相信已经用它架设过各种服务,比如什么Web、FTP、BBS等等等啦,这次我向大家介绍另外一个在linux下运行的服务器软件----NoseyParker,这一个强大的FTP搜索引擎,只要一些简单的步骤,一...
  • 相对于计算机中使用其他技术来说,算法作用是什么? 1.1 算法算法定义:就是定义良好计算过程,它取一个或一组值作为输入,并产生一个或一组值作为输出。亦即,算法就是一系列计算步骤,用来将输入数据...
  • 1 子查询是什么? 嵌套在其他查询中查询。 举例: 前提:orders表存储订单信息,orderitems存储订单中物品的信息,customers表存储客户信息。 step1:检索包含物品TNT2所有订单编号 select order_num from ...
  • 数据库和Excel数据交互在生产生活中很普遍,实现方式也各异。最近在项目中使用了.NET Excel组件,在本机上运行并没有...以下报错信息: “/”应用程序中服务器错误。 检索 COM 类工厂中 CLSID 为 {0...
  • Lucene快速入门(一)

    2010-05-26 13:23:43
    Lucene一个由java实现开源全文检索引擎工具包,一个高性能、可伸缩的信息搜索(IR)库,它可以为你应用程序添加索引和搜索能力。 2.什么是全文检索 全文检索是计算机索引程序通过扫描文章中每一个词...
  • Day2_TF-IDF

    2019-04-07 00:53:07
    维基百科定义:TF-IDF(term frequency–inverse document frequency)一种用于信息检索与文本挖掘常用加权技术。它一种统计方法,用以评估一字词对于一个文件集或一个语料库中其中一份文件重要程度。字词...
  • 主要研究方向数据库系统、时间数据库、概念建模、面向对象数据库、Wed建模和本体论数据库模型和语言、DBMS系统实现、检索技术等。  Shamkant B.Navathe 世界知名数据库学者。现任佐治亚理工学院计算学院...
  • 大话文本分类

    千次阅读 2018-02-14 09:49:26
    常见的文本分类应用有:新闻文本分类、信息检索、情感分析、意图判断等。本文主要针对文本分类的方法进行简单总结。传统机器学习方法分类问题一般的步骤可以分为特征提取、模型构建、算法寻优、交叉验证等。对于文本...
  • 查询性能优化-01

    2020-03-08 23:30:50
    查询需要在不同地方花费时间,包括网络,CPU计算,生成统计信息和执行计划,锁等待等操作,尤其底层存储引擎检索数据,这些检索需要内存操作、CPU 操作和内存不足时IO操作。 2.慢查询基础:优化数据访问 最...
  • 大数据测试:功能和性能

    千次阅读 2018-09-05 15:56:00
    什么是大数据? 大数据不能使用传统计算技术处理大型数据集集合。这些数据集测试涉及各种工具,技术和框架来处理。大数据涉及数据创建,存储,检索和分析,在数量,多样性和速度方面都非常出色。您可以在...
  • 数据库设计入门经典

    2019-07-23 01:39:21
    资源名称:数据库设计入门经典内容简介:本书详细介绍了如何最好地构造数据库中用到表和查询,从而提供最适宜性能...您将发现为什么关系数据库必需 资源太大,传百度网盘了,链接在附件中,有需要同学自取。

空空如也

空空如也

1 2 3 4 5
收藏数 89
精华内容 35
关键字:

信息检索的步骤是什么