精华内容
下载资源
问答
  • 扩展布尔模型
    万次阅读
    2017-08-16 08:33:31

    布尔模型(Boolean Model)介绍

    最早的IR模型,也是应用最广泛的模型;目前仍然应用于商业系统中;Lucene是基于布尔(Boolean)模型的。

    布尔模型描述

    • 文档D表示:一个文档被表示为关键词的集合
    • 查询式Q表示:查询式(Queries)被表示为关键词的布尔组合,用“与、或、非”连接起来,并用括弧指示优先次序
    • 匹配F:一个文档当且仅当它能够满足布尔查询式时,才将其检索出来

    • 检索策略基于二值判定标准
    • 算法R:根据匹配框架F判定相关, 计算相关度排名,这里不涉及doc得分和tfidf,只是boolean关系。
      查询表示
      在布尔模型中,所有索引项的权值变量和文档d与查询q的相关度都是二值的,查询q被表述成一个常规的布尔表达式,为方便计算查询q和文档d的相关度,一般将查询q的布尔表达式转换成析取范式DNF。也就是QueryParser解析后,看到的BooleanQuery。

    示例

    文档集包含两个文档:
    文档1:a b c f g h
    文档2:a f b x y z
    用户查询:文档中出现a或者b,但一定要出现z。
    将查询表示为布尔表达式 ,并转换成析取范式
    文档1和文档2的三元组对应值分别为(1,1,0)和(1,1,1)
    经过匹配 ,将文档2返回

    优点

    到目前为止,布尔模型是最常用的检索模型,因为:

    • 由于查询简单,因此容易理解 通过使用复杂的布尔表达式,可以很方便地控制查询结果 相当有效的实现方法
    • 相当于识别包含了一个某个特定term的文档 经过某种训练的用户可以容易地写出布尔查询式
    • 布尔模型可以通过扩展来包含排序的功能,即“扩展的布尔模型”

    问题

    • 布尔模型被认为是功能最弱的方式,其主要问题在于不支持部分匹配,而完全匹配会导致太多或者太少的结果文档被返回
      非常刚性: “与”意味着全部; “或”意味着任何一个
      很难控制被检索的文档数量,原则上讲,所有被匹配的文档都将被返回很难对输出进行排序.
    • 不考虑索引词的权重,所有文档都以相同的方式和查询相匹配
    • 这个过程是“data retrieval” 而不是 “information retrieval”。

    总结

    如果不需要排序,就适合boolean Model,该模型就是布尔运算的结果,不涉及复杂的排序。最多按命中boolean条件的个数粗略排序。简单理解, 可以认为是命中模型。 而涉及排序的则是VSM或者BM25等方法,以及二次排序。

    参考

    https://en.wikipedia.org/wiki/Standard_Boolean_model

    更多相关内容
  • 网络信息检索(二)扩展检索模型

    千次阅读 2020-03-11 16:32:33
    文章结构总览布尔模型扩展(1)模糊集合模型① 查询词扩展(2)扩展布尔模型3.向量空间模型扩展(1)广义向量空间模型(2)潜语义索引模型(3)词向量4.概率模型的扩展(1)语言模型 总览 布尔模型扩展 需要改进...

    总览

    在这里插入图片描述

    布尔模型扩展

    需要改进的地方:完全匹配和无结果排序的问题

    (1)模糊集合模型

    对布尔模型而言,一个词和文档的关系只有0或者1,但是相近的词呢?引入词对文档的隶属度的概念(80%包含,50%包含etc。)如何定义隶属度呢?

    通过定义词-词关联矩阵(term-term correlation matrix) ,对查询词进行扩展,以提取更多的相关的文档。通过放松对集合成员的约束条件来得到排序结果
    在这里插入图片描述

    ① 查询词扩展

    两个词关系好不好就看他们是否经常一起出现。Cii=1
    在这里插入图片描述
    如果dj的所有索引词和ki都关系不大,那么\mu=0,如果关系很大cil=1,1-cil=0,整体的相似度就会为1。相比于布尔模型,有索引词的文档相关性就是1,这样无疑可以进行排序了。
    在这里插入图片描述

    (2)扩展布尔模型

    3.向量空间模型扩展

    以词作为基向量显然是不正交的,这就是他需要改正的地方。

    (1)广义向量空间模型

    以索引词的出现模式作为词的基向量,1表示该索引词出现,这显然是正交的。
    在这里插入图片描述
    对三个索引词就有八种出现的模式。
    在这里插入图片描述
    优缺点:
    在这里插入图片描述

    (2)潜语义索引模型

    通过SVD分解等处理,去掉噪音,消除同义词,多义词的影响(将他们合并),大大降低向量空间的维度。
    在这里插入图片描述
    通过降维将M转化为一个稠密矩阵,利用奇异值分解,只保留最大的s个奇异值,得到新的矩阵,将文档和查询向量映射到与概念向关联的维数较低的空间。用标准的余弦相似度计算复杂度。
    在这里插入图片描述
    优缺点:
    在这里插入图片描述

    (3)词向量

    One-hot向量不能挖掘出词与词之间的关系。使用分布式表示的方法计算向量之间的距离来体现词与词之间的相似性。
    在这里插入图片描述
    在这里插入图片描述
    类似于DL的方法,每个词都给一个向量表示,可以很方便的计算词与此之间的联系。在机器翻译方面工作的很好
    在这里插入图片描述

    4.概率模型的扩展

    需要改进的地方:二值权重可以改进,独立事件的假设

    (1)语言模型

    着重于探索文档的语言风格,查询的语言风格,相近语言风格的文档可能更符合查询的需要。
    在这里插入图片描述
    所谓的文档模型就是统计文档中每个词的词频,有了每个词的词频,我们就可以对一个索引计算概率
    在这里插入图片描述
    哪个文档产生该查询的概率越大,说明相似度越高,越稳。显然这种计算方式假设词与词之间是独立的,直接将词出现的概率相乘。
    在这里插入图片描述
    又:防止结果奇异,要加上平滑操作。因此查询可以分为两部分,一个是在该文档中出现的频率,一个是不在在全部文档中出现的概率。
    在这里插入图片描述

    一些小问题

    1.模糊集合论模型中的文档隶属度是指什么?与什么因素有关?

    文档隶属度是文档隶属于某索引词的度量,如果该文档包含的词语和某个索引项有关,那么该文档就属于对应索引项的模糊集合,他的计算方法是对每一个文档集中包含的词,通过词-词关联矩阵,计算出他们与该索引词不相关的因子之积,然后用1减去,就是整个文档对该索引词的隶属度。显然只要有任意一个词和索引词关联因子为1,那么所有不相关因子之和就会为0,隶属度为1,这正是布尔模型的特例。通过他的计算方法,我们也可以看出,与隶属度相关的因素有(i)文档中包含的词语。(ii)词-词关联矩阵的值

    2.广义向量空间模型以什么为基向量?该模型的主要缺点是什么?

    广义向量空间模型的基向量比较特殊,它是以词语出现的模式为基向量。如果有两个词语,那么基向量有四个(0,0)(0,1)(1,0)(1,1),可以满足完全正交的条件。但是一旦词语一多,向量空间的维数指数增长,计算开销极大。

    3.潜语义标引模型对什么矩阵进行SVD分解?什么是概念空间?

    对M矩阵进行SVD分解,所谓的M矩阵,也就是文档-词汇矩阵,mij表示词汇ki在文档dj中的权重,词汇很多,但是一篇文章有的词汇却很少,一个稀疏矩阵无论是在计算还是在存储都会造成资源的浪费。因此对M进行SVD分解可以节省很多资源。潜语义索引模型的概念空间的含义是,每一维都代表一个基本的概念,所有的维度就形成了模型的概念空间,所有的查询和文档都会被映射到这个概念空间进行处理,而SVD就是为了构造一个更低维,高效的概念空间。

    4.什么是“词汇鸿沟”?请描述词向量,包括维度、向量形式、构建方法等。

    词汇鸿沟对应着词袋模型的基本假设:词与词之间是相互独立的,在前面的很多使用向量的模型里,一个词语往往是一个one-hot向量,在这个情况下,我们不能体现出词与词之间的相互关系,而且随着词语的增多,维度迅速增大。这时我们使用word2vec,一个浅层的神经网络,包含输入层,隐藏层和输出层。输入层和输出层的维度为N(词汇表的大小),隐藏层的维度为D(词向量的维度),输入层接受单词a的one-hot编码,输出层计算所有单词出现在a上下文的概率,word2vec在语料库中进行训练。训练完成后神经网络输入层到隐藏层之间的权重矩阵V(N*D)就是词向量矩阵,可以看到每个词现在的表示维度只有D,很好用。

    1. 一元语言模型的前提条件是什么?语言模型中包含TF-IDF吗?

    一元语言模型十分简单,他的条件就是词汇的出现是相互独立的,并且把查询中的每个词语相互独立。我认为是包含的,一元语言模型将查询分成了general language model 和individual-document model,二者分别计算统计的是查询q中的索引词ki在当前文档的词频,和全部文章的词频,这其实就是TF-IDF的意义。

    展开全文
  • 【信息检索导论1】布尔模型

    千次阅读 2022-04-28 16:49:33
    grep 在文本中查某个词足够了,但有其他需求 其他需求: 数据量大而多,快速处理 flexible matching operations 排序 布尔模型 query:布尔表达式 任务: ad hoc retrieval task. 输入query,输出doc列表(排序后) ...

    1.Information Retrieval

    定义:
    Information retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collections (usually stored on computers).
    web search

    • 数量庞大
    • 需要索引
    • 反欺诈
    • 利用超链接

    personal information retrieval:

    • eg:Email
    • 分类
    • 垃圾邮件过滤
    • 存储大量类别
    • 维护免费
    • 磁盘空间

    enterprise,institutional, and domain-specific search

    • stored on centralized file systems

    线性查找:grep

    • 在文本中查某个词足够了,但有其他需求

    其他需求:

    • 数据量大而多,快速处理
    • flexible matching operations
    • 排序

    布尔模型

    • query:布尔表达式

    任务:

    • ad hoc retrieval task.
      • 输入query,输出doc列表(排序后)

    评估

    • precision
    • recall

    专有名词

    • term:索引的单元,如词、词组、潜在词等
    • document:检索的单位,如网站列表,也可能是某一章节
    • collection或者corpus:doc的集合
    • information need
      • 用户向计算机传递的需求
      • 可能并不精确
    • relevant:如果用户认为包含与其个人信息需求相关的信息

    1.1 term-document matrix

    在这里插入图片描述
    词袋->doc向量:每列一个doc向量,每行一个term向量
    query:Brutus AND Caesar AND NOT Calpurnia,
    在这里插入图片描述
    答案:Antony and Cleopatra and Hamlet
    问题

    • 稀疏,词表大难以存储–>倒排索引

    1.2 倒排索引

    在这里插入图片描述

    INVERTED INDEX

    • dictionary(vacabulary):
      • 内存
      • key:term列表,也排序了,也会记录postings的长度(doc freq)
      • value:postings list/postings:排好序的,按doc id,出线相关词的freq,…
    • postings
      • posting记录:docid,term在doc中出现的位置、freq,…
      • 存储:disk
        • 固定长度:不行,浪费
        • linked list:链表,
          • 便于插入,
          • 便于扩展到advanced indexing strategies
            • skip list,需要新的指针
          • 问题:要存储指针
        • 可变数组
          • 顺序存储,遍历快
          • 无需存储指针,指针可以是offset
        • 混合
          • 不变数组的链表

    建立:

    • Collect the documents to be indexed:
    • 分词
    • normalized
    • index
      • merge:相同term的相同doc合并
        在这里插入图片描述

    1.3 Processing Boolean queries

    1. 得到每个term的postings
    2. OR:则两个表融合,取并集,AND:取交集,转化为AND链接的形式

    取交集:(标准方法)
    在这里插入图片描述
    问题:取交集时,常数复杂度,但这个常数很大
    解决:

    • 先按doc freq排序(posting的长度),先合并短的
      • 最终结果的长度不会超过最短的列表
      • 这是保存doc freq.的原因
      • 先算OR,再算AND
        在这里插入图片描述
    • 先算短的,然后保存到中间结果
      • 每次下一个输入与中间结果求交集
      • 问题:不对称
        • 中间结果:内存;下一个输入:disk
        • 但下一个输入可能比中间结果大得多(两个数量级?)
      • 加速合并过程
        • 中间结果的doc在长positng中二分查找合并
        • 长postings采用哈希存储
        • 上述无法用于压缩后的positngs
      • 都是常见词,仍可以用标准法

    带中间结果的求交集:
    在这里插入图片描述

    1.4 对基本布尔操作的扩展和有序检索

    布尔检索和有序检索(排序检索模型)对应

    布尔检索:

    • query:精确的逻辑表达式
    • 结果:无序
    • 布尔操作符的扩展
      • 邻近操作符:term的距离在文档中接近(中间含有几个词,来表征接近的程度
    • 专业人士更喜欢布尔检索:查询精确,控制力和透明度
      • 排序:按时间。。。

    有序检索

    • query:不像逻辑表达式这么精确,采用一个或多个词构建(自由文本查询)
    • 结果:有序

    要点

    • term:提供,容忍拼写错误,词语表达不一致(语义相同)
    • 复合词和短语:(Gates Near Microsoft)
    • 相似度:布尔查询仅记录存在与否,但是我们需要得到文档相关的可靠程度
      • 词项频率:term在doc中的频率高,权重高
    • 排序

    ad hoc search:

    • 大搜、电商搜索。。。
    • 部分支持布尔操作,专业人士喜欢,大多人用的少
    展开全文
  • 信息检索(IR)—信息检索模型(二)

    千次阅读 2020-05-07 22:05:58
    1 扩展布尔模型 1.1 模型引入 在之前的文章中,我们介绍了信息检索中的布尔模型,在布尔模型中我们基于关键词的布尔表达式进行匹配,在匹配的过程的中,我们只能够保证关键词的逻辑关系是否符合布尔表达式,但是确...

    信息检索(IR)—信息检索模型(二)

    接上一篇文章:

    1. 信息检索(IR)—信息检索模型(一)

    1 扩展的布尔模型

    1.1 模型引入

    在之前的文章中,我们介绍了信息检索中的布尔模型,在布尔模型中我们基于关键词的布尔表达式进行匹配,在匹配的过程的中,我们只能够保证关键词的逻辑关系是否符合布尔表达式,但是确不能确定无法区别出结果的差异性。

    在这里插入图片描述

    为了体现出返回结果的差异性,我们这里使用布尔模型和向量空间模型进行结合。在这个过程中,首先利用布尔模型获取返回结果,在用向量空间模型对返回结果进行排序。

    这种方式的问题在于,我们应该如何选择一个布尔查询式?如果对于布尔查询采用“与”的操作,则返回的结果可能太少,因此可能会影响了后面的排序过程。如果采用“或”应用于布尔表达式,这样就和单纯的使用向量空间模型没有区别了。所以,这里我们使用扩展的布尔模型。

    1.3 扩展布尔模型中的“或”

    首先,我们给定一个或关系的查询式: x ∨ y x∨y xy,假设文档 d j d_j dj中x和y的权重被归一化在(0,1)区间之内,则有如下的计算过程:
    w x , j = t f x , j / m a x l ( t f l , j ) ∗ i d f x / m a x i ( i d f i ) w_{x,j}=tf_{x,j}/max_l(tf_{l,j})*idf_x/max_i(idf_i) wx,j=tfx,j/maxl(tfl,j)idfx/maxi(idfi)
    s i m ( q o r , d j ) = [ ( x 2 + y 2 ) / 2 ] 0.5 , w h e r e , x = w x , j , a n d , y = w y , j sim(q_{or},d_j)=[(x^2+y^2)/2]^{0.5},where ,x=w_{x,j},and ,y=w_{y,j} sim(qor,dj)=[(x2+y2)/2]0.5where,x=wx,j,and,y=wy,j

    在这里插入图片描述

    1.4 扩展布尔模型中的“与”关系

    给定一个查询式的形式 x ∧ y x∧y xy,给定相似度计算公式为:
    s i m ( q a m d , d j ) = 1 − { [ ( 1 − x ) 2 + ( 1 − y ) 2 ] / 2 } 0.5 sim(q_{amd},d_j)=1-\{[(1-x)^2+(1-y)^2]/2\}^{0.5} sim(qamd,dj)=1{[(1x)2+(1y)2]/2}0.5

    在这里插入图片描述

    1.5 扩展的布尔模型相似度计算实例

    在这里插入图片描述

    1.6 观察分析

    在这里插入图片描述

    1.7 P-norm

    最后,我们可以将查询式扩展成多个关键词构成的布尔形式,也可将幂进行扩展,具体形式如下:

    在这里插入图片描述

    2 基于语言模型的信息检索模型

    2.1 语言模型回顾

    本文不是重点叙述语言模型的文章,所以这里我们只是简单的进行回顾,有兴趣的读者可以参考其他的文章进行具体的了解。

    首先,语言模型的基本作用是根据序列历史的N-1个词来预测当前词,在语言模型中,某个句子产生的概率为:
    p ( S ) = p ( w 1 , w 2 , w 3 , . . . , w n ) = p ( w 1 ) p ( w 2 ∣ w 1 ) p ( w 3 ∣ w 1 , w 2 ) , . . . . , p ( w n ∣ w 1 , w 2 , . . . , w n − 1 ) p(S)=p(w_1,w_2,w_3,...,w_n)=p(w_1)p(w_2|w_1)p(w_3|w_1,w_2),....,p(w_n|w_1,w_2,...,w_{n-1}) p(S)=p(w1,w2,w3,...,wn)=p(w1)p(w2w1)p(w3w1,w2),....,p(wnw1,w2,...,wn1)

    具体的来讲,根据所依赖的历史的词的数量的不同,N-gram语言模型中的N可以取不同的值。假设N=3,模型称为trigram,其基本的计算形式如下:

    p ( w i ∣ w 1 , w 2 , . . . , w i − 1 ) ≈ p ( w i ∣ w i − 2 w i − 1 ) p(w_i|w_1,w_2,...,w_{i-1})≈p(w_i|w_{i-2}w_{i-1}) p(wiw1,w2,...,wi1)p(wiwi2wi1)

    假设N=1,模型称为unigram,其基本的计算过程如下:
    p ( S ) = p ( w 1 w 2 , . . . , w n ) = p ( w 1 ) p ( w 2 ) , . . . , p ( w n ) p(S)=p(w_1w_2,...,w_n)=p(w_1)p(w_2),...,p(w_n) p(S)=p(w1w2,...,wn)=p(w1)p(w2),...,p(wn)
    在一元的语言模型中,所有在词表中的词,遵循多项式分布:
    ∑ w ∈ V p ( w ) = 1 ∑_{w∈V}p(w)=1 wVp(w)=1

    2.2 信息检索中的语言模型

    2.2.1 Query Likelihood

    信息检索的任务是根据文档与查询之间的相关性,对文档进行排序:
    p ( D ∣ q ) = p ( q ∣ D ) p ( D ) p ( q ) ∝ p ( q ∣ D ) p(D|q)=\frac{p(q|D)p(D)}{p(q)}∝p(q|D) p(Dq)=p(q)p(qD)p(D)p(qD)
    这里,如果采用词汇之间的独立性假设,则有:
    p ( w 1 , w 2 , . . , w n ∣ D ) = ∏ w ∈ q p ( w ∣ M D ) p(w_1,w_2,..,w_n|D)=∏_{w∈q}p(w|M_D) p(w1,w2,..,wnD)=wqp(wMD)
    其中 w 1 , w 2 , . . , w n w_1,w_2,..,w_n w1,w2,..,wn构成了查询q。 M D M_D MD表示文档D中的语言模型。

    现在,假设每一个文档D对应一个语言模型 M D M_D MD,然后我们来估计由这个语义模型来生成一个查询的可能性。因此,这个任务就变成了估计一个精确的语言模型 M D M_D MD。并且根据计算出来的可能性的值,我们可以对文档的相关性进行排序:

    在这里插入图片描述

    2.2.2 从文档D中构建语言模型

    这个过程就是从文档中根据设定的N-gram进行统计:

    在这里插入图片描述

    2.2.3 IR中的LM总结

    文档语言模型:

    每个文档对应一个统计语言模型,称为文档的语言模型。它描述了该文档中的各个单词的统计分布的特征。因此每一个文档看作是由其他的语言模型抽样产生的一个样本。

    基于文档的语言模型来计算出现概率:

    一个查询式也可以看做是由文档的语言模型抽样产生的一个样本。因此,可以根据每个文档的语言模型抽样生成检索的概率来对其进行排序,其概率值越大,则该文档就越满足该检索需求。

    2.3 举例说明

    在这里插入图片描述
    根据上面的计算结果,我们不难发现,文档2和检索更加的相关。

    2.4 局限性

    上面的计算过程是假定query中的各个词汇都在文档中出现了,我们下面来考虑一种其他的情况,假设query中的某个词并没有在文档中出现,那么就有 P ( w ∣ M D ) = 0 P(w|M_D)=0 P(wMD)=0,那么整个query计算出来的相似性结果也就不存在了。例如下面的情况:

    在这里插入图片描述

    当时,这种计算结果显然是不能满足需求的。所以,我们接下来就要简单的介绍几种语言模型中的平滑方法。

    2.5 平滑方法

    2.5.1 加一平滑

    p ( w ∣ M D ) = n w + 1 ∑ w ∈ V n w + w p(w|M_D)=\frac{n_w+1}{∑_{w∈V}n_w+w} p(wMD)=wVnw+wnw+1
    这种平滑的思想是在所有的N-gram单元中加1,在计算概率的时候,分母加上词表的大小。

    2.5.2 “劫富济贫”

    这是一种平滑的思想,在一个query中,“the”,“for”等冠词和介词在文档中所占的比重很大,而query中的关键词在文档中所占的比重比较小,甚至为0。通过这种思想,我们可以降低无关词汇的权重,提高关键词汇的权重。具体的方法可以参考其他文章。

    3 基于本体论的信息检索模型

    3.1 本体论的概念

    本体论最早是哲学的分支,研究客观事物存在的本质。本体的含义是形成现象的根本实体。是客观存在的一个系统的解释或者说明,关心的是客观现实的抽象本质。它与认识论相对应,认识论研究人类知识的本质和来源。

    3.2 本体的分类和内容

    本体的分类:

    本体是采用某种语言对概念化的描述,本体的分类按照表示和描述形式化程度不同。可以分成:完全非形式化的,半形式化的,严格形式化,形式化程度越高,越有利于计算机进行自动处理。

    本体的内容:

    从概念化对象的定义来看,一个领域的术语,术语的定义以及各个术语之间的语义网络,应该是任意一个领域本体论所必须包含的基本信息。

    概念之间的关系包括:

    1. 同义关系:表达了在相似数据源之间的一种等价关系,是一种对称关系。
    2. 上下位关系:不对称的,是一种偏序关系,具有传递性。
    3. 其他各种语义关系。

    各个概念之间的复杂的语义关系组成了语义网络图,概念在其中表现为节点,而节点之间的边代表了上述关系。

    上下位关系如下图所示:

    在这里插入图片描述

    语义网络如下图所示:

    在这里插入图片描述

    3.3 基于本体的检索过程

    1. 用户向信息检索系统提出检索申请。
    2. 信息检索系统产生一个界面和用户进行交互。界面接收用户提出的查询关键字后,系统查询本体库,从中找出出现该关键字的各个领域,然后将其领域已经在该领域下的关键字的含义罗列给用户。
    3. 用户可以根据自己的意图,在界面上确定所需查找的领域和含义。
    4. 系统将经过本体规范之后的请求交给全文搜索引擎进行检索。
    5. 全文搜索引擎检索之后返回给用户检索信息。

    4 参考

    1. 哈工大—信息检索
    展开全文
  • 布尔文献检索模型简介

    千次阅读 2019-08-01 16:36:25
    在没有网络的时候,手头能访问的信息量太少是个问题。现在有了网络,怎么在海量的数据中找到自己需要的信息是另一...布尔逻辑将是建立最早的模型,也是目前应用最广泛的检索技术。它是通过布尔逻辑运算符:逻辑与(A...
  • 对现有信息检索系统难以按查询需求处理检索文档的问题,...提出的模型通过相关反馈和查询词扩展,能克服传统方法无法计算文档与查询词之间的相似度的问题,并能有效处理检索文档。仿真结果证明了该模型有效性和可行性。
  • 多值模型是传统布尔模型扩展。与布尔模型相比,多值模型更适合对包含不确定和不一致信息的软件系统进行建模。为了解决模型检测时的状态爆炸问题,研究了对基于双格的多值模型的对称化简方法。提出了一种新的多值模型...
  • ThreeBSP.js 是 three.js 的一个扩展库,可以实现对模型的数学布尔运算,实际上就是个个点的重新组合和拆分,来重新生成 几何体对象和网格模型。 本实示例浏览地址:...
  • 文中重点介绍了ArcGIS MultiPatch三维技术,提出了一种基于ArcGIS MultiPatch三维...该方法具有很大的灵活性与弹性,能够更大程度地满足专业需求,具有很好的扩展性,此方法为煤矿虚拟现实系统的建立提供了新的解决方案。
  • 搜索引擎的检索模型-查询与文档的相关度计算1. 检索模型概述      搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度。实际搜索结果排序的因子有很...
  • Archimatix为艺术家提供的主要产品是其丰富的2D形状操作,例如2D布尔值,偏移,舍入和加粗。生成的复合形状可用于生成精细的网格以及分布对象的路径。 Archimatix Pro现在提供了运行时功能,因此您可以将Archimatix...
  • 博主准研究僧一枚,本博文可作为坐标转换,特别是布尔莎七参数法的学习资料。其python源码注释充分,也可作为python的学习项目。程序UI界面如下,由于是自用程序,博主对美化UI不感兴趣,ui部分源码注释充分,颜控可...
  • &符号集合休息混合 用于扩展mixin,具有按多个属性排序和升序/降序的能力。 在向集合中添加新模型或调用 sort() 方法时执行排序。安装 npm install ampersand-collection-sort-mixin用法mixin 使用存储在会话属性中...
  • 该方法对地形及采场模型采用扩展边界内局部更新方法,实现采动范围内新旧两期DEM无缝拼接;地质模型则采用重构方法,将新增的写实数据作为新的样本点,重新进行空间插值,重构地层及地质体模型;更新后的地形、地质实体...
  • 生物神BioDivine是用于操纵,分析,验证和验证生物模型的工具集。 BioDivine提供三个功能级别: 工具和工具集成: BioDivine工具专为满足特定任务而设计,可以满足用户的需求,提供适合“点击”分析的图形界面,...
  • 将负关联规则引入到查询扩展研究中,提出了新的查询扩展模型,并设计了一种基于正负关联规则的快速查询扩展算法。该算法通过对文本事务数据库的布尔化表示及数据结构的合理分配,采用向量内积策略来产生频繁和非频繁...
  • 多值模型是传统布尔模型扩展。与布尔模型相比,多值模型更适合对包含不确定和不一致信息的软件系统进行建模。为了解决模型检测时的状态爆炸问题,研究了对基于双格的多值模型的对称化简方法。提出了一种新的多值...
  • json-扩展 设计用于 JSON 数据的深度扩展实用程序。...如果您使用 JSON API 来填充您的应用程序模型,则需要处理的类型较少,因此该库可以优化处理这些情况(对象、数组、布尔值、字符串、数字和空值)。
  • 数据模型(Data Model)是; 数据特征的抽象,是数据库管理的教学形式框架。数据库系统中用以提供信息表示和操作手段的形式构架。数据模型包括数据库数据的结构部分、数据库数据的操作部分和数据库数据的约束条件。 1...
  • 37 WebGL多个模型组成一个复杂的模型

    千次阅读 2017-06-10 23:14:33
    案例查看地址:点击这里<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"...width=device-width, user-scalable=n
  • 深度学习入门,keras实现回归模型

    千次阅读 2021-11-02 14:03:30
    让我们扩展我们的房价数据: # find the largest house price in the training set and use it to # scale our house prices to the range [0, 1] (this will lead to # better training and convergence) maxPrice...
  • 这个acts_as扩展提供了拥有一个默认对象的能力。 具有此指定的类需要在映射的数据库表上将默认列定义为整数、字符串或布尔值。 还可以选择支持每个记录具有另一个模型的默认对象。 安装 在你的 Gemfile 中 gem '...
  • 本文仅做《信息检索技术》期末预习使用,内容简略仅做大纲使用,期末抱佛腿的孩子请另寻...布尔模型的定义 文档表示:关键词的集合(bag of words) 查询表示(queries) 相关度计算 检索策略:二值匹配 布尔模...
  • 从采集视频中提取帧图像,应用梯度算子进行滤波处理划分得到焦平面范围,同时,提出结合数学形态学方法在小范围内消除焦平面区域的不连续性,扩展焦平面范围,使得不能检测到的焦平面得到较好的处理。通过布尔代数...
  • 搜索引擎的检索模型-查询与文档的相关度计算
  • yesterpage-crx插件

    2021-04-03 22:17:39
    我们人类寻求信息的方式并非严格遵循由布尔语句链组成的标准布尔模型,而是Berrypicking的更多内容:“贝茨认为搜索在不断发展,并会一点一点地发生。也就是说,一个人不断响应于从信息检索系统返回的结果而更改其...
  • 科技趣报道2019-09-19 16:59:36目前最常用的三...数据修改和数据库扩展容易实现;检索关键属性十分方便。二、网状模型网状模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式。优点是...
  • 例如,可以通过从系数构建多项式特征来扩展简单的线性回归。 在标准线性回归情况下,对于二维数据,您可能有一个类似于下面的模型: 如果我们想要将抛物面拟合到数据而不是平面,我们可以组合二阶多项式中的...
  • django的User模型和四种扩展/重写方法

    千次阅读 2018-08-20 11:47:07
    User模型 User模型是这个框架的核心部分。他的完整的路径是在django.contrib.auth.models.User。以下对这个User对象做一个简单了解: 字段: 内置的User模型拥有以下的字段: username: 用户名。150个字符以内...
  • 模型检测工具汇总(比较全)

    千次阅读 多人点赞 2019-09-23 17:09:21
    面向形式化规格语言的模型检测工具 SMV(Symbolic Model Verifier) 符号模型检测工具 SMV用以检测一个有限状态系统是否满足CTL公式。 它的建模方式是以模块为单位,模块可以同步或异步组合,模块描述的基本...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 39,717
精华内容 15,886
关键字:

扩展布尔模型