精华内容
下载资源
问答
  • 数据库检索: 1(性能):使用like搜索,会对表中的数据进行全表扫描 2(匹配度准确度):select * from table where 字段 like '%关键词%'; 3(相关度排序): 全文检索: ...3(相关度排序):

    数据库检索:

    1(性能):使用like搜索,会对表中的数据进行全表扫描

    2(匹配度准确度):select * from table where 字段 like '%关键词%';

    3(相关度排序):搜索的时候想要那条结果排在那个位置不能由我们决定,只能通过order by 字段名,字段名.....查询的结果来显示

    全文检索:是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时根据建立的索引查找!

    1(性能):我们搜索的时候直接根据索引找到对应的数据(我们需要对数据建立索引,但是索引是一次建立,多次使用)

    2(匹配度准确度):建立的索引都是文档当中出现了的关键字,不会出现一些不相干的数据

    3(相关度排序):lucene为每一条匹配的结果打一个分,得分越高,排列的顺序越靠前


    展开全文
  • 为了提高内容检索相关度与十盒索效率。基于信息系统理论与自组织神经网络理论,提出基于智能聚类的相关度榆索疗法。并设汁了检索钟。法。经过训练的自组织神经问络通过对查询需求进行聚类,使得内容的检索只在与奄...
  • 为了解决关键字信息检索语义缺失问题,提出了一种基于相关度的关键词语义信息检索方法。该方 法通过考查文档中的词语、概念之间关系(内在联系)和文档与文档之间关系(外部联系)的相关度,提出了一种词语-概念相关度的...
  • 在网络环境下,经典的链接分析方法(HITS算法)过多的关注网页的权威性,忽视了其主题相关度,易产生主题漂移现象。在简要介绍HITS算法的基础上,分析了其产生主题漂移的原因,并结合内容相关度评价方法,提出了一种...
  • 搜索引擎的检索模型-查询与文档的相关度计算
                   


    1. 检索模型概述

          搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度。实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况。这里我们主要总结网页内容和用户查询相关的内容。

           判断网页内容是否与用户査询相关,这依赖于搜索引擎所来用的检索模型。检索模型是搜索引擎的理论基础,为量化相关性提供了一种数学模型,是对查询词和文档之间进行相似度计算的框架和方法。其本质就是相关度建模。如图所示,检索模型所在搜索引擎系统架构位置:

       

        

        当然检索模型理论研究存在理想化的隐含假设,及即假设用户需求已经通过查询非常清晰明确地表达出来了,所以检索模型的任务不涉及到对用户需求建模。但实际上这个和实际相差较远,即使相同的查询词,不同用户的需求目的可能差异很大,而检索模型对此无能为力。

       

    2. 检索模型分类

       大学学习的《数学模型》(姜启源第三版),现在还有点印象。数学模型将现实问题归结为相应的数学问题,并在此基础上利用数学的概念、方法和理论进行深入的分析和研究,从而从定性或定量的角度来刻画实际问题,并为解决现实问题提供精确的数据或可靠的指导。
        所以我们从所使用的数学方法上分:
    1)基于集合论的IR模型(Set Theoretic models)
         布尔模型
         基于模糊集的模型
         扩展布尔模型
    2)基于代数论的IR模型(Algebraic models)
         向量空间模型
         潜性语义索引模型
         神经网络模型
    3)基于概率统计的IR模型(Probabilistic models)
         回归模型
         概率模型
         语言模型建模IR模型
         推理网络模型
         信任度网络模型

    此外还有基于统计的机器学习排序算法
    这里主要介绍 布尔模型,向量空间模型,概率模型,语言模型,机器学习排序算法


    3. 布尔模型

    布尔模型:

            是最简单的信息检索模型,是基于集合理论和布尔代数的一种简单的检索模型。

    基本思想:

        文档和用户查询由其包含的单词集合来表示,两者的相似性则通过布尔代数运算来进行判定;

    相似度计算:

             查询布尔表达式和所有文档的布尔表达式进行匹配,匹配成功的文档的得分为1,否则为0。 

             如查询词:

                     苹果 and (iphone OR Ipad2)

             文档集合:

             D1:IPhone 5于9月13号问世。

             D2: 苹果公司于9月13号发布新一代IPhone。

             D3:Ipad2将于3月11日在美上市。

             D4:Iphone和ipad2的外观设计精美时尚

             D5:80后90后都喜欢iphone,但不喜欢吃苹果。

             那么单词与文档关系如下图:

        

             检索结果就是D2和D5符合搜索条件。
           这类似于传统数据库检索,是精确匹。一些搜索引擎的高级检索往往是使用布尔模型的思想。如Google的高级检索。

    优点:
          在于形式简洁、结构简单。

    缺点:

         1)准确的匹配可能导致检出的文档过多或过少。因为布尔模型只是判断文档要么相关、要么不相关,它的检索策略基于二值判定标准,无法描述与查询条件部分匹配的情况。因此,布尔模型实际上是一个数值检索模型而不是信息检索模型。

         2)尽管布尔表达式有确切的语义,但通常很难将用户的信息需求转换成布尔表达式。如今,人们普遍认为,给索引词加权能极大地改善检索效果。从对索引词加权的方法中引出了向量模型。

    4. 向量空间模型(Vector Space Model,VSM)

    向量空间模型:
        康奈尔大学Salton等人上世纪70年代提出并倡导,原型系统SMART   

    基本思想:

        把文档看成是由t维特征组成的一个向量,特征一般采用单词,每个特征会根据一定依据计算其权重,这t维带有权重的特征共同构成了一个文档,以此来表示文档的主题内容。

    相似性计算:

        计算文档的相似性可以采用Cosine计算定义,实际上是求文档在t维空间中查询词向量和文档向量的夹角,越小越相似;对于特征权重,可以采用Tf*IDF框架,Tf是词频,IDF是逆文档频率因子指的是同一个单词在文档集合范围的出现次数,这个是一种全局因子,其考虑的不是文档本身的特征,而是特征单词之间的相对重要性,特征词出现在其中的文档数目越多,IDF值越低,这个词区分不同文档的能力就越差,这个框架一般把Weight=Tf*IDF作为权重计算公式。

    思路:

    1)向量表示:
        文档Dj的向量可以表示为Dj(w1j, w2j ,⋯,wnj ) ,其中n是系统中的单词数目,wij 代表了标引词i在文档Dj中的权重。
        查询Q的向量可以表示为Q(w1q, w2q ,⋯,wnq ) ,wiq代表了单词i在查询Q中的权重
     2)文档-单词矩阵(Doc-Term Matrix)
       n
    篇文档,m个标引词构成的矩阵Am*n,每列可以看成每篇文档的向量表示,同时,每行也可以可以看成单词的向量表示:
       

        

    3)权重计算:
           布尔权重:标引词i在文档j中的权重wij =0或1(出现则取1,否则取0)
           TF权重:TF(Term Frequency)是单词在文档中出现的次数。权重wij = TFij或者归一化后的TF值
           TF的归一化(Normalization):将一篇文档中所有的标引词的TF值归一化到[0,1]之间。通常可以采用以下方式之一:
               1: Wtf = 1 + log(TF)
               2:Wtf = a + (1- a)*  TF /Max(TF) 其中a为调节因子,经验取值a=0.5 最新研究表明是0.4效果更好。
       
           单词的文档频率DF(Document Frequency)单词在整个文档集合中出现的文档篇数,DF反映了单词的区分度, DF越高表示单词越普遍,因此其区分度越低,其权重也越低。
            逆文档频率(Inverse DF ,IDF):DF的倒数,通常采用如下公式计算:(N是文档集合中所有文档的数目)
             
        
    3) 计算权重向量空间模型中通常采用TF* IDF的方式计算权重,即标引词i在文档dj的权重Wij = TFij * IDFij .
    4)  相似度计算:文档和查询词的相关程度(即相似度)可由它们各自向量在向量空问中的相对位置来决定。相似度计算函数有很多种,较常用的是两个向量夹角的余弦函数。

      
         由向量的数量积定义:两个向量的数量积(又称“内积”、“点积”,物理学上称为“标量积”。)是一个数量,记作a·b。若ab不共线,则a·b=|a|·|b|·cos〈ab〉。
         其意义:两向量的数量积等于其中一个向量的模与另一个向量在这个向量的方向上的投影的乘积。我们把|b|cosθ叫做向量b在向量a的方向上的投影。
         两向量ab的数量积:a·b=|a|*|b|cosθ;其中|a|、|β|是两向量的模,θ是两向量之间的夹角(0≤θ≤π)。
         若有坐标a(x1,y1,z1) ;b(x2,y2,z2),那么a·b=x1x2+y1y2+z1z2; |a|=sqrt(x1^2+y1^2+z1^2);|b|=sqrt(x2^2+y2^2+z2^2)。

         依定义有:cos〈a,b〉=a·b / |a|·|b|);若a、b共线,则a·b=+-∣a∣∣b∣。
         其性质:
         1)a
    ·a=|a|的平方。   
         2)ab 〈=〉a·b=0。   

         于是文档和提问的相似度值由以下公式获得:
           
            理解Cosine相似性,可以讲每个文档以及查询看做t维特征空间的一个数值点。每个特征形成t维空间中的一个维度,链接特征空间原点和这个数值点形成一个向量,而Cosine相似性就是计算特征空间中两个向量之间的夹角。这个夹角越小,说明两个特征向量内容越相似。极端的情况就是两个完全相同的文档,其在向量空间中的两个向量是重叠的,Cosine相似性值为1.
     
    举例:  
              查询q(<2006:1>,<世界杯:2>)
           文档d1(<2006:1>,<世界杯:3>,<德国:1>,<举行:1>)
           文档d2(<2002:1>,<世界杯:2>,<韩国:1>,<日本:1> <举行:1>)
           倒排索引列表:
          
            
        
           查询和文档进行向量的相似度计算:
           采用内积
           文档d1和q的内积:1*1+3*2=7
           文档d2和q的内积:2*2=4
           夹角余弦:
           文档d1和q的夹角余弦:
           文档d2和q的夹角余弦:

    优点:1) 简洁直观,可以应用到很多其他领域(文本分类、生物信息学),邮件过滤系统spamAssass。
               3) 支持部分匹配和近似匹配,结果可以排序
               4) 检索效果不错
    缺点:1) 计算量大
               2) 单词的不同位置会代表不同的权重,而不同的关键词长度也会影响权重的大小
               3) 单词之间的独立性假设与实际不符:实际上,单词的出现之间是有关系的,不是完全独立的。如:“王励勤”“乒乓球”的出现不是独立的


    5. 概率模型

    概率模型:

        是目前效果最好的模型之一,okapi BM25这一经典概率模型计算公式已经在搜索引擎的网页排序中广泛使用。概率检索模型是从概率排序原理推导出来的。

       

    基本假设前提和理论:
        1).相关性独立原则:文献对一个检索式的相关性与文献集合中的其他文献是独立的。
        2).单词的独立性:单词和检索式中词与词之间是相互独立。即文档里出现的单词之间没有任何关联,任一单词在文档的分布概率不依赖其他单词是否出现
        3).文献相关性是二值的:即只有相关和不相关两种。
        4).概率排序原则:该原则认为,检索系统应将文档按照与查 询的概率相关性的大小排序,那么排在最前面的是最有可能被获取的文档
        5).贝叶斯(Bayes)定理:用公式表示为:
          P(R|d)=(d|R)·P(R)/P(d)

    基本思想是:

        是通过概率的方法将查询和文档联系起来,给定一个用户查询,如果搜索系统能够在搜索结果排序时按照文档和用户需求的相关性由高到底排序,那么这个搜索系统的准确性是最优的。在文档集合的基础上尽可能准确地对这种相关性进行估计就是其核心。

    相似度计算:
        将查询Q和文档D根据有没有单词表示为二值向量,Q={q1,q2,…},D={d1,d2,…},di=0或1表示文献中没有或有第i个单词. 用R表示文献相关,表示文献不相关.
        条件概率P(R|dj )表示文档 dj与查询qi相关的概率

        条件概率P(|dj)表示文档dj与查询qi不相关的概率

        利用它们的比值计算文档与查询的相似度。
        若P(R|d)> P( |d),即比值大于1,则文献相关程度大于不相关程度,认为文献d是相关的,否则认为文献d不相关。在两者相等时,人为地认为它是不相关的。

    优点:
       1.采用严格的数学理论为依据,为人们提供了一种数学理论基础来进行检索决策;PubMed的related articles 。
       2.采用相关反馈原理
       3.在其中没有使用用户难以运用的布尔逻辑方法;
       4.在操作过程中使用了词的依赖性和相互关系。
    缺点:
       1.计算复杂度大,不适合大型网络
       2.参数估计难度较大
       3.条件概率值难估计
       4.系统的检索性能提高不明显,需与其他检索模型结合

    6. 语言模型

    语言模型:
        是借鉴了语音识别领域采用的语言模型技术,将语言模型和信息检索模型相互融合的结果
    基本思想:
        其他的检索模型的思考路径是从查询到文档,即给定用户查询,如何找出相关的文档,该模型的思路正好想法,是由文档到查询这个方向,即为每个文档建立不同的语言模型,判断由文档生成用户查询的可能性有多大,然后按照这种生成概率由高到低排序,作为搜索结果。语言模型代表了单词或者单词序列在文档中的分布情况;

    7. 机器学习排序算法

    机器学习排序算法
        随着搜索引擎的发展,对于某个网页进行排序需要考虑的因素越来越多,这是无法根据人工经验完成的,这时候用机器学习就是非常合适的,例如Google目前的网页排序公式考虑了200多种因子。机器学习需要的数据源在搜索引擎中较好满足,例如用户的搜索点击记录。其分成人工标注训练、文档特征抽取、学习分类函数以及在实际搜索系统中采用机器学习模型等4个步骤组成。人工标注训练可由用户点击记录来模拟人为对文档相关打分的机制。





               

    再分享一下我老师大神的人工智能教程吧。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow

    展开全文
  • 这是一个文本检索(Text Retrieve)问题,常用策略是据搜索词对文本库中的文本排序,并选取最相关的返回。下面使用简单易用的BM25算法来实现相似度打分。 Q:Query 输入的查询语句 q:query 查询语句的词 D:Document ...


    在网络中有各种各样的讯息,搜索引擎可以精准、快速、高效的帮我们获取自己想要的信息。其中召回排序是搜索引擎中最重要的两部分。

    Q:Query 输入的查询语句
    q:查询语句的词
    D:Document 文本库中的所有文本
    d:文本库中的某一篇文本
    G:Goods商品库中的所有商品
    g:商品库中的某一商品

    1. 召回
      根据用户输入的Query语句进行分词,通过倒排索引的方式从已有的候选库中召回相关的网页或商品。

    2. 排序

    • 离线部分:通常会先根据业务要求如:网页的质量、浏览时长、销量、加购次数等因素对所有网页或商品进行打分获得基础分 base_score
    • 在线部分:使用VSM、BIM、BM25、BM25F等模型获取搜索词和已召回的网页或商品的相关度 Correlation,最后综合基础分和相关度进行排序并返回最相关的TopK

    BIM模型(二元独立模型)

    BM25是基于概率检索模型BIM的改进,或者说BIM(简化后的BIM)是BM25模型的一个项,而BM25F又是基于BM25模型的改进。所以在学习BM25模型之前我们先来了解一下BIM模型。

    BIM模型介绍

    BIM模型有两个假设:二元假设和词汇独立性假设

    • 二元假设

    类似于布尔模型的方法,一篇文章由特征(或单词)表示时,以特征(或单词)的"出现"和"不出现"两种情况来表示,也可以理解成"相关" P(D|R) 和"不相关" P(D|NR) 。

    • 词汇独立性假设

    词汇独立性假设是指文档中出现的词之间没有任何关联,一个词出现的概率不受其他词的影响。

    BIM模型公式

    相关性概率P(D|R)/ P(D|NR) 在上述两个假设的前提下,基于贝叶斯公式、条件概率、左右两边log、分子分母做平滑处理等一系列操作,最终得到BIM公式(中间步骤不是本文讨论的重点,我们在此直接给出最终的公式)

    BIM公式的意义

    • N为全文本总数
    • qi为Q查询语句中的查询词
    • di=1为该查询词是相关的
    • di=0为该查询词是不相关的
    • ni为包含该查询词的文本数
    • R为相关文本数
    • N-R为不相关文本数
    • ri为包含该查询词的文本数

    公式表示了:累加每个同时出现在Q查询语句和候选文档d中的词的估值,就是Q和d的最终相似度

    简化BIM公式

    有些情况下是不确定哪些文档是相关或不相关的,此时可以给公式的估算因子直接赋予固定值,这样就可以简化公式(简化后类似于IDF):

    BM25模型

    BM25模型是在BIM模型基础上加入了Query语句中的每个词在查询语句和候选文本的权值,并通过实验引入经验参数。

    在这里插入图片描述
    完整的BM25模型公式分为三个部分:

    1. 第一部分是二元独立模型的计算得分
    2. 第二部分是Query词在候选文本的权值
    3. 第三部分是Query词在查询语句的权值

    BM25F模型

    • BM25F模型对BM25模型进行了改进,BM25模型在计算相关性时把文本作为整体,没有考虑到不同区域重要程度不同的问题。
    • BM25F对文档分成多个区域,对不同的域进行加权统计,如文档的标题、内容、主题词被赋予不同的权重,在不同的域中对每个词的各个指标(词频、文本长度等)进行加权求和求得最终结果。

    展开全文
  • 为了更好地实现图像的对比增强,提出了一种基于图像检索的对比增强模型。利用图像检索技术检索到与待增强图像内容相似的高质量图像作为参考图像指导图像增强。通过结合上下文相关、上下文不相关,以及亮度调整等...
  • 针对信息检索中如何提高检索的精度问题,提出了一个基于相关反馈的视频检索算法。使用概率框架来描述检索问题,并根据贝叶斯...实验表明,用该算法检索的准确比基于最近邻特征线(NFL)的视频检索方法有明显提高。
  • 相关度排序

    千次阅读 2017-10-15 21:33:41
    相关度排序 1.1 什么是相关度排序 相关度排序是查询结果按照与查询关键字的相关性进行排序,越相关的越靠前。比如搜索“Lucene”关键字,与该关键字最相关的文章应该排在前边。  1.2 相关度打分 Lucene对查询...

    相关度排序

    1.1 什么是相关度排序

    相关度排序是查询结果按照与查询关键字的相关性进行排序,越相关的越靠前。比如搜索Lucene”关键字,与该关键字最相关的文章应该排在前边。

     1.2 相关度打分

    Lucene对查询关键字和索引文档的相关度进行打分,得分高的就排在前边。如何打分呢?Lucene是在用户进行检索时实时根据搜索的关键字计算出来的,分两步:

    1计算出词(Term)的权重

    2根据词的权重值,计算文档相关度得分。

     什么是词的权重?

    通过索引部分的学习,明确索引的最小单位是一个Term(索引词典中的一个词),搜索也是要从Term中搜索,再根据Term找到文档,Term对文档的重要性称为权重,影响Term权重有两个因素:

    Term Frequency (tf)

    指此Term在此文档中出现了多少次。tf越大说明越重要。

    (Term)在文档中出现的次数越多,说明此词(Term)对该文档越重要,如“Lucene”这个词,在文档中出现的次数很多,说明该文档主要就是讲Lucene技术的。

     Document Frequency (df)

    指有多少文档包含次Termdf越大说明越不重要。

    比如,在一篇英语文档中,this出现的次数更多,就说明越重要吗?不是的,有越多的文档包含此词(Term),说明此词(Term)太普通,不足以区分这些文档,因而重要性越低。

    1.3 设置boost值影响相关度排序

    boost是一个加权值(默认加权值为1.0f),它可以影响权重的计算。

     l 在索引时对某个文档中的field设置加权值高,在搜索时匹配到这个文档就可能排在前边。

    l 在搜索时对某个域进行加权,在进行组合域查询时,匹配到加权值高的域最后计算的相关度得分就高。

     设置boost是给域field)或者Document设置的。

    1.3.1 在创建索引时设置

    如果希望某些文档更重要,当此文档中包含所要查询的词则应该得分较高,这样相关度排序可以排在前边,可以在创建索引时设定文档中某些域(Field)的boost值来实现,如果不进行设定,则Field Boost默认为1.0f一旦设定,除非删除此文档,否则无法改变

     1.3.1.1 代码实现

    @Test

    public void setBoost4createIndex()throws Exception {

    // 创建分词器

    Analyzer analyzer = new StandardAnalyzer();

     IndexWriterConfig cfg = new IndexWriterConfig(Version.LUCENE_4_10_3,

    analyzer);

    Directory directory = FSDirectory.open(new File("E:\\11-index\\0728"));

    // 创建IndexWriter对象,通过它把分好的词写到索引库中

    IndexWriter writer = new IndexWriter(directory, cfg);

     Document doc = new Document();

    Field id = new StringField("id","11", Store.YES);

    Field description = new TextField("description","测试设置BOOSTlucene",

    Store.YES);

    // 设置boost

    description.setBoost(10.0f);

    // 把域添加到文档中

    doc.add(id);

    doc.add(description);

    writer.addDocument(doc);

    // 关闭IndexWriter

    writer.close();

    }

     1.3.1.2 输出


     1.3.2 在查询索引时设置

    MultiFieldQueryParser创建时设置boost


    展开全文
  • 公司老总昨天提出了一个需求,希望根据商品的风格标签来推荐相关商品,越是标签相同高的商品就排序在前。 一个商品可能有多个标签。比如:嘻哈、激情派、牛仔,那么有这三个标签的商品就优先显示。 以前看过有一个...
  • 11Lucene相关度排序

    2019-05-10 11:19:37
    什么是相关度排序 相关度排序是查询结果按照与查询关键字的相关性进行排序,越相关的越靠前。比如搜索“Lucene”关键字,与该关键字最相关的文章应该排在前边。 相关度打分 Lucene对查询关键字和索引文档的相关度...
  • 为了提高PageRank算法...算法的特点是提取页面的超链接文本,计算检索关键词与超链接文本的语义相关度,并结合PageRank超链接分析算法来估算页面的重要性。实验结果表明,该算法可以提高Pagel~ank算法的检索精确度。
  • 摘 要 基于内容的图象检索技术, 即从大量的静止或活动视频图象库中检索包含目标物体的图象或视频片段 , 在高度信息化的今天, 已成为内容图象库中图象信息组织和管理不可缺少的技术. 本文介绍了基于内容检索技术的...
  • 为了更好地检索出用户满意的冲压件实例,将相关反馈过程与模块加入冲压件实例检索系统。给出了基于向量空间的冲压件实例相似度计算公式与反馈迭代算法,分两个阶段考察新旧实例间的相似度,其结果由用户判断其相关性...
  • 1、什么是相关度排序 Lucene对查询关键字和索引文档的相关度进行打分,得分高的就排在前边。 1.1 如何打分 Lucene是在用户进行检索时实时根据搜索的关键字计算出来的,分两步: 1、计算出词(term)的权重。 2、根据...
  • 为提高古代壁画图像语义检索的质量,提出基于构图分析的相关度模型,通过引入基于绘画构图学的理论和分析方法,从壁画内容的布局、主题和语义三方面用量化方法描述检索语义与壁画内容的相关度,较好地解决了用户的...
  • lucene相关度

    2013-05-01 16:07:36
    Boost是指索引建立过程中,给整篇文档或者文档的某一特定属性设定的权值因子,在检索时,优先返回分数高的。通过Document对象的setBoost()方法和Field对象的setBoost()方法,可以分别为Document和Field指定Boost参数...
  • 摘 要 本文介绍了北京大学天网知名度系统的设计与开发工作,重点论述了...结合网页信息的特点,针对名人网页的检索提出了一种新的网页相关度评价算法,改善了检索结果的排序 合理性,提高了名人网页检索服务的质量。
  • 科技文献 检索与利用的“温度监测系统”相关专利
  • 一、相关度排序1.什么是相关度排序相关度排序是查询结果按照与查询关键字的相关性进行排序,越相关的越靠前。比如搜索“Lucene”关键字,与该关键字最相关的文章应该排在前边。2.相关度打分Lucene对查询关键字和索引...
  • 信息检索复习笔记

    万次阅读 2020-12-17 17:14:46
    信息检索复习 第一讲 搜索 IR(信息检索是什么样的学科): ...确定文档和查询之间的相关度是IR的核心问题 IR作为一门学科,是研究信息的获取(acquisition)、表示(representation)、存储(storage)、组织(organizatio
  • solr 相关度评分,自定义评分

    千次阅读 2017-12-22 19:41:32
    ps:临时写的,大体的实现和简单版, 以后会不断完善 博客和 代码github:https://github.com/Eric-ly/solr_enginesolr是基于lucene的全文检索 搜索引擎,和一般查数据库相比,solr的一个特色就是它的相关度评分。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 940
精华内容 376
关键字:

检索相关度