精华内容
下载资源
问答
  • 相关性

    千次阅读 2014-04-19 20:39:13
    地图搜索相关性: 1.query搜索本身的因素考虑  计算query的意图和指向  query和目标区域的匹配程度 2.地域相关性  地域特色的考虑  距离远近  地域邻近域的特征描述 3.个人用户的行为特征 4.相似性用户的特征...

    主要维度
    •     文本相关性
    文本角度的相关度匹配
    •     权威性
    相关前提下选出更优质/权威的结果
    •     需求满足
    同样的关键词有不同的含义,分析用户需求并给出适合的结果


    特征提取层
    1.     页面级别特征
         a.     主题分析
              i.     真实标题,子标题
              ii.     面包屑,key-value对
         b.     入链anchor分析
         c.     页面类型
              i.     例如,图片页面上tf起到的作用不大
         d.     页面质量
              i.     例如,对空短页面的赋权
         e.     站点/频道的属性
              i.     如,汽车网站上,隐含“汽车”的term
         f.     正文提取/边框去噪

    2.     term级别特征
          a.     结构特征
               i.     粗体,在主题中,在引号中,表格字段
               ii.     分布密度
          b.     语义
               i.     Idf
               ii.     定义次
               iii.     上下文关系

    权值计算层
    1.     单term计算
    2.     多term合并计算/排序

    地图搜索相关性:

    1.query搜索本身的因素考虑
        计算query的意图和指向
        query和目标区域的匹配程度
    2.地域相关性
       地域特色的考虑
       距离远近
       地域邻近域的特征描述
    3.个人用户的行为特征
    4.相似性用户的特征推荐


    购物搜索相关性
    1.产品标题和自身描述等因素(基于内容的)
    2.价格因素的考虑


    图片搜索相关性
    text-based image retrival
    content-based image retrival

    image feature:sift method
    bag of words model

    网页搜索相关性
    url, anchor, title , body
    滑动窗口打分,针对single term 和 pair term 打分
    主要考察指标:
    pr,sitepr,dist,offset,term attr, tight weight, token weight,indomain和outdomain
    core title命中,title命中紧密性,完全命中及个数
    query intent 和doc type的匹配性提权等
    考察ranking optional 和 retrieval optional相关信息
    其中的方法:term 重要性和关键字匹配

    anchor:anchor信任度提权,完全命中anchor的数目,以及所占anchor的比例,anchor所在位置,anchor的商业意图等
               判断indomain和outdomain的个数比例
    url:是否命中domain或者host,以及缩写的命中等,site rank,是否官方网,以及url级别和站点级别等
    body:滑动窗口打分, windowscore = ∑singlescore + ∑pairscore
            singlescore:token weight, positionDecay, weight_sum , demote_factor.
            pairscore:mean_weight ,dist_factor  ,order_factor ,sectionPositionDecay, demote_factor



    展开全文
  • Python 数据相关性分析

    万次阅读 多人点赞 2018-04-25 15:09:49
    可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对数据进行分析,从而给我们的决策提供支持,本文即介绍如何使用 Python 进行数据相关性分析。 关键词 python 方差...

    本文有视频教程,感兴趣的朋友可以前往观看 Python入坑实战系列 Part-2 - 简单数据相关性分析

    概述

    在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对数据进行分析,从而给我们的决策提供支持,本文即介绍如何使用 Python 进行数据相关性分析。
    关键词 python 方差 协方差 相关系数 离散度 pandas numpy

    实验数据准备

    接下来,我们将使用 Anaconda 的 ipython 来演示如何使用 Python 数据相关性分析,我所使用的 Python 版本为 3.6.2 。

    首先,我们将会创建两个数组,数组内含有 20 个数据,均为 [0, 100] 区间内随机生成。

    a = [random.randint(0, 100) for a in range(20)]
    b = [random.randint(0, 100) for a in range(20)]
    print(a)
    >> [35, 2, 75, 72, 55, 77, 69, 83, 3, 46, 31, 91, 72, 12, 15, 20, 39, 18, 57, 49]
    print(b)
    >> [25, 24, 72, 91, 27, 44, 85, 21, 0, 64, 44, 31, 6, 91, 1, 61, 5, 39, 24, 43]
    

    期望

    在进行相关性分析之前,我们需要先为最终的计算分析做好准备。我们在分析前,第一个准备的是计算数据的期望。对于期望的定义,离散变量和连续变量是不一样的,具体定义如下:

    • 对于连续随机变量

    • 在离散随机变量

    在一般情况下,我们通过实验或者调查统计获取的数据很大一部分都属于离散随机变量,那么这里的期望我们也可以简单的理解为平均数,那么既然是平均数,那么我们就可以非常简单编写一个计算离散变量的期望的函数了。

    def mean(x):
      return sum(x) / len(x)
    mean(a)
    >> 46.05
    mean(b)
    >> 39.9
    

    离散度 - 方差与标准差

    接下来,我们需要计算的是数据的离散程度,在统计上,我们通常会使用方差和标准差来描述。
    方差和期望一样,对于连续和离散的随机变量有着不同的定义,具体定义如下:

    • 对于连续随机变量

    • 对于离散随机变量

    与期望类似,这里我们一般只考虑离散变量的方差。还有一点值得注意,我们上面的离散变量方差公式,最后是除以 n ,但实际上,我们计算样本方差的时候一般会使用 n-1 ,具体原因可以参考知乎 《为什么样本方差(sample variance)的分母是 n-1?》

    而标准差,就是方差的平方根。那么,我们也可以像上面计算期望一样,给方差和标准差编写函数。

    # 计算每一项数据与均值的差
    def de_mean(x):
      x_bar = mean(x)
      return [x_i - x_bar for x_i in x]
    # 辅助计算函数 dot product 、sum_of_squares
    def dot(v, w):
      return sum(v_i * w_i for v_i, w_i in zip(v, w))
    def sum_of_squares(v):
      return dot(v, v)
    # 方差
    def variance(x):
      n = len(x)
      deviations = de_mean(x)
      return sum_of_squares(deviations) / (n - 1)
    # 标准差
    import math
    def standard_deviation(x):
      return math.sqrt(variance(x))
    
    variance(a)
    >> 791.8394736842105
    varance(b)
    >> 850.5157894736841
    

    协方差与相关系数

    接下来,我们进入正题,我们开始计算两组数据的相关性。我们一般采用相关系数来描述两组数据的相关性,而相关系数则是由协方差除以两个变量的标准差而得,相关系数的取值会在 [-1, 1] 之间,-1 表示完全负相关,1 表示完全相关。接下来,我们看一下协方差和相关系数的定义:

    • 协方差
    • 相关系数

    同样的,我们根据上述的公式编写函数。

    # 协方差
    def covariance(x, y):
      n = len(x)
      return dot(de_mean(x), de_mean(y)) / (n -1)
    # 相关系数
    def correlation(x, y):
      stdev_x = standard_deviation(x)
      stdev_y = standard_deviation(y)
      if stdev_x > 0 and stdev_y > 0:
        return covariance(x, y) / stdev_x / stdev_y
      else:
        return 0
    
    covariance(a, b)
    >> 150.95263157894735
    correlation(a, b)
    >> 0.18394200852440826
    

    根据上面的结果,相关系数为 0.18,可以推断这两组随机数有弱正相关。当然,我们知道,这两组数据都是使用 random 函数随机生成出来的,其实并没有什么相关性,这也是在数据处理中,需要特别留意的一个地方,统计的方法可以给我们一个定量的数值可供分析,但实际的分析也需要结合实际以及更多的情况综合考虑。

    使用 numpy 计算协方差矩阵 相关系数

    一般我们日常工作,都不会像上面一样把什么期望、方差、协方差一类的函数都重新写一遍,上面的代码只是让我们对这些计算更加熟悉。我们通常情况下会使用 numpy 一类封装好的函数,以下将演示一下如何使用 numpy 计算协方差。

    import numpy as np
    # 先构造一个矩阵
    ab = np.array([a, b])
    # 计算协方差矩阵
    np.cov(ab)
    >> array([[ 791.83947368,  150.95263158],
           [ 150.95263158,  850.51578947]])
    

    这里我们可以看到,这里使用 np.cov 函数,输出的结果是一个矩阵,这就是协方差矩阵。协方差矩阵数据的看法也不难,我们可以以上面的结果为例,矩阵1行1列,表示的是 a 数据的方差,这和我们上面的计算结果一致,然后1行2列和2行1列分别是 a b 以及 b a 的协方差,所以他们的值是一样的,然后最后2行2列就是 b 数据的方差。

    接下来,我们继续使用 numpy 计算相关系数

    np.corrcoef(ab)
    >> array([[ 1.        ,  0.18394201],
           [ 0.18394201,  1.        ]])
    

    计算相关系数,我们使用 numpy 的 corrcoef 函数,这里的输出也是一个矩阵,这个矩阵数据的含义同上面的协方差类似,我们可以看到,这里我们的相关系数是 0.18 ,和我们上面自己编写的函数计算的结果一致。

    使用 pandas 计算协方差、相关系数

    除了使用 numpy,我们比较常用的 python 数据处理库还有 pandas,很多金融数据分析的框架都会使用 pandas 库,以下将演示如何使用 pandas 库计算协方差和相关系数。

    import pandas as pd
    # 使用 DataFrame 作为数据结构,为方便计算,我们会将 ab 矩阵转置
    dfab = pd.DataFrame(ab.T, columns=['A', 'B'])
    # A B 协方差
    dfab.A.cov(dfab.B)
    >> 150.95263157894738
    # A B 相关系数
    dfab.A.corr(dfab.B)
    >>  0.18394200852440828
    dfab
    >>    A   B
    0   35  25
    1    2  24
    2   75  72
    3   72  91
    4   55  27
    5   77  44
    6   69  85
    7   83  21
    8    3   0
    9   46  64
    10  31  44
    11  91  31
    12  72   6
    13  12  91
    14  15   1
    15  20  61
    16  39   5
    17  18  39
    18  57  24
    19  49  43
    

    可以看到,和 numpy 相比,pandas 对于有多组数据的协方差、相关系数的计算比 numpy 更为简便、清晰,我们可以指定计算具体的两组数据的协方差、相关系数,这样就不需要再分析结果的协方差矩阵了。

    小结

    本文通过创建两组随机的数组,然后通过参考定义公式编写函数,再到使用 numpy 以及 pandas 进行协方差、相关系数的计算。到这里我们应该已经了解了数据相关性分析的原理,以及简单的具体实践使用方法,日后在工作中遇到需要做数据相关性分析的时候,就可以派上用场了。

    参考资料

    《数据科学入门.格鲁斯 (Joel Grus).人民邮电出版社》

    展开全文
  • 相关性相关性分析方法
  • 求两个正弦信号相关性,可根据需要更改相位进行求解。
  • 相关性分析

    2014-08-06 19:30:24
    相关性分析
  • R做相关性分析,里面包括数据读取说明和教程等
  • 相关性相关性

    千次阅读 2019-08-10 21:08:12
    图象处理中,自相关和互相关函数的定义如下:设原函数是f(t),则自相关函数定义... 通信系统中,自相关性决定多径干扰,互相关性决定了多址干扰 多径干扰:在无线通信领域,多径指无线电信号从发射天线经过多个路径...

    图象处理中,自相关和互相关函数的定义如下:设原函数是f(t),则自相关函数定义为R(u)=f(t)*f(-t),其中*表示卷积;设两个函数分别是f(t)和g(t),则互相关函数定义为R(u)=f(t)*g(-t),它反映的是两个函数在不同的相对位置上互相匹配的程度。

       通信系统中,自相关性决定多径干扰,互相关性决定了多址干扰

    多径干扰:在无线通信领域,多径指无线电信号从发射天线经过多个路径抵达接收天线的传播现象。大气层对电波的散射、电离层对电波的反射和折射,以及山峦、建筑等地表物体对电波的反射都会造成多径传播。

    多径会导致信号的衰落和相移。瑞利衰落就是一种冲激响应幅度服从瑞利分布的多径信道的统计学模型。对于存在直射信号的多径信道,其统计学模型可以由莱斯衰落描述。

    在电视信号传输中可以直观地看到多径对于通信质量的影响。通过较长的路径到达接收天线的信号分量比以较短路径到达天线的信号稍迟。因为电视电子枪扫描是由左到右,迟到的信号会在早到的信号形成的电视画面上叠加一个稍稍靠右的虚像。

    基于类似的原因,单个目标会由于地形反射在雷达接收机上产生一个或多个虚像。这些虚像的运动方式与它们反射的实际物体相同,因此影响到雷达对目标的识别。为克服这一问题,雷达接收端需要将信号与附近的地形图相比对,将由反射产生的看上去在地面以下或者在一定高度以上的信号去除。

    在数字无线通信系统中,多径效应产生的符号间干扰(intersymbol interference,ISI)会影响到信号传输的质量。时域均衡、正交频分复用(OFDM)和Rake接收机都能用于对抗由多径产生的干扰。

    衰落:电磁波在传播过程中,由于传播媒介及传播途径随时间的变化而引起的接收信号强弱变化的现象叫作衰落。譬如在收话时,声音一会儿强,一会儿弱,这就是衰落现象。

    衰落是由于随机的多径射线相干涉所引起的接收点场强发生随机强起伏的现象。多径传播,是指由于传播环境不均匀,从同一天线发射的电磁波循不同的选径达到同一十接收点的情形。这些不同的途径使电磁场的相移不同。当环境随机变动时,多径的相移也随机起伏,因而各路径的电场叠加结果随时间作随机强起伏。

    短波经电离层反射时,由于电子浓度分布不均匀,到达接收点的射线可能不止一条寻常射线和一条异常射线,因而成为随机多径传播。微波在对流层中传播时,在不平的地面上可能有多个反射点。在特殊气象条件下,大气的折射指教可能发生较强的随机起伏,因而引起衰落。在移动通信方面,由于街道纵横,建筑耸立或山区峰峦起伏,电磁波可能受到多重反射和散射,因而在通信范围内电场强度随地区而起伏。如用户在通信时不随时移动,多径传播只能使信号强弱随地区而异,如用户随时移动,则信号也能发生衰落。

    衰落的探度常常能达到几十分贝,不能用自动增益控制的方法来弥补。但在十个波长左右的距离上,场强起伏的规律可能有明显的差别。所以抗衰落的有效方法是分集通信,即在短波接收台或移动通信用户台,用二或三副天线分别进行通信,而对信号进行适当的处理。

    衰落一般都对频率有选择性,不同频率的起伏是不同的,所以衰落不仅使信号幅度不稳,而且引起频率畸变,因此衰落是限制信号带宽的因素之一。

    衰落分为:平坦性衰落和频率选择性衰落,快衰落和慢衰落

     

    发送的信号带宽在一定范围内时,无论频率如何变化,对接收信号衰落影响都是一致的,称之为平坦衰落。所谓一致,就是在这个带宽范围内,无论发送频率变成多少,由于多径传播造成的接收信号叠加不是增强信号就是削弱信号,方向总是一样。

    当信号带宽小于相干带宽时,所产生的衰落就是平坦衰落。与之相反,当信号带宽大于相干带宽时,所发生的衰落就是频率选择性衰落,此时的信号衰落随载波频率f变化而变化,频率不同则衰落的强弱不同。当为了提高传输速率而加大信号带宽时,频率选择性衰落的影响就会增强。为了对抗频率选择性衰落,人们采用了正交频分复用(OFDM)技术,该技术将宽带信号分成很多子带,频域上分成很多子载波发送出去,每个子带的信号带宽由于小于相干带宽,从而减少甚至避免了频率选择性衰落。

    衰落通常分为慢衰落和快衰落两种。其中,信号强度曲线的中值呈现慢速变化,称为慢衰落;曲线的瞬时值呈快速变化,称快衰落。可见快衰落与慢衰落并不是两个独立的衰落(虽然它们的产生原因不同),快衰落反映的是瞬时值,慢衰落反映的是瞬时值加权平均后的中值。慢衰落和快衰落的信号强度随时间变化如图1所示。

    慢衰落:它是由于在电波传输路径上受到建筑物或山丘等的阻挡所产生的阴影效应而产生的损耗。它反映了中等范围内数百波长量级接收电平的均值变化而产生的损耗,一般遵从对数正态分布。

    慢衰落产生的原因有以下几种:

    l路径损耗,这是慢衰落的主要原因。

    l障碍物阻挡电磁波产生的阴影区。这种慢衰落也被称为阴影衰落。

    l天气变化、障碍物和移动台的相对速度、电磁波的工作频率等有关。

    快衰落(又称瑞利衰落):它是由于移动台附近的散射体(地形,地物和移动体等)引起的多径传播信号在接收点相叠加,造成接收信号快速起伏的现象叫快衰落。

    快衰落细分为:

    时间选择性衰落(快速移动在频域上产生多普勒效应而引起频率扩散)

    空间选择性衰落(不同的地点、不同的传输路径衰落特性不一样)

    频率选择性衰落(不同的频率衰落特性不一样,引起时延扩散)

    快衰落产生的原因如下:

    l多径效应

    时延扩展:多径效应(同一信号的不同分量到达的时间不同)引起的接收信号脉冲宽度扩展的现象称为时延扩展。时延扩展(多径信号最快和最慢的时间差)小于码元周期可以避免码间串扰,超过一个码元周期(WCDMA中一个码片)需要用分集接收,均衡算法来接收。

    相关带宽:相关带宽内各频率分量的衰落时一致的也叫相关的,不会失真。载波宽度大于相关带宽就会引起频率选择性衰了使接收信号失真。

    l多普勒效应

    F(频移)=V(相对速度)/(C(光速)/f(电磁波频率))*cosa(入射电磁波与移动方向夹角)。多普勒效应会引起时间选择性衰落。由于相对速度的变化引起频移也随之变化,这时即使没有多径信号,接收到的同一路信号的载频范围随时间不断变化,从而引起时间选择性衰落。交织编码可以克服时间选择性衰落。

    快衰落和慢衰落都会对通信造成一定影响,典型的影响有:

    慢衰落会降低SNR。慢衰落主要会导致整体信号的电平衰落,降低了接收的信号功率,从而降低了信噪比(SNR)。

    快衰落会使发送的基带数据脉冲失真,可能会导致锁相环同步问题。多径和多普勒效应导致的快衰落可能对通信的破坏力最强。

    阴影衰落

    无线电波在遇到面积比电磁波波长大得多的障碍物时,会发生反射,从而在障碍物另一侧形成一片无线电波无法直接传播到的“阴影”区域,称为阴影效应,如图2所示。

    展开全文
  • 易语言CPU相关性源码

    2020-07-16 14:31:37
    易语言CPU相关性源码,CPU相关性,SetProcessAffinityMask,GetProcessAffinityMask
  • 课程相关性-源码

    2021-02-11 13:18:34
    课程相关性
  • CPU相关性.rar

    2020-04-04 12:28:58
    CPU相关性.rar
  • 皮尔逊相关系数 皮尔逊相关性和每个vox相关性
  • 数据科学最重要的技能之一就是数据可视化,在数据建模过程中,我们比较关心数据之间的相关性,而观察数据相关性我们使用最多的技能之一就是相关性矩阵。数据相关性矩阵可以让我们对数据之间的关联关系有更为直观的...

            数据科学最重要的技能之一就是数据可视化,在数据建模过程中,我们比较关心数据之间的相关性,而观察数据相关性我们使用最多的技能之一就是相关性矩阵。数据相关性矩阵可以让我们对数据之间的关联关系有更为直观的理解。这里简单汇总一下使用Python绘制传统相关性矩阵/下三角相关性矩阵/重点相关性矩阵的代码

    1. 传统相关性矩阵

    图片

    import pandas            as pd
    import seaborn           as sns
    import matplotlib.pyplot as plt
    %matplotlib inline
    
    df = pd.read_csv('./data/melb_data.csv')
    # Calculate pairwise-correlation
    matrix = df.corr()
    cmap = sns.diverging_palette(250, 15, s=75, l=40, n=9, center="light", as_cmap=True)
    
    plt.figure(figsize=(12, 8)) 
    sns.heatmap(matrix,  center=0, annot=True,
                 fmt='.2f', square=True, cmap=cmap)

    2. 下三角相关性矩阵

    图片

    import numpy as np
    # mask掉上三角部分
    mask = np.triu(np.ones_like(matrix, dtype=bool)) 
    plt.figure(figsize=(12, 8)) 
    sns.heatmap(matrix,  mask=mask, center=0, annot=True, fmt='.2f', square=True, cmap=cmap) 
    

    3. 重点相关性矩阵(即只画出相关性指数大于阈值的那部分)

    图片

    # mask掉上三角 & 小于某个阈值的值
    mask1 = np.triu(np.ones_like(matrix, dtype=bool))
    mask2 = np.abs(matrix) <= 0.1
    mask  = mask1 | mask2
    
    plt.figure(figsize=(12, 8)) 
    sns.heatmap(matrix,  mask=mask, center=0, annot=True,fmt='.2f', square=True, cmap=cmap) 

     

     

    展开全文
  • 相关性相关性算分 ● 相关性 – Relevance ● 搜索的相关性算分,描述了⼀个⽂档和查询语句匹配的程度。ES 会对每个匹配查询条件的结 果进⾏算分 _score ● 打分的本质是排序,需要把最符合⽤户需求的⽂档排在前⾯...
  • matlab相关性分析

    万次阅读 多人点赞 2020-11-14 21:52:22
    相关性分析 一、皮尔逊相关系数 (person) 计算公式: 样本协方差:Cov(x,y)=∑i=1n(Xi−Xˉ)(Yi−Yˉ)n−1{Cov(x,y)=\frac{\sum_{i=1}^n(X_i-\bar{X})(Y_i-\bar{Y})}{n-1}}Cov(x,y)=n−1∑i=1n​(Xi​−Xˉ)(Yi​...
  • capm2相关性数据

    2017-01-13 18:54:03
    相关性数据
  • 特征相关性

    千次阅读 2019-09-19 09:42:29
    在主成份分析、数据探索上,经常要探索特征与特征、特征与因变量之间的相关性。下面记录几种相关性探索的方法。 方法一:单个特征与因变量的相关性直观显视 import matplotlib import matplotlib.pyplot as plt ...
  • 前天介绍了黑色系商品期货的相关性特征,今天继续给大家介绍一下农产品期货的相关性特征。农产品期货近5年的相关性矩阵热力图如图1-图5所示。我们逐一来看农产品各个品种间的相关性变化特征。图1 2016年农产品期货...
  • 相关性分析 matlab

    2018-08-11 14:57:21
    相关性分析的matlab代码,测试可行;主要用于数据分析
  • 查看相关性

    2020-08-10 14:51:54
    查看相关性 方法一: #df.to_csv('data1.csv') import matplotlib.pyplot as plt import seaborn as sns #变量相关性分析 fig,ax = plt.subplots() fig.set_size_inches(10,10) sns....
  • R语言相关性

    2021-01-07 06:59:31
    R语言相关性 相关系数可以用来描述定量变量之间的关系。相关系数的符号(±)表明关系的方向(正相 关或负相关),其值的大小表示关系的强弱程度(完全不相关时为0,完全相关时为1)。 1、相关的类型 1、Pearson、...
  • 【数据相关性分析】数据相关性分析理论基础

    万次阅读 多人点赞 2018-07-18 17:24:38
    思考如何进行相关性分析, 相关性分析的方法有哪些?说出你的想法 相关分析的方法很多,初级的方法可以快速发现数据之间的关系,如正相关,负相关或不相关。中级的方法可以对数据间关系的强弱进行度量,如完全...
  • 用于研究matlab的数字数据的相关性,并出图。对于有科研需求的用户,有很大的借鉴作用
  • 基因相关性

    千次阅读 2018-12-27 12:14:04
    为了获知基因序列在功能和结构上的相似性,经常需要将几条不同序列的DNA进行比对,以判断该比对的DNA是否具有相关性。 现比对两条长度相同的DNA序列。首先定义两条DNA序列相同位置的碱基为一个碱基对,如果一个碱基...
  • R多变量相关性分析及相关性可视化 目录 R多变量相关性分析及相关性可视化 多变量相关性计算 所有变量之间的相关性 计算数值变量的相关性 相关系数可视化 量化两个变量之间关系的一种方法是使用皮尔逊...
  • 相关性学习

    千次阅读 2017-08-02 17:39:37
    相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。 相关性不等于因果性,也不是简单的个性化,...
  • 相关性算法--Elasticsearch相关性算法

    千次阅读 2019-07-23 16:11:54
    Elasticsearch相关性算法 Elasticsearch相关性算法主要分为三大部分:布尔模型,TF/IDF,向量空间模型 布尔模型:and,or,not根据这些条件来匹配文档,判断搜索词是否在文档中。 TF/IDF:相关性算法--TF/IDF 这...
  • R语言相关性分析

    万次阅读 多人点赞 2019-11-12 22:52:00
    文章目录@[toc]Pearson相关系数(积差相关系数)适用条件Spearman等级相关系数适用条件Kendall's Tau相关系数适用条件偏相关适用条件R语言实现Pearson、Spearman、Kendall示例偏相关相关性显著性检验相关性可视化在...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 194,583
精华内容 77,833
关键字:

相关性