精华内容
下载资源
问答
  • 几种关键词算法

    万次阅读 2017-09-18 17:42:38
    几种关键词提取介绍:TextRank、LDA、TPR

    几种关键词提取介绍:TextRank、LDA、TPR

    - TextRank关键词提取

    TextRank是由PageRank延伸而来的,先简单介绍PageRank

    PageRank:

    一个简单的例子,求节点A的PR值是多少
    例1:
    这里写图片描述

    PR(A)=PR(B)+PR(C)

    但是节点B不止有一条出链,所以应该为:
    PR(A)=PR(B)2+PR(C)1

    例2:可能会存在没有出链的网页
    这里写图片描述
    图中网页C没有出链,于是可以假设对所有网页都有出链
    PR(A)=PR(B)2+PR(C)4

    例3:有些网页只有自己到自己的出链,或者几个网页形成一个循环链,这样就导致,在不断的迭代循环中,这些网页的PR值一直在增加
    这里写图片描述
    这种情况下,想象成一个人如果到达C网站后发现没有其他的出链,那么他将以一定的概率从浏览器中输入网站跳转到其他的网站

    PR(A)=αPR(B)2+(1α)4

    一般情况下PageRank的更新公式为:
    PR(pi)=αpjMpiPR(Pj)L(pj)+1αN

    L(pj) 是网页 j 的出链数目,Mpi是指出链到网页 i 的数目

    TexTRank:

    TextRank,是将每一个词作为一个节点,而节点与节点之间的链,是由词与词之间的共现决定的,决定词与词共现的方法,是由一个固定大小的窗口决定的,如果一个词与另一个词在同一个窗口里,就在这两个词之间加一条边。

    例如:
    程序员是从事程序开发、维护的专业人员。一般将程序员分为程序设计人员和程序编码人员,但两者的界限并不非常清楚,特别是在中国。软件从业人员分为初级程序员、高级程序员、系统分析员和项目经理四大类。
    分词以后的结果
    [程序员/n, 是/v, 从事/v, 程序/n, 开发/v, 、/w, 维护/v, 的/uj, 专业/n, 人员/n, 。/w, 一般/a, 将/d, 程序员/n, 分为/v, 程序/n, 设计/vn, 人员/n, 和/c, 程序/n, 编码/n, 人员/n, ,/w, 但/c, 两者/r, 的/uj, 界限/n, 并/c, 不/d, 非常/d, 清楚/a, ,/w, 特别/d, 是/v, 在/p, 中国/ns, 。/w, 软件/n, 从业/b, 人员/n, 分为/v, 初级/b, 程序员/n, 、/w, 高级/a, 程序员/n, 、/w, 系统/n, 分析员/n, 和/c, 项目/n, 经理/n, 四/m, 大/a, 类/q, 。/w]

    选择窗口大小为5后,去掉一些停用词后,就可以得到:

    开发=[专业, 程序员, 维护, 英文, 程序, 人员],
    软件=[程序员, 分为, 界限, 高级, 中国, 特别, 人员],
    程序员=[开发, 软件, 分析员, 维护, 系统, 项目, 经理, 分为, 英文, 程序, 专业, 设计, 高级, 人员, 中国],
    分析员=[程序员, 系统, 项目, 经理, 高级],
    维护=[专业, 开发, 程序员, 分为, 英文, 程序, 人员],
    系统=[程序员, 分析员, 项目, 经理, 分为, 高级],
    项目=[程序员, 分析员, 系统, 经理, 高级],
    经理=[程序员, 分析员, 系统, 项目],
    分为=[专业, 软件, 设计, 程序员, 维护, 系统, 高级, 程序, 中国, 特别, 人员],
    英文=[专业, 开发, 程序员, 维护, 程序],
    程序=[专业, 开发, 设计, 程序员, 编码, 维护, 界限, 分为, 英文, 特别, 人员],
    特别=[软件, 编码, 分为, 界限, 程序, 中国, 人员],
    专业=[开发, 程序员, 维护, 分为, 英文, 程序, 人员],
    设计=[程序员, 编码, 分为, 程序, 人员],
    编码=[设计, 界限, 程序, 中国, 特别, 人员],
    界限=[软件, 编码, 程序, 中国, 特别, 人员],
    高级=[程序员, 软件, 分析员, 系统, 项目, 分为, 人员],
    中国=[程序员, 软件, 编码, 分为, 界限, 特别, 人员],
    人员=[开发, 程序员, 软件, 维护, 分为, 程序, 特别, 专业, 设计, 编码, 界限, 高级, 中国]

    来看看”程序员”这个词:
    这里写图片描述

    textRank的更新公式为:

    WS(Vi)=1dN+dVjIn(Vi)wjiVkOut(Vj)WS(Vj)

    根据上面的公式不断迭代,最后每一个词的Weights值会收敛,再根据每个词的Weights大小排序,取前面的权重大的词作为关键词。

    - LDA关键词提取


    lda是含有隐变量生成模型,也是一种隐语义算法模形,下面介绍LDA的生成模型,如下的图都是从《LDA的数学八卦》中摘取:

    我们将文档词的生成比作上帝老头抛色子
    这里写图片描述

    来看下简单的一元模性:
    这里写图片描述
    也就是这样
    这里写图片描述

    而贝叶斯学派的理解是引入了完全贝叶斯公式,引入了先验。
    这里写图片描述

    这里写图片描述

    PLSA
    这里写图片描述

    LDA
    这里写图片描述

    LDA生成模型的公式
    这里写图片描述

    这里写图片描述

    这里写图片描述

    上面的公式的分母中存在求和符号,所以不容易得到解析解,所以使用了Gibbs采样,来对指定词的主题进行采样,经过采样后就可以得到
    基于主题的词分布:

    p(w|z)
    和基于文章的主题分布
    p(z|d)

    基于LDA的关键词提取

    根据上面的LDA的训练,可以的得到一篇文章的主题分布 p(z|di) ,和文章中词的主题分布 p(z|wi) ,可以通过余弦相似度或者KL散度来计算这两个分布的相似性。如果文章的某一主题 z 的概率很大,而该文章中某个词对于该主题z也拥有更大的概率,那么该词就会有非常大的概率成为关键词

    p(z|w)=Cwk+βk=1KCwk+kβ

    p(z|d)=Cwj+αKk=1Cwk+kβ

    TPR = LDA + TextRank

    回归PageRank时的图
    这里写图片描述
    这种情况下,想象成一个人如果到达C网站后发现没有其他的出链,那么他将以一定的概率从浏览器中输入网站跳转到其他的网站

    PR(A)=αPR(B)2+(1α)4

    重新回归PageRank公式:

    PR(pi)=αpjMpiPR(Pj)L(pj)+1αN

    1αN 表示网页有 1α 的概率转移到其他节点,以 α 的概率转移到自己的邻居节点,在pageRank中这部分通常拥有相同的值,表示每个节点等概率的跳转到其他节点,没有任何偏好。

    TPR的思想是每个主题单独运行各自的带偏好的TextRank,每个主题的TextRank都会偏好与主题有较大相关度的词,这个偏好就是设置随机跳转的概率来得到的。

    textrank公式:

    WS(wi)=1dN+dwjIn(wi)wjiwkOut(wj)WS(wj)

    对于每个主题 z ,根据LDA的训练都可以得到每个主题下的词的分布p(w|z),可以把每个词的概率值单做该主题下Textrank的跳转概率来计算,重新修改为:
    WSz(wi)=(1d)P(wi|z)+dwjIn(wi)wjiwkOut(wj)WSz(wj)

    而每个词最后的得分为:

    WS(wi)=z=1KWSz(wi)P(z|d)

    使用下图理解:
    这里写图片描述

    简单结果对比
    TPR、TextRank、LDA对比
    http://mini.eastday.com/mobile/171130071903959.html
    TPR:[经济, 美国, 美联储, 消息, 市场, 国会, 联邦, 耶伦, 股市, 报告, 经济委员会, 英国, 主席, 央行, 汇率, 提振, 税改, 油价, 股指, 分析师]
    TextRank:[经济, 市场, 报告, 美国, 消息, 央行, 汇率, 油价, 股市, 股指, 分析师, 盈利, 加拿大, 数字, 银行, 金融, 指数, 英国, 原油, 美联储]
    LDA:[国会, 联邦, 策略师, 经济委员会, 加拿大皇家银行, 美联储, 主席, 特币, 华尔街, 耶伦, 前景, 经济师, 推高, 参议院, 美国, 货币, 汇率, 提振, 行长, 朝鲜]

    http://mini.eastday.com/mobile/171130092449084.html
    TPR:[美国, 黄金, 美联储, 加息, 金价, 价格, 朝鲜, 耶伦, 市场, 关口, 主席, 经济, 新高, 指数, 证词, 税改, 投资者, 跌幅, 高位, 国会]
    TextRank:[美国, 黄金, 价格, 金价, 关口, 美联储, 朝鲜, 市场, 新高, 加息, 耶伦, 经济, 指数, 跌幅, 税改, 投资者, 阻力, 技术, 高位, 主席]
    LDA:[国会, 美市, 美联储, 弹道导弹, 加息, 初值, 缩表, 通胀, 杜德利, 火星, 但耶伦, 耶伦, 主席, 梅斯特, 洲际导弹, 那契, 惊现, 纽约联储, 达拉斯联储, 季调]

    http://mini.eastday.com/mobile/171130073529414.html
    TPR:[美联储, 加息, 听证会, 人选, 美国, 主席, 条件, 例会, 通胀, 事务委员会, 美国联邦储备委员会, 时说, 鲍威尔, 货币, 负债表, 政策, 参议院, 特朗普, 总统, 状况]
    TextRank:[美联储, 加息, 听证会, 美国, 人选, 主席, 条件, 通胀, 水平, 住房, 城市, 事务委员会, 规模, 银行, 负债表, 时说, 参议院, 资产, 货币, 特朗普]
    LDA:[例会, 事务委员会, 美国联邦储备委员会, 听证会, 鲍威尔, 美联储, 加息, 负债表, 人选, 主席, 时说, 通胀, 货币, 参议院, 政策, 美国, 水平, 状况, 条件, 总统]

    http://mini.eastday.com/mobile/171130154152011.html
    TPR:[文化, 中国, 玉雕, 艺术, 宁海, 大师, 玉石, 历史, 艺术品, 品格, 专家, 中华, 市民, 传统, 民族, 博览会, 城市, 中心, 底蕴, 源远流长]
    TextRank:[中国, 文化, 玉雕, 大师, 艺术, 专家, 宁海, 历史, 市民, 上海, 古玩, 传统, 艺术品, 上海御客会文化传播有限公司, 董事长, 中华, 玉石, 主任, 中心, 内容]
    LDA:[玉石, 品格, 宁海, 玉雕, 艺术品, 艺术, 文化, 大师, 民族, 中华, 博览会, 底蕴, 内涵, 气息, 源远流长, 文化协会, 董事长, 秘书长, 历史, 载体]

    展开全文
  • NLP-关键词抽取的几种算法

    万次阅读 2018-08-03 17:14:58
    求解网页的重要性就是求解向图中节点的重要性,或者说节点的权重。图中节点的重要性和节点的入度有关,越多的其他节点连接到该节点说明该节点的重要性越大。因此,节点的重要性与节点的入度有关。考虑到存在没有...

    TextRank


    从PageRank

    PageRank的思想是这样的:
    求解网页的重要性就是求解有向图中节点的重要性,或者说节点的权重。图中节点的重要性和节点的入度有关,越多的其他节点连接到该节点说明该节点的重要性越大。因此,节点的重要性与节点的入度有关。考虑到存在没有入度的节点,增加了阻尼系数来保证所有的节点都有大于0的重要性。试验结果表明,0.85的阻尼系数,迭代100多次就可以收敛到一个稳定的值。
    所以PageRank的公式:
    这里写图片描述

    到TextRank

    TextRank从PageRank改进而来,比PageRank多了一个参数:节点之间边的权重,不同的是TextRank算法构造了一个无向图。公式如下:
    这里写图片描述
    文本分词后的词汇相当于有向图中的节点,节点之间的边则通过词共现关系构建。给节点指定任意初值,迭代传播节点之间的权重,直到收敛。
    优点:仅用单个文档就可以抽取其本身的关键词,不需要使用多篇文档训练
    缺点:


    TF-IDF


    TF-IDF=TF*IDF

    TF(Term Frequency)

    Term Frequency:词频,顾名思义,TF的基本思想是词在文档中出现的次数越多,越能代表该文档。由于同一个词语在长文件里可能会比短文件有更高的词频,所以需要对词频进行归一化处理。
    而有些通用词在每个文档中都出现很多次,但不能表示任一文档的含义,所以引入IDF。
    Inverse Document Frequency:逆文档频率。
    这里写图片描述
    IDF的思想是:对于某一文档中的词,如果在该文档中出现次数很多,而在其他文档中出现次数很少或不出现,则该词的区分能力越高。
    分母加一是考虑到包含词条的文档数为0的情况,对公式进行拉普拉斯平滑处理。
    某文档内的高频词,以及该词在文档集中的低文档频率,得到的TF-IDF值更高。因此,TF-IDF可以过滤掉通用词,只保留重要的词语。
    TF-IDF是一种基于统计的关键词抽取算法,词语的关键程度跟词语在文档中出现的次数有关。
    优点:简单快捷,结果比较符合实际情况。
    缺点:单纯以词频衡量一个词的重要性,不够全面,有时重要的词可能出现次数不多,而且忽略了词序和词义的重要性。


    LDA


    主题模型

    对于LDA的理解源于一篇通俗易懂的博客戏说从Unigram model 到LDA再到BTM博客使用了上帝掷骰子这一个比喻来解释LDA,非常通俗有趣。从无主题文档,单主题文档,多主题文档到LDA,上帝掷骰子的难度逐步增加。
    如果要深入理解LDA,可以参考52nlp-LDA八卦


    应用实例


    参考了《Python自然语言处理实战:核心技术与算法》
    书籍github地址

    展开全文
  • 你在互联网使用搜索的时候,关键词推荐可能是你经常使用到的一个辅助工具。如各种搜索引擎搜索框的下拉提示;google 结果页会“XXX”的“相关搜索”;百度结果页也提示一组相关搜索词。关键词推荐在文献上一般...

    你在互联网使用搜索的时候,关键词推荐可能是你经常使用到的一个辅助工具。如各种搜索引擎搜索框的下拉提示;google 结果页会有“XXX”的“相关搜索”;百度结果页也有提示一组相关搜索词。关键词推荐在文献上一般称为query suggestiong,query expansion,query rewrite,query recommendation。

    而这些常见的关键词推荐是怎么得到的呢?我总结了一下,有以下几种方式。
    第一:只考虑用户输入的关键词。
    这是指,推荐词只是用户输入词的字串的组合,不添加新的字符串。那么我们考虑的就是如何丢弃不重要的字或者词,或者对输入关键词做拼写纠错。
    对于如何丢弃词,考虑怎么计算字或者词的重要性。考虑词的重要性可以通过TF-IDF,信息增益等方法来完成。还有一种方法是:通过crf的方法,通过序列标注的方法,标准两类词,第一类是重要的词,第二类是次要的词。标记出来之后,我们扔掉不次要的词,留下来的也就是重要词。

    第二:只考虑用户输入序列的关键词。
    这种方法可以把每个用户在一个时间段输入的n个词看成是一次“购物篮”数据,我们统计两周甚至几个月的用户输入,那么我们就可以得到非常多的购物篮数据。通过关联规则挖掘,我们就可以挖掘出相关词。但是这种方法明显的缺点就是没有考虑购物篮中的物品的顺序。当一个关键词和另外一个关键词很相似的时候,无法当成统一为一个对象。

    例如“nokia 正品”和“正品 nokia”是两个不同的词,甚至字母大小写也会当成不同的购物篮中的对象。我们需要对这些对象做一下归一化。例如:query分词后按照ascii排序;通通转换为小写字母;把英文品牌通通转换为中文品牌等。
    关联规则是一个比较简单方法。更加复杂一点,我们可以把所有的query当成node,当输入联系查询了query1和query2,那么这两个结点之间就有一条边。这些边上面的权重都可以用概率来表示,最终再用最短路径之类的方法来求解。
    或者使用互信息的方法来计算两个query之间的相关性。sim(x,y)=P(x,y)/(p(x)*p(y)).

    第三:考虑query-click log
    把query-click item作为一个矩阵。query是矩阵的行,click iterm或者page(URL)作为列,矩阵中的元素是query(i)点击URL(j)的次数。通过这样的一个矩阵,我们就可以使用k-means聚类,或者对query两两之间通过url 的向量来计算相关性。

    第四种:考虑一些规则
    对应一些词难以推荐相关词,则通过不同的规则来完成不同的推荐。如地点替换/放大/缩小。属性的替换,如款式的替换等等。

    展开全文
  • JS的几种关键词的查找方法

    千次阅读 2018-07-10 16:44:30
    关键词",开始位置) 在str中,从“开始位置”开始,查找下一个“关键词”的位置 返回值:下一个"关键词"的第一个字的下标位置,如果找不到就返回-1 如果省略第二个参数-开始位置:默认从0开始找 ...
     (1)var i=str.indexOf("关键词",开始位置)
    
           在str中,从“开始位置”开始,查找下一个“关键词”的位置
           返回值:下一个"关键词"的第一个字的下标位置,如果找不到就返回-1
           如果省略第二个参数-开始位置:默认从0开始找
           查找最后一个关键词的位置:
           var i=str.lastIndexOf("关键词");
     (2)var i=str.search(/正则表达式/);
           返回值:返回第一个找到的匹配的关键词的位置
           如果没找到返回-1
               问题:永远只能找第一个
            只能返回位置,无法返回关键词的内容
     (3)var arr=str.match(/正则表达式/)
           返回值:包含所有找到的敏感词的内容的数组
           找不到就返回null
       问题:只能获取关键词的内容,无法获取关键词的位置
     (4)str=str.replace(/正则表达式/,"替换值")
            强调:replace无权直接修改原字符串,只能返回新字符串,所以必须
    用变量接住替换后的新内容。
    高级替换:根据每个敏感词的不同,动态选择对应的替换值
    str=str.replace(/正则表达式/,function(kword){
        //kword:自动获取本次找到的敏感词
        return 根据kword的不同,选择不同的替换值返回
    })
    展开全文
  • 几种常见的提取关键词的算法(4)

    千次阅读 2020-07-02 09:00:16
    监督的文本关键词提取算法需要高昂的人工成本,因此现有的文本关键词提取主要采用适用性较强的无监督关键词抽取。其文本关键词抽取流程如下: 图 1 无监督文本关键词抽取流程图 无监督关键词抽取算法可以分为三大...
  • 互联网广告表现形式有哪几种

    千次阅读 2019-06-20 09:50:49
    随着互联网技术的发展,互联网广告已成为企业推广的重要途径,那么互联网广告的形式又哪些?我们一起来看看! 1、网幅广告(Banner) 网幅广告是最早的互联网广告形式。它是以GIF,JPG,Flash等格式创建的图像文件,...
  • 关键词挖掘的9方法

    千次阅读 2020-12-27 16:46:05
    Google Keywords Planner(谷歌关键词规划师,以下简称GKP) 您可以输入任何“种子”关键字,并查看大量关键字建议及其相关搜索量。 现在,Google已将这些数字限制在一定范围内了。 ???? 小提示. 你仍然可以...
  • 目前,用于文本关键词提取的主要方法:基于TF-IDF的关键词抽取、基于TextRank的关键词抽取、基于Word2Vec词聚类的关键词抽取,以及多种算法相融合的关键词抽取。笔者在使用前三算法进行关键词抽取的学习过程...
  • 总结一下:主要2...在一个已关键词库中匹配个词语作为这篇文档的关键词。可用AC自动机算法等。 2. 关键词提取 通过算法分析,提取文档中一些词语作为关键词。可用tf-idf算法,textrank 算法等 ...
  • 搜索引擎都有哪几种类型?

    千次阅读 2010-12-29 21:33:00
       一、网页级搜索 <br /> 网页级搜索引擎是名副其实的搜索引擎,国外具代表性的Google、Yahoo、MSN Live Search、Ask,国内著名的百度、搜狗等。它们都是通过从互联网上提取的各个网站的...
  • 今天就来跟大家聊聊怎样在淘宝上挖掘关键词,挖掘关键词几种方法。 1、淘宝搜索下拉框 淘宝搜索下拉框选词是根据消费者的搜索习惯来做优化的,他一般都是关键词延伸的2级词货3级词,消费者会根据自己想要的商品...
  • 大数据加工是一个“技术活儿”,这里我们只介绍了比较常见的三加工方算法,但实际的应用中根据不同的需求可能会特有的某种算法模式交叉使用。 值得注意的是,被加工后的大数据的会服务于人,但目前其大多数...
  • 1、基于TF-IDF的文本关键词抽取方法 词频(Term Frequency,TF) 指某一给定词语在当前文件中出现的频率。由于同一个词语在长文件中可能比短文件更高的词频,因此根据文件的长度,需要对给定词语进行归一化,即...
  • 在自然语言处理领域,处理海量的文本文件最...关于文本的关键词提取方法分为监督、半监督和无监督三: 1 监督的关键词抽取算法 它是建关键词抽取算法看作是二分类问题,判断文档中的词或者短语是或者不是关
  • 很多小伙伴在查看自己的竞价账户的时候,经常会遇到关键词有展现却没有点击的情况,就会生出疑问,这是什么情况呢?那么今天我就为大家分析一下究竟是哪些因素导致的呢? 账户搭建问题 这种情况是非常多见的,...
  • 而无论是对于长文本还是短文本,往往可以通过关键词窥探整个文本的主题思想。与此同时,不管是基于文本的推荐还是基于文本的搜索,对于文本关键词的依赖也很大,关键词提取的准确程度直接关系到推荐系统或者搜索...
  • 关键词抽取

    千次阅读 2017-01-17 10:34:03
    这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。 除了这些,关键词还可以在文本聚类、分类、自动摘要
  • 网站选择适合自己行业的核心关键词与目标关键词,与自己行业匹配的关键词可以帮助搜索引擎快速定位对于自己做关键词排名是非常帮助。 关键词四条法则 1.高相关度: 搜索进来的关键词在我们网站没有相关性产品,...
  • &人工智能培训 如何做好文本关键词提取从三算法说起 _光环大数据培训 在自然语言处理领域 处理海量的文本文件最关键的是要把用户最关心的问 题提取出来 而无论是对于长文本还是短文本 往往可以通过关键词窥探...
  • 关键词提取

    千次阅读 2017-10-31 14:43:57
    仅是关键词提取的一些常用算法概述,至于各个算法的具体实现细节和在spark上运行的时候遇到的坑,后续博客里继续
  • 相信SEOer们讨论得最多的可能就是一些外链,原创文章,关键词的密度之类的技巧,估计这些刚出道的菜鸟们都听得耳朵都起茧了吧! 今天我们跟大家来谈谈...标题关键词个合适等等?针对这些问题我会一一解答,供大家分享!
  • 在SEO网站优化过程中,除了考虑网站的目标关键词之外,还要考虑长尾关键词。何为长尾关键词?... 长尾关键词主要有哪几种形式呢?长尾关键词一般存在三种形式,分别是导航类关键词、问答型关键词及购买型关
  • 六个关键词

    千次阅读 2017-11-06 11:02:39
    积累关键词——抽象思维,其中矩阵是一抽象结果,通过矩阵运算,我们可以推导多维空间,或者有限运算无法得到的结果。这次又遇到一个词:数据结构:计算机解决一个具体问题时,大致需要经过下列个步骤:首先...
  • 下面,曾庆平SEO为大家分析一下影响关键词排名的因素哪些,快看一下自己的网站是不是出现了以下问题。 一、网站内部结构 首先网站一定要充分考虑两个方面,一个是用户,一个就是搜索引擎。 (1)...
  • 国内App推广N种方法,总有几种适合你

    千次阅读 2016-11-04 17:24:14
    国内App推广N种方法,总有几种适合你 移动互联网App推广的十大难题
  • 【转】十种关键词热度分析方法

    千次阅读 2014-07-24 11:38:00
    关键词分析在SEO中的地位是举足轻重的,其中关键词的竞争强度分析也尤为重要。关键词竞争强度,通俗来讲,也就是这个词竞争大不大,好不好做上去?可能这些大家都知道,之所以列出来,只是为了让不知道的朋友了解,...
  • Linux系统中安装软件的几种方式

    万次阅读 多人点赞 2018-09-27 21:58:59
    Linux很多发行版本,各种发行版本之间安装软件方式和命令不一样,同一个版本之间安装软件也不同的方法。但是,大体来说,Linux两大派系,一个是红帽派系,包含Redhat、Centos、Fedora等。还有一个是Debian...
  • 关键词抽取简介

    2017-01-13 18:25:48
    关键词提取就是从文本里面把...这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。 除了这些以外,关键词还可以在

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 157,038
精华内容 62,815
关键字:

关键词有哪几种