精华内容
下载资源
问答
  • 如何对文本内的某个词的关联词进行提取?
    千次阅读
    2020-11-30 02:01:34

    简单提供几个思路。

    比较常见的做法是通过训练词向量,计算词向量的相似度。正如题主所说的word2vec就是最常见的是训练词向量的方法。

    word2vec是Google的一个开源工具,通过将词转化成向量的形式,可以把对文本內容的处理简化为向量空间中的向量运算,往往会结合余弦相似度来计算向量空间上的相似度,來表示文本语意上的相似度。

    例如:

    word2vec训练词向量的方法是通过上下文去预测某个词或者通过一个词去预测上下文,所以除了得到语义相近的词,往往还会得到搭配比较多的关联词。所以word2vec是可行的。同理,其他训练词向量的方法也是可以的,比如glove或者fasttext等。而对于计算相似度的方法就更多了,就不概述了。

    还有通过句子结构分析和词与词之间的事理关系也是可以得到一些关联词,比如存在“不仅A而且B”这种句式时,A和B是很有可能是关联词,甚至是近义词。除了并列,还有顺承,转折等关系也是可以寻找关联词的。

    只从词本身看,有时候研究词与词的共现关系或者根据相同上下文相邻词的频数也可以挖掘关联词。

    更多相关内容
  • 教育资料
  • 二年级常用关联词、造句归纳、写作词语积累.doc
  • 七年级语文上学期开学测试题分类之汉字 词语 关联词 试题.doc
  • 小学生语文四年级关联词分类和练习.docx
  • 「写论文」“常用关联词”汇总

    千次阅读 2019-05-28 18:12:48
    写论文、报告、项目书时,为了增强文章的结构性和行文的通顺性,应多使用关联词。小白把一些常用的关联词列举在下面,方便写文章时拿出来翻阅。 关联词共分成8类: 转折关系、假设关系、并列关系、递进关系、选择...

    写论文、报告、项目书时,为了增强文章的结构性和行文的通顺性,应多使用关联词。小白把一些常用的关联词列举在下面,方便写文章时拿出来翻阅。


    关联词共分成8类:

    转折关系、假设关系、并列关系、递进关系、选择关系、因果关系、条件关系、承接关系。

    1.转折关系

    • 虽然……但是……
    • 尽管……还是……
    • …… 却……
    • ……然而……
    • ……但是……
    • 虽然... ...却
    • 既然......也......

    2.假设关系

    • 如果……就……
    • 要是……那么......
    • 即便…...也……
    • 即使……也……
    • 倘若……就……
    • 要是……就……
    • 倘若.......便......

    3.并列关系

    • 一边……一边……
    • 一会儿…… 一会儿……
    • 既……又……
    • 又... ...又... ...
    • 一面.......一面...
    • 有……有……

    4.递进关系

    • 不但……而且……
    • 不光……也……
    • 不仅……还…
    • 不但不……反而……

    5.选择关系

    • 是……还是……
    • 要么……要么……
    • 或者......或者......
    • 与其……不如……
    • 宁可(宁愿)……也不(决不)……

    6.因果关系

    • 因为……所以……
    • 之所以……是因为……
    • 由于……因此……

    7.条件关系

    • 只要……就……
    • 只有……才……
    • 无论 (不论、不管、任凭)……都(也、还) 。
    • ……却……
    • ……是……是……

    8.承接关系

    • 一……就……
    • 首先……然后……
    • ……于是……
    • ……才……
    • ……接着……
    展开全文
  • 教育精品资料
  • 通过挖掘词语间的互信息和关联词信息,继而更新传统文本表示模型,通过相似度计算来判断是否为热点话题的后续话题,最后通过更新热点微博话题向量来避免话题漂移问题。实验证明了所提算法针对微博热点话题追踪是有效的...
  • 最新完美版教育资料
  • mapping设置: "mappings" : { "suggestion":{ "_source" : { "enabled" : true }, "_all" : { "enabled" : true }, "properties":{ "suggestion_id...

    mapping设置:

     

      "mappings" : {
        "suggestion":{
          "_source" : {
            "enabled" : true
          },
          "_all" : {
            "enabled" : true
          },
          "properties":{
            "suggestion_id":{
              "type":"string"
            },
            "suggestion_name":{
              "type":"string",
              "index":"not_analyzed"
                  }
               }
            }
              }

    搜索语句:

    search_obj = {
                "query":{
                    "function_score":{
                        "query":{
                            "prefix":{
                                "suggestion_name":"%s"
                            }
                        },
                        "functions":[
                            {"weight":5,"filter":{"term":{"suggestion_name":"沙发"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"床"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"双人床"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"单人沙发"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"单人椅"}}},
                            {"weight":5,"filter":{"term":{"suggestion_name":"单人床"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"桌子"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"电视柜"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"电烤箱"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"杯子"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"木床"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"沙发椅"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"餐椅"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"书椅"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"书桌椅"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"衣柜"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"衣帽架"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"梳妆台"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"边几"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"烛台"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"钟表"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"挂毯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"壁灯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"壁画"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"壁镜"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"台灯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"吸顶灯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"落地镜"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"落地灯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"水杯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"水果盘"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"水壶"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"刀叉"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"刀具"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"锅具"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"锅碗"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"洗脸巾"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"香薰"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"卫浴"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"清洁器"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"清洁机"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"电风扇"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"牛角椅"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"牛皮"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"茶几"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"茶桌"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"茶杯"}}},
                            {"weight":3,"filter":{"term":{"suggestion_name":"茶壶"}}}
                        ]
                    
                    }
                }
            }

    效果展示:

    11

    展开全文
  • 第二:关联词语性质复杂,能在复句中起关联作用的主要有以下几类词语:1、连词:连词是用来做关联词语的主要词类,但并非所有连词都能充当关联词。有的连词不能连接分句,不能连接分句的连词当然不能做关联词;有的...

    关联词语:

    是复句中用来联结分句与分句,标明分句与分句之间的关系的词语。

    关联词语特点:

    第一:作为联结分句、标明关系的词语,关联词语总是标明抽象的关系,可以作为某类复句的特定的形式标志。

    第二:关联词语性质复杂,能在复句中起关联作用的主要有以下几类词语:

    1、连词:

    连词是用来做关联词语的主要词类,但并非所有连词都能充当关联词。

    有的连词不能连接分句,不能连接分句的连词当然不能做关联词;

    有的连词能连接分句,但如果在某个句子中连接的不是分句,它也不是关联词。

    2、副词:

    某些副词可充当关联词。但如果在某个句子中连接的不是分句,它也不是关联词。

    起关联作用的副词仍旧保留原有的修饰作用。

    3、有些短语也可以充当关联词语,如“一方面”、“另一方面”。

    关联词语是在复句中才能确认的,离开复句,就无所谓关联词语了。

    关联词语类别:

    因果关系:一个分句提出原因,一个分句说明结果,这种关系的复句叫因果复句。

    因为……所以……;既然……就……;……因此……;之所以……是因为……

    并列关系:几个分句分别叙述或描写几件事情、几种情况,或者同一事物的几个方面,这种关系的复句叫并列复句。

    一边……一边……;那么……那么……;既……又……;一会儿……一会儿……;一方面……一方面……

    转折关系:前一个分句提出一种情况,后一个分句不是顺着前一个分句意思说下去,而是转到相反的意思上去,这种关系的复句叫转折复句。

    虽然……但是……;尽管……可是……;虽然……可是……;可是……;但……;却……

    递进关系:后一个分句的意思比前一个分句更进一层,这种关系的复句叫递进复句。

    不但……而且……;不仅……还……;不仅……而且……;除了……还……;而且……

    选择关系:几个分句分别说出几件事情,表示选择其中一件,这种关系的复句叫选择复句。

    不是……就是……;要么……要么……;是……还是……;或者……或者……

    假设关系: 前一个分句提出假设,后一个分句说出假设实现后会有的结果。

    如果……就、要是……就、即使……也、哪怕……也、如果 (假使、假如、要是、倘若、要是)……那麼(就) 、即使(就算、就是、哪怕、纵使)

    ……也(仍然、还是) 。

    承接关系:几个分句依次说出连续发生的行动或事情,这种关系的复句叫承接复句。

    首先……接着……然后……;……又……;……就……;……然后……

    关联词语使用常见错误:1、错用

    例:宋徽宗赵佶只知道吃喝玩乐。为了喜欢踢球,就把一个破落弟子(高俅)封为殿帅府太尉。

    【应把“为了”改为“因为”;也可以把“就”移到“因为”前面】

    2、搭配不当

    例:只有你意识到这一点,你就能深刻地了解我们战士的胸怀是多么宽广。

    【“只有”与“才”搭配,应把“就”换成“才”】

    关联词语的辨别:有些短语看起来比较像关联词,但是并非关联词。譬如像“一下子……一下子……”等等,这些都不是关联词,也不是排比句。

    排比句是拥有三个或三个地方以上的相同词语或句子组成的句群。

    像这种词语相同却不到三个的词语只能算是连带词或者连续词。

    下面列举一些常用的表示不同关联关系的关联词:

    1、转折关系

    虽然……但是……

    尽管……还是……

    尽管……但是……

    …… 却……

    ……然而……

    ……但是……

    即使……也……

    2、假设关系

    如果……就……

    要是……那么

    不管…也……

    倘若……就……

    要是……就……

    倘若......便......

    3、并列关系

    一边……一边……

    一会儿…… 一会儿……

    不是......而是......

    既……又……

    4、递进关系

    不但……而且……

    不光……也……

    不仅……还……

    不但……还……

    5、选择关系

    是……还是……

    要么……要么……

    与其……不如……

    宁可……也不……

    或者......或者......

    因果关系

    因为……所以……

    之所以……是因为……

    由于……因此……

    6、承接关系

    先……再……

    首先……接着……然后……再……又

    先……然后……

    接着……最后……

    一……就……

    7、条件关系

    只要……就……

    只有……才……

    无论 (不论、不管、任凭)……都(也、还) 。

    不仅……还……

    ……却……

    ……是……是……

    关联词语的作用及搭配原则:

    (一)同一个句子,运用不同的关联词语,作用就不同,表达的意思也就不一样。

    例如:“我们共同努力,竞赛取得胜利。”这个句子没有使用关联词语,可以看作是并列关系。

    如果加上不同的关联词语,句子的关系就起了变化:

    1.因为我们共同努力,所以竞赛取得胜利。

    2.如果我们共同努力,竞赛就能取得胜利。

    3.只要我们共同努力,竞赛就能取得胜利。

    这样,第一句成了因果关系,第二句成了假设关系,第三句成了条件关系。

    在我们平时的说话、造句或作文当中,究竟选用什么关系,这就要根据自己表达的需要来确定。

    (二)要注意配对使用关联词语

    有些关联词语是要求配对使用的,不可随意改换。

    例如:

    1.只要经常锻炼身体,才会增强体质。

    2.他宁可挨打,不如泄密。

    3.不管天气多么恶劣,他却是按时到校学习 。

    第一句,“只要”应与“就”相配,“只有”应与“才”相配,“只要”与“才”搭配不当,应把“才”改为“就”。

    第二句,“宁可”应与“也不”相配,“与其”应与“不如”相配。

    句中“宁可”与“不如”搭配不当,根据两个分句的意思,最好是把“不如”改为“也不”。

    第三句,“不管”与“却”搭配不当,应把“却”改为“都”。

    (三)关联词语的位置不能放错

    例如:

    1.虽然今天天气十分寒冷,却清洁工流下了汗。

    2.今天,我们班搞演讲比赛,表达能力强的同学不但上台演讲了,而且从小不爱说话的小明也上去演讲了。

    第一句,“却”表示转折的意思并没有错,可是,一念原句就给人不通顺的感觉。

    如果把“却”放在“清洁工”之后,句子就通顺了。

    第二句,让人念起来感到很别扭,如果把“不但”放在“表达能力强的同学”前面,句子就顺畅了。

    (四)该用关联词的地方不能缺少关联词

    有一部分配对使用的关联词,可根据情况省略其中的前一个,如“不但……而且……”,可省去“不但”、“虽然……但是”,可省去“虽然”。

    但一般不能省去后一个的“而且”、“但是”。

    如果只用前一个关联词语,而省去了后一个关联词语,句子间的关系就会不明确,句子的意思也会表达不清。例如:

    1.自从开展“一帮一”的活动以后,不但加深了同学之间的相互了解,增进了同学之间的友谊。

    2.如果我们齐心协力,把这件事情办好。

    第一句在意思上有递进的关系,但缺少了一个与“不但”配对使用的关联词语,让人读了以后,感觉话没有说完,递进的关系也不清楚。

    如果在“增进了同学之间的友谊”前面加上“而且”或者“并且”,不但递进的关系明确了,句子的意思也清楚了。

    第二句是假设关系的句子,前面一个分句表示假设的情况,后一分句表示结果。

    因为缺少与“如果”配对使用的关联词“就”,句中的结果就不明确,让人读后也有一种话未说完的感觉。

    要是在“把这件事情办好”之前加上“就能”,句子的意思就清楚了。

    (五)不要乱用关联词

    例如:

    1.他自己不跟老师讲,并且要我讲。

    2.我的成绩差,可是我能虚心地向老师请教,但是诚恳地向优秀同学学习,所以我有了很大的进步。

    第一句应该是转折关系,不是递进关系。乱用“并且”,使语意表达不清,应把“并且”改为“却”。

    第二句,乱用“但是”,应删去。

    一、读下面的句子,选择恰当的关联词语填在括号内。

    “不仅……还……”、“虽然……还是……”、“尽管……还……”、“因为……所以……”、“只有……才……”、“宁可……也不……”。

    “重载货车驶过桥面时,行走在桥上的行人能够感受到大桥的轻微震动,伊犁河对岸建成火电厂后,拉煤的货车更让大桥不堪重负。2004年伊犁河二桥开始在距离大桥以西不远的下游修建,并在2007年建成通车,桥梁路面全长1580米,桥面宽27米,成为新疆目前跨度最大的钢构式公路桥。

    既……又……”、“不仅……而且……”、“如果……就……”、“不是……就是……”、“不管……总……”、“一边……一边……”、“可是”、“因而”、“并且”、“所以”。

    还有,一边,一边,一边。

    用好关联词可以大大提高句子的美感,使句子更加生动。

    关联词的位置:

    有些关联词语既能放在主语前,也能放在主语后,但有一定的条件;有些关联词语的位置则相当固定。关联词语的位置如果摆得不对,就会使句子不顺畅,意思不清楚。

    关联词语配合运用,有一定的规律,如“一方面……另一方面”这组关联词语,如果分句主语相同,位置就比较自由;分句主语不同,只能出现在主语前。

    又如“不但……而且”这组关联词语,如果分句主语相同,“不但”放在主语后;分句主语不同,“不但”放在主语前。

    展开全文
  • 提出了一种基于语义关联的中文网页主题提取方法,首先借助滑动窗口和“知网”计算词语间的语义相似度,形成候选名词对集合;然后基于该集合生成无向图表示词语间的语义联系,并通过该无向图对主题权重进行建模;...
  • 为了解决传统文本表示方法袋模型对文本语义的忽略问题,提出一种融合关联关系和统计信息的短文本建模方法。通过词语之间的内联及外联关系耦合得到词语关联关系,充分挖掘了显示和隐含的语义信息;同时以关联关系...
  • 该方法利用词语关联分布规范化因子,对互信息中目标和基关联度度量方法进行了修正,通过计算目标和基关联度,构造目标的属性向量,由目标的属性向量,利用夹角余弦法计算出目标词语相似度。实验结果验证...
  • 关于相似性以及文档特征、特征有太多种说法。弄得好乱,而且没有一个清晰逻辑与归类,包括一些经典书籍里面也分得概念模糊,所以擅自分一分。 ————————————————————————————...
  • 机器学习相关文献里面,经常会用到点互信息PMI(Pointwise Mutual Information)这个指标来衡量两个事物之间的相关性(比如两个)。 其原理很简单,公式如下: 在概率论中,我们知道,如果x跟y不相关,则p(x,y)=p(x...
  • 三分钟实现Python中文词语分析

    千次阅读 2020-06-20 12:58:10
    str2 = "美男子" r = synonyms.compare(str1, str2, seg=True) print("相似度:"+str(r)) 从逻辑和认知层次上讲不脱发的程序猿是十足的美男子,但是从词语的相似度上分析,两者并无关联,所以词性相似度仅有0.041%,...
  • 形式如下:统计语言模型的一般形式直观、准确,n元模型中假设在不改变词语在上下文中的顺序前提下,距离相近的词语关系越近,距离较远的关联度越远,当距离足够远时,词语之间则没有关联度。但该模型没有完全利用...
  • NRC词语情绪词典和词语色彩词典

    千次阅读 2019-12-16 08:55:00
    关联在WordNet中表现为紧密(程度较小),在文本中表现为较高的同时出现率(程度较大)(第8节)。 色彩词典截图 词语颜色词典目前只有英文版,截图如下 情绪词典 情绪通常通过不同的面部表情来表达(亚里士多德...
  • 提出了词语相关度模型,作为在数据空间中发现数据源内容关联的一个基础。本模型基于HowNet,可以计算同种词性以及不同词性之间的相关度,融合了词语的相似度、关联度和实例因素,综合获得词语的内在相关性。通过对比...
  • 在领域情感词典构建过程中,通常仅使用词频作为筛选种子词集的标准,而并未考虑其内部词语关联程度,这会导致种子词集聚类效果不明显,进而影响情感词语归类精度。因此,基于向量模型,提出一种情感词典种子词集...
  • python实现PMI(求词语关联性)

    千次阅读 2018-03-19 20:37:25
    至于PMI,是在文本处理中,用于计算两个词语之间的关联程度.比起传统的相似度计算, pmi的好处在于,从统计的角度发现词语共现的情况来分析出词语间是否存在语义相关 , 或者主题相关的情况.场景实例说起接触PMI的原因,是...
  • 上下文句子之间的关联性分析可分为定性和定量两种形式,作者以词语相关关系量化分析为基础,将上下文句子之间的相关度看成是由组成两个句子的所有对之间的量化相关关系的组合结果,来定量地计算句子之间的相关度。...
  • 一、题文用恰当的关联词将下面两句话合并成一句话。1.①计算机联网,可以随时接收文字信息。②计算机联网,可以接收声音、图像信息。2.①各路诸侯看到了烽火。②各路诸侯火速率兵出击。3.①同学们沉迷于网络黑洞...
  • 本文提出了结合关联置信度与结巴分词的新词发现算法,该算法以结巴分词的初步分词结果为基础,通过计算词语与其左右邻接集中各个词语之间的关联置信度,将被错误拆分的词语合并成候选新词,并通过切分连接以防止...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,942
精华内容 3,976
关键字:

关联词词语