精华内容
下载资源
问答
  • 共现分析

    万次阅读 2017-09-28 10:22:49
    共词分析法利用文献集中词汇对名词短语共同出现的情况,来确定该文献集所代表学科中个主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。由此,统计一组文献的主题词两两...

    一、共现分析概念

    “共现”指文献的特征项描述的信息共同出现的现象,这里的特征项包括文献的外部和内部特征,如题名、作者、关键词、机构等。 而“共现分析”是对共现现象的定量研究, 以揭示信息的内容关联和特征项所隐含的知识。

    二、共现类型

    (一)传统环境下的共现分析类型


    (二)网络环境下的共现分析类型


    三、共词分析概念

    共词分析法利用文献集中词汇对名词短语共同出现的情况,来确定该文献集所代表学科中个主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。由此,统计一组文献的主题词两两之间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络,网络内节点之间的远近便可反映主题内容的亲疏关系。

    四、共词分析的过程

    1、确定分析的问题

    2、确定分析单元:如何进行词源选择?关键词?主题词?从全文抽取?

    在共词分析方法中分析单元的选择通常是从关键词、同一标引的主题词、标题及摘要提取词等途径获取。另外,大量学者开始意识到传统词汇选择的弊端,通过不同方法来改进,如同义词合并、正文关键词抽取、LDA建模等。

    3、词汇差异化处理

    传统共词分析假定关键词的独立性,忽略了词汇的差异,因此需要有效区分词汇间的差异,考虑关键词“同量不同质”的现象,改善共词分析的效果。

    4、核心关键词选定

    受工具、人力的限制以及结果分析和呈现的需要,研究者通常只选取小部分关键词作为共词分析的对象。其中,词频筛选是最为直接的方式,但会忽略关键词的语义关联,为此,学者从多个角度进行改进,一类是基于传统词频优化,如最大频繁项集,三元共现高频词;另一类是提出新的指标或方法提取核心词,如基于网络节点中心性、词汇链、核心/边缘结构模型及词语贡献度等。

    4、关键词共现关系度量

    传统共现分析通常基于文献中关键词对的共现性来构建共词矩阵,但缺乏对关键词对间语义关系和关系强度的解释,为此,学者提出了借助RDF三元组对关联数据进行细粒度和语义关联化等方法来改善。

    5、共词分析中的统计方法

    共现矩阵的计算是共词分析的重要一步,在此基础上采用不同的统计学方法,揭示共词中的信息,常用的统计分析方法有:聚类、关联规则、词频、突发伺监测、因子分析、贝叶斯分类等。

    6、对共词结果的分析

    五、共词分析的主要类型

    1、共词聚类分析法

    词对在同一篇文献出现的频率,反映词对间关系紧密的程度。对共词关系网络中的词与词之间的距离进行数学运算,将距离较近的主题词聚集起来,形成一个个概念相对独立的类团,使得类团内属性相似性最大,类团间属性相似性最小。

    2、共词关联分析法

    关联规则是描述一个事物中物品同时出现的规律的知识模式,即通过量化的数据描述物品A的出现对物品B的出现有多大影响。例如在一篇有关某病的药物治疗文献中,对该文的标引时,除了有“病A/药物治疗”的主题词外,“药B/治疗应用”的主题词也很有可能同时存在,以表达药B有治疗某病A的功效。共词关联分析以此为原理,通过关联统计方法,揭示主题词间的依存关系。

    3、共词词频分析法

    一种揭示或表达文献核心内容的关键主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量法,通常将共现聚类和共词词频分析相互结合。

    4、突发词监测法

    关注焦点词相对增长率突然增长的词,基于单个词的词频增长率变化更有可能涉及到领域局部热点的变化。


    展开全文
  • 共现分析软件bibexcel

    2011-05-15 22:52:18
    文献信息分析软件,可用于关键词共现分析,很好用的。
  • 中国医科大学开发的书目共现分析软件,可以方便地对大量文献进行统计、分析。尤其重要的是它是中文的。压缩包里有说明书。解压后先运行bde_install,再运行bicomb.exe。
  • 针对科技资源中缩略语大量出现,但传统算法识别准确率不高,运行速度较慢问题,提出一种基于逆序扫描和共现分析相结合的术语缩略语快速提取算法。从科技资源中提取缩略语、候选全称及上下文信息;采用启发式模糊匹配...
  • BICOMB(书目共现分析系统,Bibliographic Items Co-occurrence Matrix Builder)是一款文本挖掘的基础工具软件,BICOMB可对国际上权威的生物医学文献数据库PubMed、引文数据库Science Citation Index (SCI)、中国...
        BICOMB(书目共现分析系统,Bibliographic Items Co-occurrence Matrix Builder)是一款文本挖掘的基础工具软件,BICOMB可对国际上权威的生物医学文献数据库PubMed、引文数据库Science Citation Index (SCI)、中国知网(CNKI)和万方数据等数据库的文献记录进行读取分析,并允许用户对系统功能进行修改、增加等拓展。
    

    笔者查找到近年来使用BICOMB软件的学术论文如下:
    [1]王超.基于Bicomb国际教育管理计量分析研究[J].云南农业大学学报(社会科学版),2012,6(6):40-45,60.
    [2]王敏,郭文斌.我国近十年情绪调节研究热点知识图谱[J].心理研究,2011,04(5):56-59.
    [3]郭文斌,方俊明,陈秋珠等.基于科学知识图谱的我国脑认知研究[J].渭南师范学院学报:综合版,2011,(8):88-91.
    [4]刘旭东,田百玲,杨娉婷等.近期国外干燥综合征研究热点的文献分析[J].中华临床医师杂志(电子版),2012,06(10):2793-2795.
    [5]李佳培,张蔷.基于共词分析的国内“资源环境承载力”文献研究[J].中国国土资源经济,2013,(9): 47-5
    [6]许婷婷,陈秋珠,郭文斌等.我国近十年自我概念研究热点知识图谱[J].渭南师范学院学报:综合版,2012,(10):85-89.
    [7]薛调.近5年农家书屋研究论文热点分析[J].图书情报工作,2011,55(17):57-60,86.
    [8]张浩,成施充,崔雷等.我国情报学硕士学位论文研究热点分析[J].医学信息学杂志,2012,33(2):44-47.
    [9]陈立,赵微.我国数学学习困难研究现状述评[J].中国特殊教育,2013,(8):61-66.
    [10]郭文斌,陈秋珠.特殊教育研究热点知识图谱[J].华东师范大学学报(教育科学版),2012,(3):49-54.
    [11]郭文斌,方俊明,陈秋珠等.基于关键词共词分析的我国自闭症热点研究[J].西北师大学报(社会科学版),2012,49(1):128-132.
    [12]完颜邓邓.基于共词分析的国内链接分析研究[J].新世纪图书馆,2013,(10):30-32,47.
    [13]杨金凤,马巧丽.基于共词分析的甘肃省种植业热点领域分析[J].甘肃农业大学学报,2013,48(4):170-175.
    [14]谭春辉,桑静.我国人文社会科学评价研究三十年–基于CNKI期刊数据库的可视化分析[J].情报杂志,2013,(12):132-138.
    [15]戴诚,成全.近十年我国社会网络研究热点透析[J].现代情报,2013,33(5):160-167.
    [16]康红芹.近十年我国成人教育研究热点透析——基于硕士学位论文的共词分析[J].职教论坛,2012,(6):38-41.2012.06.010.
    [17]刘洋,张博特,郑洪新等.基于文献的肾虚专题核心研究者与学术团队分析[J].中国中医药信息杂志,2011,18(12):31-33,52.
    [18]郭文斌,范晓壮,方俊明等.心理学研究的热点及变化——基于2002-2013年《心理科学进展》刊文的分析[J].心理研究,2013,6(5):42-50.
    [19]陈立.我国残疾人就业问题研究热点透视[J].绥化学院学报,2013,33(9):114-118.
    [20]宋进英,米卫.近五年我国炼钢学科领域研究热点分析[J].农业网络信息,2013,(8):56-59.
    [21]完颜邓邓,盛小平.基于共词分析的国内开放存取研究主题探析[J].图书情报工作,2013,57(5):94-100.
    [22]孙昱昭,闫雷.基于PubMed数据库的角膜移植手术文献计量分析[J].国际眼科杂志,2013,13(5):995-997.
    [23]张浩,陈小清.利用矩阵分解提取生物医学文献中潜在相关基因[J].医学信息学杂志,2013,34(5):55-60,70.
    [24]朱之翰,郭文斌.我国近十年自我效能研究热点知识图谱[J].心理研究,2013,6(1):66-70.
    [25]李燕萍.基于共词分析的我国文献计量学研究主题分析[J].图书馆界,2012,(5):41-43,94.
    [26]乐思诗.基于CNKI的高职院校图书馆研究热点可视化分析[J].内蒙古科技与经济,2012,(14):40-41,43.
    [27]李燕萍,张玲,李选政等.《中华神经医学杂志》研究主题的共词分析[J].中华医学图书情报杂志,2012,21(5):70-74.
    [28]郭会雨,张文举,李娜等.我国医学领域本体研究热点分析—共词可视化视角[J].预防医学情报杂志,2012,28(5):397-401.
    [29]刘静.中美医学教育研究热点及发展趋势的研究[D].中国医科大学,2013.
    [30]龚靖淋.基于文献的游离组织瓣血管危象专题研究状况与趋势分析[D].中国医科大学,2013.
    [31]周东花.基于引文网络结构分析法的科学领域核心文献的发现与评价——以医学信息学为例[D].中国医科大学,2011.
    [32]杨宇.基于文献的cNO专题研究状况与趋势分析[D].中国医科大学(辽宁),2012.
    [33]高小燕.医疗器械风险管理研究的文献计量学分析[D].中国医科大学,2013.
    [34]赵悦阳.HITS算法在文本聚类结果特征提取中的应用[D].中国医科大学,2011.
    [35]张洋.基于文献挖掘的心血管药物副作用的自动抽取与描述[D].中国医科大学,2013.
    [36]方丽.利用双聚类和突发检测算法探测学科前沿及知识基础的比较分析——以h指数研究领域为例[D].中国医科大学,2013.
    [37]张薇.基于文献轮廓的疾病相关基因的功能分析:以非小细胞肺癌为例[D].中国医科大学,2010.
    [38]刘洋.引文上下文在文献内容分析中的信息价值研究[D].中国医科大学,2013.
    软件下载地址:http://202.118.40.8/bc/index.html

    展开全文
  • 书目共现分析系统

    2014-10-08 14:02:27
    作为文本挖掘的基础工具,BICOMB 可对国际上权威的生物医学文献数据库...Science Citation Index(SCI)、中国知网(CNKI)和万方数据等数据库的文献记录进行读取分析,并允 许用户对系统功能进行修改、增加等拓展。
  • BICOMB2书目共现分析系统视频教学视频教程详情重点提醒:学习软件最好的方式就是看视频学习,我将会录制可视化系列视频,并结合核心论文进行讲解图谱,节省你自学的大量时间,时间最宝贵!视频里我详细介绍了每个...
    843e489c4ee69c7d510a2b18b7186a50.pngf64ca34c6e5170fefd459049a81b1b82.png

    BICOMB2书目共现分析系统视频教学

    25678b57e6e4e71a72888b543f452075.gif

    视频教程详情

    重点提醒:学习软件最好的方式就是看视频学习,我将会录制可视化系列视频,并结合核心论文进行讲解图谱,节省你自学的大量时间,时间最宝贵!

    视频里我详细介绍了每个功能的应用,以免有些同学能做出图而不知如何解读!全是干货,提升自己的时候到啦啦啦啦啦啦!

    软件介绍:

    主要功能:文献计量、做词篇矩阵【可进行双聚类分析】和共现矩阵

    今天给大家录制了如何利用BICOMB2进行数据的各种统计分析。

    通过学习你将能够独立完成以上BICOMB2功能。

    6cc63ad760184602fc6d6ef9f160af9f.png

    ece7a987590b0bbf1dfad7444b2bf184.png

    至此你已经学会了利用BICOMB2软件做可视化全过程啦,赶快试试吧!

    免费的东西没人会在意,所以每个软件使用步骤视频都收取了一点点费用,一方面引起你对学习的重视,一方面激励一下我生产出更好的内容! 在此保证内容远超这个白菜价。理解万岁。

    1b243d303101307d2139bf7f060846c6.gif

    25678b57e6e4e71a72888b543f452075.gif

    展开全文
  • 本系统通过引入包括三词在内的多词共现分析方法,我们可以在更大的范围内搜寻词语之间的语义相关性,同时增强语义相关度的识别效果。目前,实现了两种推荐形式: 1)根据个人作者的名称来给出推荐结果 该形式主要...
  • 语言网络图中节点基本上都是词,根据词的链接方式不同,语言网络的主要形式分为四种:共现网络图、语法网络图、语义网络图和其他网络图。 在语言网络图的构建过程中,都是以预处理过后的词作为节点,词与词之间的...
  • value='频次') sh.cell(row=i, column=1, value=str(key)) sh.cell(row=i, column=2, value=dic[key]) i+=1 workbook.save(r'name.xlsx') 2 统计词共现的全部代码 注意,'一行作者.txt’这个文件必须是每篇文献的...
  • 需求分析从方法上可以分为定性分析和定量分析。定性分析偏向于通过用户访谈等方式展开;定量分析则通常会基于用户使用产品过程中留下的客观记录进行统计分析,这些客观记录包括行为日志、交易日志等等。今天,我们就...
  • SATI),旨在通过对期刊全文数据库题录信息的字段抽取、频次统计和共现矩阵构建,利用一般计量分析、共现分析、聚类分析、多维尺度分析、社会网络分析等数据分析方法,挖掘和呈现出美妙的可视化数据结果。...
  • 所有详情见:书目共现分析系统使用说明书"数据收集"部分(6-12页) 四、具体使用 见战略坐标图的制作——三、词篇处理(bicomb) 五、官方相关文档 1.使用说明书 2.共线聚类分析结果判读 目录: 一.词共现聚类分析的...
  • 3.2 TextRank算法分析 类似于PageRank的思想,将文本中的语法单元视作图中的节点,如果两个语法单元存在一定语法关系(例如共现),则这两个语法单元在图中就会有一条边相互连接,通过一定的迭代次数,最终不同的...
  • 在学习数据分析时,我们常会提到由于某某数据是某类型,所以采取对于的统计分析方法。所以对于数据类型的了解就变得十分必要。根据存储方式划分根据存储方式,我们可以把数据分为结构化数据和非结构化数据。结构化...
  • BDE: 链接:https://pan.baidu.com/s/1dLF2-zKJGEztHdUHtnCsHw 提取码:184d Bicomb: 链接:...打开spass 文件---打开----数据---打开导出的矩阵 分析---分类---系统聚类
  • 前两天简单地做了一个文本挖掘实战分析,里面提到了共现分析,但是并没有完成,有些遗憾 经过查阅资料,最终还是粗糙地完成了这个分析 对于共现分析 共词网络方法在知识网络研究中应用普遍,最为常见的就是利用...
  • 中国现代诗歌的共现网络分析
  • 基于关键词共现的文本信息分析方法及应用研究--以信用评价为例,王功辉,刘卫江,关键词共现分析是文献计量学中常用的一种重要的量化研究方法,本文以文本的关键词为基础,从关键词的共同标引为切入点,采用量化
  • : 词频统计和共现分析 代码见以上的链接,本节展示处理前后的结果。 1.1 作者词频 如上图所示,列表中一列数据为作者,每篇文章一行,一个单元格包括该文全部作者,且用英文分号隔开。运行代码之后,生成表格,手工...
  • 4.3 LAD模型主题分析 4.3.1 gensim 实现LDA主题模型 4.3.2 scikit-learn 实现LDA主题模型 4.4 共现网络分析 1 数据抓取 此次抓取的为大江大河2弹幕数据,考虑到篇幅,这里不过多介绍抓取的详细流程。具体的过程可以...

空空如也

空空如也

1 2 3 4 5 ... 18
收藏数 345
精华内容 138
关键字:

共现分析