精华内容
下载资源
问答
  • 书目共现分析系统

    2014-10-08 14:02:27
    作为文本挖掘的基础工具,BICOMB 可对国际上权威的生物医学文献数据库...Science Citation Index(SCI)、中国知网(CNKI)和万方数据等数据库的文献记录进行读取分析,并允 许用户对系统功能进行修改、增加等拓展。
  • 共现分析

    万次阅读 2017-09-28 10:22:49
    共词分析法利用文献集中词汇对名词短语共同出现的情况,来确定该文献集所代表学科中个主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。由此,统计一组文献的主题词两两...

    一、共现分析概念

    “共现”指文献的特征项描述的信息共同出现的现象,这里的特征项包括文献的外部和内部特征,如题名、作者、关键词、机构等。 而“共现分析”是对共现现象的定量研究, 以揭示信息的内容关联和特征项所隐含的知识。

    二、共现类型

    (一)传统环境下的共现分析类型


    (二)网络环境下的共现分析类型


    三、共词分析概念

    共词分析法利用文献集中词汇对名词短语共同出现的情况,来确定该文献集所代表学科中个主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。由此,统计一组文献的主题词两两之间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络,网络内节点之间的远近便可反映主题内容的亲疏关系。

    四、共词分析的过程

    1、确定分析的问题

    2、确定分析单元:如何进行词源选择?关键词?主题词?从全文抽取?

    在共词分析方法中分析单元的选择通常是从关键词、同一标引的主题词、标题及摘要提取词等途径获取。另外,大量学者开始意识到传统词汇选择的弊端,通过不同方法来改进,如同义词合并、正文关键词抽取、LDA建模等。

    3、词汇差异化处理

    传统共词分析假定关键词的独立性,忽略了词汇的差异,因此需要有效区分词汇间的差异,考虑关键词“同量不同质”的现象,改善共词分析的效果。

    4、核心关键词选定

    受工具、人力的限制以及结果分析和呈现的需要,研究者通常只选取小部分关键词作为共词分析的对象。其中,词频筛选是最为直接的方式,但会忽略关键词的语义关联,为此,学者从多个角度进行改进,一类是基于传统词频优化,如最大频繁项集,三元共现高频词;另一类是提出新的指标或方法提取核心词,如基于网络节点中心性、词汇链、核心/边缘结构模型及词语贡献度等。

    4、关键词共现关系度量

    传统共现分析通常基于文献中关键词对的共现性来构建共词矩阵,但缺乏对关键词对间语义关系和关系强度的解释,为此,学者提出了借助RDF三元组对关联数据进行细粒度和语义关联化等方法来改善。

    5、共词分析中的统计方法

    共现矩阵的计算是共词分析的重要一步,在此基础上采用不同的统计学方法,揭示共词中的信息,常用的统计分析方法有:聚类、关联规则、词频、突发伺监测、因子分析、贝叶斯分类等。

    6、对共词结果的分析

    五、共词分析的主要类型

    1、共词聚类分析法

    词对在同一篇文献出现的频率,反映词对间关系紧密的程度。对共词关系网络中的词与词之间的距离进行数学运算,将距离较近的主题词聚集起来,形成一个个概念相对独立的类团,使得类团内属性相似性最大,类团间属性相似性最小。

    2、共词关联分析法

    关联规则是描述一个事物中物品同时出现的规律的知识模式,即通过量化的数据描述物品A的出现对物品B的出现有多大影响。例如在一篇有关某病的药物治疗文献中,对该文的标引时,除了有“病A/药物治疗”的主题词外,“药B/治疗应用”的主题词也很有可能同时存在,以表达药B有治疗某病A的功效。共词关联分析以此为原理,通过关联统计方法,揭示主题词间的依存关系。

    3、共词词频分析法

    一种揭示或表达文献核心内容的关键主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量法,通常将共现聚类和共词词频分析相互结合。

    4、突发词监测法

    关注焦点词相对增长率突然增长的词,基于单个词的词频增长率变化更有可能涉及到领域局部热点的变化。


    展开全文
  • 共现分析软件bibexcel

    2011-05-15 22:52:18
    文献信息分析软件,可用于关键词共现分析,很好用的。
  • 中国医科大学开发的书目共现分析软件,可以方便地对大量文献进行统计、分析。尤其重要的是它是中文的。压缩包里有说明书。解压后先运行bde_install,再运行bicomb.exe。
  • value='频次') sh.cell(row=i, column=1, value=str(key)) sh.cell(row=i, column=2, value=dic[key]) i+=1 workbook.save(r'name.xlsx') 2 统计词共现的全部代码 注意,'一行作者.txt’这个文件必须是每篇文献的...

    1 对关键词的词频进行统计

    下面展示一些 内联代码片

    # encoding=utf-8
    import openpyxl
    wb = openpyxl.Workbook()
    wb = openpyxl.load_workbook('copy1.xlsx')       # Excel名
    sh = wb['all']                              # sheet名
    '''
    换一种写法
    row=sh.max_row                             # 得到行数
    '''
    cons=[]  # 将所有数据append成一个list
    for cases in list(sh.rows)[1:9240]: # 行数,也可以通过代码来带入 即row
        case_D = cases[2].value         # 关键词所在的列
        cons.append(case_D)   
    
    result_new = []
    res2 = []
    for con in cons:
        fenci = con.strip().split('; ') # 假定关键词是以分号+空格分开的
        result_new.append(fenci)
    new = sum(result_new,[])
    res2.append(new)
    #print(res2)  # res2的形式是   [['aaa','bbb','abc']]
    
    import collections
    dic = collections.Counter(res2[0])
    
    from openpyxl import Workbook
    workbook = Workbook()
    i=2                          # 默认sheet
    sh = workbook.active
    sh.title = "count"           #sheet名     
    for key in dic:
        sh.cell(row=1, column=1, value='关键词')
        sh.cell(row=1, column=2, value='频次')    
        sh.cell(row=i, column=1, value=str(key))
        sh.cell(row=i, column=2, value=dic[key])
        i+=1
    workbook.save(r'name.xlsx')
    

    2 统计词共现的全部代码

    注意,'一行作者.txt’这个文件必须是每篇文献的作者之间通过//连接成一行,合作作者通过分号+空格连接。

    import pandas as pd
    import numpy as np
    from openpyxl import Workbook
    
    def authors_stat(co_authors_list):
        au_dict = {}  # 单个作者频次统计
        au_group = {}  # 两两作者合作
        for authors in co_authors_list:
            authors = authors.split('; ')  # 按照逗号分开每个作者
            authors_co = authors  # 合作者同样构建一个样本
            for au in authors:     # 统计单个作者出现的频次
                if au not in au_dict:
                    au_dict[au] = 1
                else:
                    au_dict[au] += 1
                # 统计合作的频次
                authors_co = authors_co[1:]  # 去掉当前作者
                for au_c in authors_co:
                    A, B = au, au_c  # 不能用本来的名字,否则会改变au自身
                    if A > B:
                        A, B = B, A  # 保持两个作者名字顺序一致
                    co_au = A+'; '+B  # 将两个作者合并起来,依然以逗号隔开
                    if co_au not in au_group:
                        au_group[co_au] = 1
                    else:
                        au_group[co_au] += 1
        return au_group, au_dict
    
    if __name__ == '__main__':
        f1 = open('一行作者.txt','r',encoding = 'utf-8')
        cons = f1.read()
        co_authors = cons
        co_authors_list = co_authors.split('//')
        au_group, au_dict = authors_stat(co_authors_list)
     
        workbook = Workbook()
        i=2   # 默认sheet
        sh = workbook.active
        sh.title = "count"
        for (k,v) in  au_group.items(): 
            sh.cell(row=1, column=1, value='合作作者')
            sh.cell(row=1, column=2, value='频次') 
            sh.cell(row=i, column=1, value=str(k))
            sh.cell(row=i, column=2, value=v)
            i+=1
        workbook.save(r'co_author.xlsx')
    

    在这里插入图片描述
    下次教画图。

    接下来就是愉快的分析啦。
    over is Over——Lee

    展开全文
  • BICOMB(书目共现分析系统,Bibliographic Items Co-occurrence Matrix Builder)是一款文本挖掘的基础工具软件,BICOMB可对国际上权威的生物医学文献数据库PubMed、引文数据库Science Citation Index (SCI)、中国...
        BICOMB(书目共现分析系统,Bibliographic Items Co-occurrence Matrix Builder)是一款文本挖掘的基础工具软件,BICOMB可对国际上权威的生物医学文献数据库PubMed、引文数据库Science Citation Index (SCI)、中国知网(CNKI)和万方数据等数据库的文献记录进行读取分析,并允许用户对系统功能进行修改、增加等拓展。
    

    笔者查找到近年来使用BICOMB软件的学术论文如下:
    [1]王超.基于Bicomb国际教育管理计量分析研究[J].云南农业大学学报(社会科学版),2012,6(6):40-45,60.
    [2]王敏,郭文斌.我国近十年情绪调节研究热点知识图谱[J].心理研究,2011,04(5):56-59.
    [3]郭文斌,方俊明,陈秋珠等.基于科学知识图谱的我国脑认知研究[J].渭南师范学院学报:综合版,2011,(8):88-91.
    [4]刘旭东,田百玲,杨娉婷等.近期国外干燥综合征研究热点的文献分析[J].中华临床医师杂志(电子版),2012,06(10):2793-2795.
    [5]李佳培,张蔷.基于共词分析的国内“资源环境承载力”文献研究[J].中国国土资源经济,2013,(9): 47-5
    [6]许婷婷,陈秋珠,郭文斌等.我国近十年自我概念研究热点知识图谱[J].渭南师范学院学报:综合版,2012,(10):85-89.
    [7]薛调.近5年农家书屋研究论文热点分析[J].图书情报工作,2011,55(17):57-60,86.
    [8]张浩,成施充,崔雷等.我国情报学硕士学位论文研究热点分析[J].医学信息学杂志,2012,33(2):44-47.
    [9]陈立,赵微.我国数学学习困难研究现状述评[J].中国特殊教育,2013,(8):61-66.
    [10]郭文斌,陈秋珠.特殊教育研究热点知识图谱[J].华东师范大学学报(教育科学版),2012,(3):49-54.
    [11]郭文斌,方俊明,陈秋珠等.基于关键词共词分析的我国自闭症热点研究[J].西北师大学报(社会科学版),2012,49(1):128-132.
    [12]完颜邓邓.基于共词分析的国内链接分析研究[J].新世纪图书馆,2013,(10):30-32,47.
    [13]杨金凤,马巧丽.基于共词分析的甘肃省种植业热点领域分析[J].甘肃农业大学学报,2013,48(4):170-175.
    [14]谭春辉,桑静.我国人文社会科学评价研究三十年–基于CNKI期刊数据库的可视化分析[J].情报杂志,2013,(12):132-138.
    [15]戴诚,成全.近十年我国社会网络研究热点透析[J].现代情报,2013,33(5):160-167.
    [16]康红芹.近十年我国成人教育研究热点透析——基于硕士学位论文的共词分析[J].职教论坛,2012,(6):38-41.2012.06.010.
    [17]刘洋,张博特,郑洪新等.基于文献的肾虚专题核心研究者与学术团队分析[J].中国中医药信息杂志,2011,18(12):31-33,52.
    [18]郭文斌,范晓壮,方俊明等.心理学研究的热点及变化——基于2002-2013年《心理科学进展》刊文的分析[J].心理研究,2013,6(5):42-50.
    [19]陈立.我国残疾人就业问题研究热点透视[J].绥化学院学报,2013,33(9):114-118.
    [20]宋进英,米卫.近五年我国炼钢学科领域研究热点分析[J].农业网络信息,2013,(8):56-59.
    [21]完颜邓邓,盛小平.基于共词分析的国内开放存取研究主题探析[J].图书情报工作,2013,57(5):94-100.
    [22]孙昱昭,闫雷.基于PubMed数据库的角膜移植手术文献计量分析[J].国际眼科杂志,2013,13(5):995-997.
    [23]张浩,陈小清.利用矩阵分解提取生物医学文献中潜在相关基因[J].医学信息学杂志,2013,34(5):55-60,70.
    [24]朱之翰,郭文斌.我国近十年自我效能研究热点知识图谱[J].心理研究,2013,6(1):66-70.
    [25]李燕萍.基于共词分析的我国文献计量学研究主题分析[J].图书馆界,2012,(5):41-43,94.
    [26]乐思诗.基于CNKI的高职院校图书馆研究热点可视化分析[J].内蒙古科技与经济,2012,(14):40-41,43.
    [27]李燕萍,张玲,李选政等.《中华神经医学杂志》研究主题的共词分析[J].中华医学图书情报杂志,2012,21(5):70-74.
    [28]郭会雨,张文举,李娜等.我国医学领域本体研究热点分析—共词可视化视角[J].预防医学情报杂志,2012,28(5):397-401.
    [29]刘静.中美医学教育研究热点及发展趋势的研究[D].中国医科大学,2013.
    [30]龚靖淋.基于文献的游离组织瓣血管危象专题研究状况与趋势分析[D].中国医科大学,2013.
    [31]周东花.基于引文网络结构分析法的科学领域核心文献的发现与评价——以医学信息学为例[D].中国医科大学,2011.
    [32]杨宇.基于文献的cNO专题研究状况与趋势分析[D].中国医科大学(辽宁),2012.
    [33]高小燕.医疗器械风险管理研究的文献计量学分析[D].中国医科大学,2013.
    [34]赵悦阳.HITS算法在文本聚类结果特征提取中的应用[D].中国医科大学,2011.
    [35]张洋.基于文献挖掘的心血管药物副作用的自动抽取与描述[D].中国医科大学,2013.
    [36]方丽.利用双聚类和突发检测算法探测学科前沿及知识基础的比较分析——以h指数研究领域为例[D].中国医科大学,2013.
    [37]张薇.基于文献轮廓的疾病相关基因的功能分析:以非小细胞肺癌为例[D].中国医科大学,2010.
    [38]刘洋.引文上下文在文献内容分析中的信息价值研究[D].中国医科大学,2013.
    软件下载地址:http://202.118.40.8/bc/index.html

    展开全文
  • 书目共现分析系统——BICOMB2.0的下载与安装

    千次阅读 热门讨论 2020-07-21 23:28:30
    所有详情见:书目共现分析系统使用说明书"数据收集"部分(6-12页) 四、具体使用 见战略坐标图的制作——三、词篇处理(bicomb) 五、官方相关文档 1.使用说明书 2.共线聚类分析结果判读 目录: 一.词共现聚类分析的...

    一、下载

    安装包下载地址: link.(两个包都要下载)
    在这里插入图片描述

    二、安装

    1.解压缩bde_install.zip,进行安装,布置环境;
    2.解压bicomb2.01.rar,直接点击Bicomb.exe 即可打开软件。

    三、可分析数据库

    【bicomb系统只可对txt、xml两种格式的文件类型进行指定内容提取】
    1.PubMed获取的XML格式数据
    2.WOS获取的纯文本数据(全记录+参考文献)
    3.中国知网和万方的notefirst格式数据(本质就是 XML 格式)
    4.用户自建的数据集。但是在分析之前需要进行“格式定义”,具体方式方法见说明书。

    所有详情见:书目共现分析系统使用说明书"数据收集"部分(6-12页)

    四、具体使用

    战略坐标图的制作——三、词篇处理(bicomb)

    五、官方相关文档

    1.使用说明书
    在这里插入图片描述

    2.共线聚类分析结果判读
    目录:
    一.词共现聚类分析的结果判读
    二.同被引聚类分析结果的判读
    3.文献信息分析生物医学领域的应用
    目录:
    第一节 医学文献信息分析
    一、 文献信息分析的目的和意义
    二、 文献信息分析的理论与方法
    第二节 文献信息分析的内容
    三、 文献外部特征的分析
    1. 发表论文的期刊与核心期刊
    2. 论文的作者与核心作者
    3. 引文与引文分析指标
    四、 文献内容特征的分析
    1. 分类号、主题词与关键词
    2. 频次排序分析
    3. 共现分析
    4. 聚类分析
    5. 基于文献的知识发现
    五、 基于文献的知识发现软件
    1. 展现研究领域的结构
    1) CiteSpace
    2) HistCite
    2. 发现潜在的联系
    1) Arrowsmith
    2) BITOLA
    3) MedlineR
    4) GenClip

    展开全文
  • 针对科技资源中缩略语大量出现,但传统算法识别准确率不高,运行速度较慢问题,提出一种基于逆序扫描和共现分析相结合的术语缩略语快速提取算法。从科技资源中提取缩略语、候选全称及上下文信息;采用启发式模糊匹配...
  • python实现了知网论文的高频关键词提取,生成高频关键词矩阵,并进行了社会网络分析
  • 行业分类-物理装置-一种基于词频共现分析的文献表示方法.zip
  • BDE: 链接:https://pan.baidu.com/s/1dLF2-zKJGEztHdUHtnCsHw 提取码:184d Bicomb: 链接:...打开spass 文件---打开----数据---打开导出的矩阵 分析---分类---系统聚类
  • 此贡献中的函数可帮助您执行文本文档的共现分析并将结果可视化。 还提供了显示工作流程的 LiveScript。 (注意:在此示例中运行代码需要 Text Analytics Toolbox。) 此提交由 MathWorks 咨询服务 ( ...
  • Python 实现文本共现网络分析

    千次阅读 2021-01-23 19:13:30
    前两天简单地做了一个文本挖掘实战分析,里面提到了共现分析,但是并没有完成,有些遗憾 经过查阅资料,最终还是粗糙地完成了这个分析 对于共现分析 共词网络方法在知识网络研究中应用普遍,最为常见的就是利用...
  • bicomb安装后显示未找到文件,再点进去后显示在一个关闭的数据库中不能运行这个操作,请问一下怎么解决
  • 如何用VOSviewer分析CNKI关键词共现

    万次阅读 多人点赞 2018-01-05 00:00:00
    用VOSviewer尝试CNKI中文文献关键词共现(keyword co-occurence)分析时,你可能会踩到一个大坑。本文帮助你绕开这个坑,或是从坑里爬出来。(由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。如有...
  • 中国现代诗歌的共现网络分析
  • 共词分析

    万次阅读 多人点赞 2017-10-16 11:01:09
    一、共现分析概念及主要类型 “共现”指文献的特征项描述的信息共同出现的现象,这里的特征项包括文献的外部和内部特征,如题名、作者、关键词、机构等。而“共现分析”是对共现现象的定量研究,以揭示信息的内容...
  • 一 、安装环境 Citespace下载网址:citespace官方下载网址,需要提前安装jdk环境(官网也提供) 二、web of science 导出数据 ...将output文件夹中文件复制到data文件夹中,并在主界面指定相对应文件夹 ...
  • 绘制作者共现和关键词共现图教学

    千次阅读 2021-03-25 14:19:15
    : 词频统计和共现分析 代码见以上的链接,本节展示处理前后的结果。 1.1 作者词频 如上图所示,列表中一列数据为作者,每篇文章一行,一个单元格包括该文全部作者,且用英文分号隔开。运行代码之后,生成表格,手工...
  • 使用Python对文本进行共现统计

    千次阅读 2020-05-10 18:43:43
    '+'\n') for i in range(0,len(list)): with open("词频共现矩阵(top10).txt", "a+", encoding='utf-8', errors='ignore') as f: f.write(list[i] + '\t') for j in range(0,len(list)): with open("词频共现矩阵...
  • 使用从数据库中导出的论文、专利数据,做作者/专利权人合作网络,实际上也就是共现网络。 使用的数据形式示例: 其中F列是作者信息,其他列包含其他信息。 合作网络构建 生成合作网络代码主函数: if __name__ =='_...
  • 本文以CiteSpace软件做的关键词共现分析为例,进行关键词共现图谱含义详细解析。 关键词是一篇论文的核心概括,对论文关键词进行分析可对文章主题窥探一二。 而一篇论文给出的几个关键词一定存在着某种关联,而这种...
  • python构建关键词共现矩阵

    万次阅读 多人点赞 2017-04-05 15:44:37
    本文仅仅提供了实现思路,如果对算法速度有追求的请移步python构建关键词共现矩阵速度优化(在此非常感谢这位同学的优化) 非常感谢南京大学的张同学发现我代码中的bug,现文中的代码均已经更新请放心使用,并且代码...
  • 鉴于此,以国内大型综合型电商平台上服装类网购评语为研究对象,对评语分词、筛选高频词、分析高频词之间的共现关系构建高频词共现网络,分析得出网络评语的热点词多个结构特征和评语网络中少数节点对网络的运行起着...
  • 是用excel分析论文关键词的共现矩阵,提取高频关键词,分析论文研究热点。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,746
精华内容 2,298
关键字:

共现分析