精华内容
下载资源
问答
  • 构建三者之间的关联关系,深入分析挖掘,面向全球科研机构及相关工作人员,提供学者、论文文献等学术信息资源检索以及面向科技文献、专利和科技新闻的语义搜索、语义分析、成果评价等知识服务。典型的知识服务包括:...

    本文共2865个字,预计阅读时间需要10分钟。

    Aminer

    科技情报大数据挖掘与服务系统平台AMiner是由清华大学计算机科学与技术系教授唐杰率领团队建立的,具有完全自主知识产权的新一代科技情报分析与挖掘平台 。

    AMiner平台以科研人员、科技文献、学术活动三大类数据为基础,构建三者之间的关联关系,深入分析挖掘,面向全球科研机构及相关工作人员,提供学者、论文文献等学术信息资源检索以及面向科技文献、专利和科技新闻的语义搜索、语义分析、成果评价等知识服务。典型的知识服务包括:学者档案管理及分析挖掘、专家学者搜索及推荐、技术发展趋势分析、全球学者分布地图、全球学者迁徙图、开放平台等。

    在这里插入图片描述


    Academic Social Network数据集

    数据集地址:https://www.aminer.cn/aminernetwork
    在这里插入图片描述
    Supplement: The relaionship between author id and paper id AMiner-Author2Paper.zip. The 1st column is index, the 2nd colum is auhor id, the 3rd column is paper id, the 4th column is author’s position.
    连上补充数据一共4个数据集文件。

    该数据的内容包括论文信息,论文引文,作者信息和作者协作。 2,092,356篇论文和8,024,869之间的引用被保存在文件AMiner-Paper.rar中; 1,712,433位作者被保存在AMiner-Author.zip文件中,4,258,615位合作关系被保存在文件AMiner-Coauthor.zip中。

    连上补充数据一共4个数据集文件。


    数据三元组转化与连接

    将上述4个数据集下载到本地目录后通过Python脚本读取、处理、连接生成实体csv和关系csv文件。

    脚本代码:https://github.com/xyjigsaw/Aminer2KG

    脚本生成的数据包括一下几个部分:

    • author2csv.py includes
      e_author.csv: author entity
      e_affiliation.csv: affiliation entity
      e_concept.csv: concept entity
      r_author2affiliation.csv: relation between author and affiliation
      r_author2concept.csv: relation between author and concept
    • author2paper2csv.py includes
      r_author2paper.csv: relation between author and paper
    • paper2csv.py includes
      e_paper.csv: paper entity
      e_venue.csv: venue entity
      r_paper2venue.csv: relation between paper and venue
      r_citation.csv: relation between papers
      r_coauthor.csv: relation between authors

    汇总
    在这里插入图片描述
    以上共5个实体类型,6个关系类型。

    至此,生成了Aminer学术社交网络知识图谱三元组数据。


    导入Neo4j

    将上述11个csv文件放入Neo4j数据库的import文件夹中。

    在Neo4j桌面端控制台一句一句执行下述CYPHER代码:

    包含了实体节点导入、实体索引构建、关系导入、关系索引构建。

    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///e_author.csv" AS line
    CREATE (author:AUTHOR{authorID:line.authorID, authorName:line.authorName, pc:line.pc, cn:line.cn, hi:line.hi, pi:line.pi, upi:line.upi})
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///e_affiliation.csv" AS line
    CREATE (affiliation:AFFILIATION{affiliationID:line.affiliationID, affiliationName:line.affiliationName})
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///e_concept.csv" AS line
    CREATE (concept:CONCEPT{conceptID:line.conceptID, conceptName:line.conceptName})
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///e_paper.csv" AS line
    CREATE (paper:PAPER{paperID:line.paperID, paperTitle:line.title, paperYear:line.year, paperAbstract:line.abstract})
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///e_venue.csv" AS line
    CREATE (venue:VENUE{venueID:line.venueID, venueName:line.name})
    
    CREATE INDEX ON: AUTHOR(authorID)
    
    CREATE INDEX ON: AFFILIATION(affiliationID)
    
    CREATE INDEX ON: CONCEPT(conceptID)
    
    CREATE INDEX ON: PAPER(paperID)
    
    CREATE INDEX ON: VENUE(venueID)
    
    
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///r_author2affiliation.csv" AS line
    MATCH (FROM:AUTHOR{authorID:line.START_ID}), (TO:AFFILIATION{affiliationID:line.END_ID})
    MERGE (FROM)-[AUTHOR2AFFILIATION: AUTHOR2AFFILIATION{type:line.TYPE}]->(TO)
    
    
    USING PERIODIC COMMIT 10000
    LOAD CSV WITH HEADERS FROM "file:///r_author2concept.csv" AS line
    MATCH (FROM:AUTHOR{authorID:line.START_ID}), (TO:CONCEPT{conceptID:line.END_ID})
    MERGE (FROM)-[AUTHOR2CONCEPT: AUTHOR2CONCEPT{type:line.TYPE}]->(TO)
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///r_author2paper.csv" AS line
    MATCH (FROM:AUTHOR{authorID:line.START_ID}), (TO:PAPER{paperID:line.END_ID})
    MERGE (FROM)-[AUTHOR2PAPER: AUTHOR2PAPER{type:line.TYPE, author_pos:line.author_position}]->(TO)
    
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///r_citation.csv" AS line
    MATCH (FROM:PAPER{paperID:line.START_ID}), (TO:PAPER{paperID:line.END_ID})
    MERGE (FROM)-[CITATION: CITATION{type:line.TYPE}]->(TO)
    
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///r_coauthor.csv" AS line
    MATCH (FROM:AUTHOR{authorID:line.START_ID}), (TO:AUTHOR{authorID:line.END_ID})
    MERGE (FROM)<-[COAUTHOR: COAUTHOR{type:line.TYPE, n_cooperation:line.n_cooperation}]->(TO)
    
    USING PERIODIC COMMIT 5000
    LOAD CSV WITH HEADERS FROM "file:///r_paper2venue.csv" AS line
    MATCH (FROM:PAPER{paperID:line.START_ID}), (TO:VENUE{venueID:line.END_ID})
    MERGE (FROM)-[PAPER2VENUE: PAPER2VENUE{type:line.TYPE}]->(TO)
    
    
    CREATE INDEX ON: AUTHOR(authorName)
    
    CREATE INDEX ON: AFFILIATION(affiliationName)
    
    CREATE INDEX ON: CONCEPT(conceptName)
    
    CREATE INDEX ON: PAPER(paperTitle)
    
    CREATE INDEX ON: VENUE(venueName)
    

    预览

    在这里插入图片描述


    知识图谱嵌入

    这部分将上述千万级三元组训练成嵌入数据,PyTorch-BigGraph(PBG)给出了令人满意的解决方案。PBG是一个分布式大规模图嵌入系统,能够处理多达数十亿个实体和数万亿条边的大型网络图结构。图结构分区、分布式多线程和批处理负采样技术赋予了PBG处理大型图的能力。

    这部分内容具体请看https://www.omegaxyz.com/2020/07/12/aminer-academic-social-network/


    项目代码:Aminer2KG

    更多内容访问 omegaxyz.com
    网站所有代码采用Apache 2.0授权
    网站文章采用知识共享许可协议BY-NC-SA4.0授权
    © 2020 • OmegaXYZ-版权所有 转载请注明出处

    展开全文
  • 大学文献检索资料 DOC

    2009-11-28 10:35:24
    关系信息知识(情报,文献)) 第二节 信息检索的目的和作用 1.通过科技文献检索能够打开人类知识宝库的钥匙。 2.通过科技文献检索能使科技工作及时把握科技发展的动态和趋势。 3.通过科技文献检索能有助于...
  • 我们需要文档辅助作知识沉淀</strong></h4> <h2>javascript 基本功 语言特性 <ul><li>数据类型:</li><li><code>Undefined, <code>Null, <code>Bollean, <code>Number, <code>String</code></li><li><code>...
  • 学生实习信息管理系统是一个教育单位不可缺少的部分,它的内容对于学校的决策和管理来说都至关重要,所以学生实习信息管理系统应该能够为用户提供充足的信息和快捷的查询手段。 、课题的基本内容 学生实习信息...
  • 本书在美国项目管理学会的《项目管理知识体系指南》(PMBOK)中,被确定为重要的参考文献。本书适合所有管理和被管理,以及那些管理和被管理共同生活或相识的人。对于那些领导、希望成为领导的技术人员...
  • 这份系统的评论研究了有关CBI(基于内容的教学)方法的最新文献,并总结了与影响高等教育中的ESL学生成绩有关的数据。... 这项研究可以为未来的从业,管理和决策提供有关第社区ESL计划开发的信息
  • 全书共分4个部分,第一部分介绍最基本的概念、术语及建模原则,第二部分描述了关系数据模型和关系型DBMS,第部分讨论数据库设计,第四部分主要描述数据库系统中使用的物理文件结构和存取方法。书中涉及的内容非常...
  • 图书管理系统是一个学校不可缺少的部分,它的内容对于学校的管理和读者来说都至关重要,直接关系到图书的借用率,所以开发图书管理系统能够为管理员和读者提供充足的信息和快捷的查询手段。 编写程序系统主要实现...
  • 选题的特色:本毕业设计的开题经过走访调查和文献查阅等多种方式,基本可以与现实的需求相一致,并能体现用所学的知识和计算机技术解决实际问题。 选题的创新点:该选题采用的均是计算机成熟的技术,在计算机技术...
  • 基本信息 原书名: Fundamentals of Database Systems (5th Edition) 原出版社: Addison Wesley 作者: (美)Ramez Elmasri Shamkant B. Navathe [作译者介绍] 译者: 邵佩英 徐俊刚 王文杰 丛书名: 图灵计算机科学...
  • 课程成绩管理系统是一个教育单位不可缺少的部分,它的内容对于学校的决策和管理来说都至关重要,所以课程成绩管理系统应该能够为用户提供充足的信息和快捷的查询手段。 、课题的基本内容 课程成绩管理系统作为...
  • 数据集成原理带书签可复制 pdf

    热门讨论 2015-02-07 12:58:47
    出版的话 7 中文版序 8 译者序 10 前言 12 目录 13 第1章 绪论 17 1.1 什么是数据集成 17 1.2 数据集成面临的挑战 21 1.2.1 系统原因 21 1.2.2 逻辑原因 21 1.2.3 社会和管理原因 22 1.2.4 设定...
  • - 以BiLSTM等模型为基础,提供知识图谱关系抽取 中文分词 词性标注 命名实体识别 情感分析 新词发现 关键词 文本摘要 文本聚类等功能、用unet实现对文档表格的自动检测,表格重建、NLP事件提取文献资源列表 、 金融...
  • 本书分为排队论基础、排队论的基础及其应用以及排队论在计算机和现代电信网中的实际应用大部分,书中除了注重基础知识的阐述和分析之外,还着重做到理论联系实际。本书适用于高校电子、计算机、通信、信息以及相关...
  • 同时还包括第部分的信息发布以及交流功能对于供方(求职人员)所设置的功能包括:(1)用户管理;进行求职人员的注册登记管理以及密码建立。查找和修改的管理;(2)简历管理;完成求职人员的个人简历信息的输入和...
  • 统计信息的相关知识 335 面临的问题与挑战 337 关于统计信息的常见误区 339 总结 341 聚簇因子、柱状图与执行计划(作者:段林仲) 343 CLUSTERING_FACTOR对于执行计划的影响 344 CURSOR_SHARING与SQL的执行...
  • 另外,我们学校还应该继续为毕业生讲解应聘技巧、劳动的法律保护以及工作的保障制度。 结束语 由于近些年社会形势的变化,社会经济结构的不断调整,我校必须及时革新毕业生的就业观念,必须引导我校毕业生学习...
  • 软件工程教程

    热门讨论 2012-07-06 23:10:29
    通过演示及讲述,讲解课程设计的整体情况,针对其设计提出一些技术及细节问题确认是否真正理解课程设计中的要点、是否掌握了进行系统设计的知识和能力、是否本人完成。如通发现没有真正设计或者不清楚技术细节,则...
  • 建模的同学应该多多涉猎不同的文献,中文的,外文的最好都阅读以下, 然后自己在草稿纸上画一些思维导图,对这些文献之间的关系进行一定 的梳理,然后结合本问题分析,看看什么地方需要修改,什么地方需要 精简,...
  • 第1部分提供了学习后边部分所需的基础知识,其他个部分分别讲述了不同的逆向工程情景,并展示了真实的案例研究。每一部分的详细描述如下。  第1部分—逆向101:本书是从讨论理解底层软件所需的所有基础知识开始...
  • reversing :逆向工程解密

    热门讨论 2012-09-04 11:40:49
    第1部分提供了学习后边部分所需的基础知识,其他个部分分别讲述了不同的逆向工程情景,并展示了真实的案例研究。每一部分的详细描述如下。  第1部分—逆向101:本书是从讨论理解底层软件所需的所有基础知识开始...
  • 2.完成关于关系数据库基础知识的题目1; 3.运行给定的SQL语句,生成图书馆管理系统的数据库,编写相应的SQL语句,完成题目2中要求的内容; 4.运行给定的SQL语句,生成图书馆管理系统的数据库,编写高级的SQL语句,...
  • 本书共有13章和个附录,涵盖了逆向工程的基础知识、应用、开发和拓展的方方面面问题。其中第5章、第9章和附录A、B、C由韩琪翻译,第3章、第11章和第13章由杨艳翻译,第7章、第8章和第10章由王玉英翻译,第4章和第6...
  • Reversing:逆向工程揭密

    热门讨论 2010-06-21 17:27:22
    本书共有13章和个附录,涵盖了逆向工程的基础知识、应用、开发和拓展的方方面面问题。其中第5章、第9章和附录A、B、C由韩琪翻译,第3章、第11章和第13章由杨艳翻译,第7章、第8章和第10章由王玉英翻译,第4章和第6...
  • [Oracle.11g权威指南(第2版)].谷长勇.扫描版.pdf

    千次下载 热门讨论 2013-06-23 21:16:09
    本章主要介绍了数据库的基础知识,包括数据库、数据库管理系统及关系数据库等基本概念,此外还介绍了目前应用比较广泛的各种关系式数据库系统。 1.1 数据库起源 2 1.2 数据库主要特征 2 1.3 数据库构成 3 1.4 数据库...
  • 51单片机自学笔记

    2016-07-27 22:24:19
    附录J MCS51程序生成器软件419, 附录K 随书光盘内容说明420, 参考文献421, ===================================, 基本信息, ·出版社:北京航空航天大学出版社, ·页码:421 页, ·出版日期:2010年01月, ·版本:...
  • 软件需求(PDF书籍)

    2012-07-27 14:32:31
    软件开发人员及用户往往容易忽略信息沟通,导致软件开发出来后,不能很好地满足用户的需要。而返工则不仅在技术上给开发人员带来巨大的麻烦,而且软件性能深受影响且造成人力、物力的浪费。所以在开发周期早期提高...

空空如也

空空如也

1 2 3
收藏数 60
精华内容 24
关键字:

信息知识文献三者关系