精华内容
下载资源
问答
  • 关系r属于
    千次阅读
    2021-06-01 20:37:03

    问题描述:所编程序能够通过编译,给定的任意一个关系R的关系矩阵,能够判定关系R         是否为等价关系。

    输入说明:首先输入关系R的关系矩阵的维数,回车之后输入矩阵每个元素,以空格或回         车分开。只能输入0或1。

    输出说明:输出该关系是否为一个等价关系,若是等价关系,输出yes,否则输出no。

    输入样例:    4

    1 1 0 1

    1 1 0 1

    0 0 1 0

    1 1 0 1

    输出样例:    yes

    输入方式:控制台。

    判定规则:忽略首尾空白、忽略空行、忽略大小写、数据之间只保留一个空白。 

    问题提示:若关系R具有自反、对称、传递,则关系R为等价关系。

    分析 自反性与对称性容易判断。而传递性则利用R*R是R的子集来进行判断。(注意这里要用合取!!!)

    #include<stdio.h>
    //判断传递性的函数
    int chuandi(int a[50][50],int n)
    {
      int b[50][50] = {0};
      int i,j,k;
      for(i = 0;i<n;i++)
      {
    	  for(j = 0;j<n;j++)
    		  for(k = 0;k<n;k++)
    		  {
    			  b[i][j] &= a[i][k]&&a[k][j];
    		  }
      }
      /*int x = 0;
      for(i = 0;i<n;i++)
    	  for(j = 0;j<n;j++)
    	  {
    		  x++;
    		  printf("%d ",b[i][j]);
    		  if(x%n == 0)
    			  printf("\n");
    	  }*/
    
      int m = 0;
      for(i=0;i<n;i++)
      {
    	  for(j=0;j<n;j++)
    		  if(a[i][j]-b[i][j]<0)
    			  m++;
      }
      if(m==0)
      {
    	  return 1;
    	  //printf("关系R具有传递性");
      }
      else
    	  return 0;
    }
    int main()
    {
    	int a[50][50];
    	int n;
    	//printf("请输入维数:\n");
    	scanf("%d",&n);
    	//printf("请输入矩阵:\n");
    	int i;
    	int j;
    	for ( i = 0;i<n;i++)
    	{	
    		for( j = 0;j<n;j++)
    		{
    			scanf("%d",&a[i][j]);
    		}
    	}
    	//判断是否具有自反性
    	int b = 0;
    	for(i = 0;i<n;i++)
    	{
                if(a[i][i] ==1)
    			    b++;	
    	}
    	if(b == n)
    	{
    		//printf("关系R具有自反性\n");
    		b = 1;
    	}
    	//判断是否具有对称性
    	int c = 0;
    	for(i = 0;i<n;i++)
    	{
    		for(j = 0;j<n;j++)
    		{
    			if(a[i][j] == a[j][i])
    			c++;
    		}
    	}
    	if(c == n*n)
    	{
    		//printf("关系R具有对称性\n");
    		c = 1;
    	}
    	int d = 0;
    	//调用chuandi函数
    	if(chuandi(a,n))
    		d = 1;
    	//printf("%d\n",b+c+d);
    	if(b+c+d == 3)
    		printf("yes\n");
    	else
    		printf("no\n");
        return 0;
    }

     

    更多相关内容
  • (3)如果存在函数依赖A →B,BC →D,DE →A,R属于几范式,为什么? (1):要确保R是BCNF,就要在3NF的基础上,满足条件消除主属性对码的部分依赖与传递依赖。 则:当属性组BC也是关系模式R的候选码时,R是BCNF。 ...
  • 探究微生物共现网络与环境因子的关系是微生物生态学分析的常用手段之一,目前的文献使用的主要包括以下三种方法:Modular Eigengene ,Subgraph of each sample和OTU significance,本文件主要介绍前面两种方法的R语言...
  • R语言绘制相对性关系

    千次阅读 2021-01-14 01:48:18
    准备第一步就是安装R语言环境以及RStudio图绘制准备首先安装库文件,敲入指令,回车install.packages('corrplot')然后安装excel导入的插件,点击右上角import Dataset,选中From excel即可。这些操作都很简单~~数据...

    准备

    第一步就是安装R语言环境以及RStudio

    图绘制准备

    首先安装库文件,敲入指令,回车

    install.packages('corrplot')

    然后安装excel导入的插件,点击右上角import Dataset,选中From excel即可。

    这些操作都很简单~~

    数据预处理

    然后到了数据输入了,这么多数据,我们总不能一行输入吧?那得有多蠢

    于是我们利用上了数据导入功能,当当当~~

    然而理想很丰满,现实却很蛋疼,导入的excel数据格式不是我们希望的矩阵格式ORZ!

    哎,休息下喝杯茶,看看可能用到的指令吧。

    假设导入的数据为data,那么可能用到的指令如下:

    //查看数据

    data

    //删除矩阵第一行

    data = data[-1,]

    //删除矩阵第一列

    data = data[,-1]

    //data转换成矩阵

    data = as.matrix(data)

    //更改行名

    row.names(data)

    指令在手,天下我有!

    存在问题:导入数据格式问题

    期望导入的数据格式是矩阵,如下图所示:

    实际导入的数据格式如下图:

    报警了~~

    解决方案:导入数据转换成矩阵流程

    然而山人自有妙计~~

    data = data[,-1],删除第一列的多余数据,运行结果如下图

    data = as.matrix(data),转变成矩阵,运行结果如下图

    虽然变成矩阵了,但是第一列行名有问题。运行代码row.names(data)

    数据绘图

    数据变成矩阵后,运行如下指令,即可得到图片

    library(corrplot)

    corrplot(corr = data, method = 'color', order ="AOE", addCoef.col="grey")

    运行结果如下图所示:

    corrplot 的具体参数含义可以参考文献使用R语言绘制其他图形之相关系数图

    然而参数好多啊。。。。

    并不想看,我差不多是条咸鱼了。。。

    继续撸参数,然后慢慢调节。。。

    col

    corrplot(corr = data, method = 'color', order ="AOE", addCoef.col="grey",col=col)

    运行结果如下:

    但是零的部分很丑有木有,

    因此需要调参~~

    关于添加cl.lim参数以及type参数微调优化

    col

    corrplot(corr = data, method = 'color', order ="AOE", addCoef.col="grey",col=col,cl.lim = c(0,1),type="upper")

    运行结果如下:

    好了,

    到此为止基本上相对关系图就绘制完毕了O(∩_∩)O~~

    如果想把图绘制的更加炫酷,强烈推荐自习阅读参考文献6,就酱= ̄ω ̄=

    最后,修仙伤身====

    参考文献

    展开全文
  • E-R图及关系模型转换3

    2022-02-26 21:32:34
    设某商业公司数据库中有三个实体集,一是”公司”实体集,属性有公司编号、公司名、地址等;二是”仓库”实体集,属性有仓库编号、仓库名、地址等;...②将E-R图转换成关系模型 ,并注明主码和外码 (5分)
  • 等价关系:集合A上的二元关系R同时具有自反性、对称性和传递性,则称R是A上的等价关系。 【实验原理和方法】 (1)A上的二元关系用一个n×n关系矩阵R= 表示,定义一个n×n数组r[n][n]表示n×n矩阵关系。 (2)若R对...
  • R开发关系图资料

    2018-08-09 19:40:41
    该文档包含了大部分用R开发关系图的知识,以及相关的关系图分析。
  • R语言应用实战代码】-空间权重关系.zip
  • 本文将基于简单共现关系,编写 R 代码从纯文本中提取出人物关系网络,并用 networkD3 将生成的网络可视化。 共现: 顾名思义,就是共同出现,关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已...

    概述

    雪中悍刀行作为现象级的网文,电视剧版即将上映,作为曾经的一员“妖孽”书粉,按捺不住想做点啥。最近在研究知识图谱,就以此为契机展开相关研究吧。

    本文将基于简单共现关系,编写 R 代码从纯文本中提取出人物关系网络,并用 networkD3 将生成的网络可视化。

    • 共现: 顾名思义,就是共同出现,关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已确定的人名,计算不同人物共同出现的次数和比率。当比率大于某一阈值,我们认为两个人物间存在某种联系。

    由于共现概率比值的计算方法较为复杂,本文只使用最基础的共现统计,自行设定共现频率的阈值,并使用networkD3绘制交互式网络图.

    数据来源

    雪中悍刀行小说txt来源地址: https://www.txt80.com/xuanhuan/2017/07/txt1099.html

    雪中主要人物表信息整理来源地址: https://baike.baidu.com/item/雪中悍刀行/7328338

    数据准备

    由于《雪中》人物较多、关系复杂,这次我们只统计其中最主要的一些角色的共现关系,首先通过雪中悍刀行的百度百科获取主要人物的介绍,手动整理为excel。
    雪中人物表
    部分人物有多个称谓,所以需要再整理一份多称谓人物表,以便于后期对同一个人物多个称谓的数据进行合并

    多称谓人物表
    接下来在R中导入数据,包括上面的两个excel以及小说文本txt,并使用jiebaR对文本各段落进行分词

    library(networkD3) # 画网络图
    library(readxl)    # 读取excel
    library(tidyverse) # 分组统计
    library(jiebaR)    # 分词
    
    # 人物名导入
    name_df <- read_excel("人物表.xlsx")
    # 多称谓人物表导入
    dupName_df <- read_excel("多称谓人物.xlsx")
    # 文档导入
    texts = readLines("./雪中悍刀行.txt", encoding="gbk")
    
    # 设置分词器
    engine1 = worker()
    engine1$bylines = TRUE
    # 分词
    seglist = segment(texts, engine1)
    head(seglist)
    
    ## [[1]]
    ## [1] "书香门第" "岁"       "梦"       "整理"    
    ## 
    ## [[2]]
    ##  [1] "附"     "本"     "作品"   "来自"   "互联网" "本人"   "不"     "做"    
    ##  [9] "任何"   "负责"   "内容"   "版权"   "归"     "作者"   "所有"  
    ## 
    ## [[3]]
    ## character(0)
    ## 
    ## [[4]]
    ## character(0)
    ## 
    ## [[5]]
    ## [1] "全"   "本校" "对"   "雪"   "中"   "悍"   "刀"   "行"  
    ## 
    ## [[6]]
    ## [1] "作者" "烽火" "戏"   "诸侯"
    

    可以看到分词结束后的结果是一个大的列表,其中每个元素代表一个段落中的分词

    共现关系提取

    首先提取共现词对,具体方法为提取每个段落中的主要人物,并对每个段落的不同主要人物形成两两的共现词对

    共现词对提取

    names = c()         # 姓名字典
    relationships = list()  # 关系字典
    lineNames = list()      # 每段内人物关系
    
    for(i in 1:length(seglist)){
      line_i <- seglist[[i]]
      # 提取每个段落中的主要人物
      lineNames_i <- intersect(line_i,name_df$name)
      if(length(lineNames_i) >=2){
        # 如果该段落中包含至少两个主要人物,则对不同主要人物形成词对
        lineNames[[length(lineNames)+1]] <-lineNames_i
        for(i in 1:(length(lineNames_i)-1)) {
          for(j in (i+1):length(lineNames_i)) {
            if(i != j){
              # 提取共现关系
              relationships[[length(relationships)+1]] <- c(lineNames_i[i],lineNames_i[j])
            }
          }
        }
      }
    }
    
    head(relationships)
    
    ## [[1]]
    ## [1] "北凉王" "徐骁"  
    ## 
    ## [[2]]
    ## [1] "北凉王" "徐骁"  
    ## 
    ## [[3]]
    ## [1] "北凉王" "徐骁"  
    ## 
    ## [[4]]
    ## [1] "徐骁" "世子"
    ## 
    ## [[5]]
    ## [1] "北凉王" "徐骁"  
    ## 
    ## [[6]]
    ## [1] "北凉王" "世子"
    

    从上面的结果看多称谓人物的不同称谓之间也会形成共现关系,但这是不必要的,所以接下来解决多称谓人物问题。

    多称谓人物合并

    # 提取总人物
    namelist <- unlist(lineNames)
    
    # 提取共现关系
    relationships_df <- data.frame(t(data.frame(relationships)),stringsAsFactors = F)
    colnames(relationships_df) <- c("Sou",'Tar')
    row.names(relationships_df) <- 1:nrow(relationships_df)
    
    # 多称谓人物合并
    for (i in 1:ncol(dupName_df)) {
      name_i <- colnames(dupName_df)[i]
      # 每个主称谓 下的 称谓列表
      namelist_i <- unlist(dupName_df[name_i])
      # 将多称谓人物转为主称谓
      namelist[which(namelist %in% namelist_i)] <- name_i
      relationships_df$Sou[which(relationships_df$Sou %in% namelist_i)] <- name_i
      relationships_df$Tar[which(relationships_df$Tar %in% namelist_i)] <- name_i
    }
    
    # 将词对表中每行进行排序,保证每两个人物间只有一种顺序。
    for(i in 1:nrow(relationships_df)){
      relationships_i <- unlist(relationships_df[i,])
      relationships_df[i,] <- relationships_i[order(relationships_i)]
    }
    
    
    head(relationships_df)
    
    ##      Sou  Tar
    ## 1   徐骁 徐骁
    ## 2   徐骁 徐骁
    ## 3   徐骁 徐骁
    ## 4 徐凤年 徐骁
    ## 5   徐骁 徐骁
    ## 6 徐凤年 徐骁
    

    接下来统计网络图需要的人物节点数据边数据,节点中次数为人物权重。边数据由词对数据生成,去掉首尾为相同元素的数据,并计算共现频率。

    统计人物权重(网络节点数据)与共现关系(边数据)

    设置点数据时要注意索引从零开始,因为D3基于js 而js中数据索引首位是0

    # 点数据
    node_df <- data.frame(table(namelist))
    # 设置索引
    node_df <- node_df %>% mutate(Id = 0:(nrow(node_df)-1),name=namelist) %>% 
      # 匹配分组-也是各个主要人物所在的势力
      left_join(name_df)
    
    # 设置边节点对应列表 
    namline_source <- node_df %>% rename(source=Id,Sou=namelist) %>% select(Sou,source) # 起始点ID表
    namline_target <- node_df %>% rename(target=Id,Tar=namelist) %>% select(Tar,target) # 终点ID表
    
    # 边数据统计词频
    edge_df <- relationships_df %>% filter(Sou != Tar) %>% group_by(Sou,Tar) %>% summarise(Value=n()) %>% filter(Value > 5)
    # 匹配边节点ID
    edge_df <- edge_df %>% left_join(namline_source) %>% left_join(namline_target) 
    head(edge_df)
    
    
    ## # A tibble: 6 x 5
    ## # Groups:   Sou [2]
    ##   Sou    Tar    Value source target
    ##   <chr>  <chr>  <int>  <int>  <int>
    ## 1 白煜   宋洞明    17      0     39
    ## 2 白煜   徐凤年    24      0     52
    ## 3 白煜   赵丹坪     6      0     68
    ## 4 曹长卿 陈芝豹    32      1      4
    ## 5 曹长卿 顾剑棠    52      1      9
    ## 6 曹长卿 韩貂寺    10      1     10
    

    由于边数据较多此处仅保留共现频率在5次以上数据

    人物网络可视化

    最后我们使用networdD3包中的forceNetwork函数画图,并对画面细节做了些许调整

    # 画网络图
    forceNetwork(Links = edge_df,#线性质数据框
                 Nodes = node_df,#节点性质数据框
                 Group = "group", #节点分组 节点数据中对应的列名
                 Source = "source",#连线的源变量 边数据中起始点ID
                 Target = "target",#连线的目标变量 边数据中终点ID
                 Value = "Value", #边的粗细值,边数据中共现频率列名
                 NodeID = "name", #节点名称
                 Nodesize = "Freq" , #节点大小,节点数据框中节点频率列名
                 ###美化部分
                 fontSize = 30, #节点文本标签的数字字体大小(以像素为单位)。
                 linkColour="grey",#连线颜色,black,red,blue,  
                 colourScale = JS("d3.scaleOrdinal(d3.schemeCategory10);"),
                  #colourScale ,linkWidth,#节点颜色,red,蓝色blue,cyan,yellow等
                 charge = -2000,#数值表示节点排斥强度(负值)或吸引力(正值)  
                 opacity = 0.5, #节点透明度
                 #nodeColour="black",
                 fontFamily = "黑体",
                 arrows=F, #是否带方向
                 bounded=F, #是否启用限制图像的边框
                 opacityNoHover=2, #当鼠标悬停在其上时,节点标签文本的不透明度比例的数值
                 zoom = T, #允许放缩,双击放大
                 #clickAction = MyClickScript
                 )
    

    最后生成的动态网络图如下面gif中所示:
    在这里插入图片描述

    以上就是雪中主要人物的可视化网络,本文中对共现分析的筛选仅为取共现频率,而结果也仅仅是简单的无向网络,后期计划添加共现概率比值分析,同时利用forceNetwork中的clickAction参数增加交互可视化内容,形成简单的知识图谱

    延申

    本文灵感来源为蓝桥云课:Python 提取釜山行人物关系(https://www.lanqiao.cn/courses/677)
    原网址使用的工具为python和Gephi,我借鉴其中的思路使用R来完成共现提取和绘图。
    本文将在CSDN账号“chongminglun” 和知乎账号“重明论” 同步上传更新。

    本文全部数据及代码已上传至github:https://github.com/cornerken/netgraph_R

    展开全文
  • 笔者寄语:由于笔者参加了一个全国数据挖掘大赛的比赛,所选赛题是招聘岗位的数据挖掘,笔者用到了社会关系网络来进行相关职位的推荐以及分类,发现了SNA可以实现一定的职位画像的功能,于是根本停不下来的学习了SNA...



    每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~

    ———————————————————————————



    笔者寄语:这里所有的应用代码都来自与igraph包。《R语言与网站分析》书中第九章关系网络分析把大致的框架已经描述得够清楚,但是还有一些细节需要完善,而且该书笔者没找到代码。。。


    ————————————————————————————————————————



    一、关系网络数据类型


    关系网络需要什么样子的数据呢?    笔者接触到了两种数据结构,擅自命名:平行关系型、文本型。根据数据关联,也有无向数据、有向数据。

    并且关系网络生成之后,R里面就不是用真实的名字来做连接,是采用编号的。例如(小明-小红)是好朋友,在R里面就显示为(1-2),所以需要单独把名字属性加到序号上。


    1、平行关系型


    (1)无向平行数据。直接上例子比较直观,社交网络中的好友关系,你-我,我-他。这样排列,是无向


    id1	di2
    小明	小红
    小张	小白
    小红	小胖
    小胖	小蓝
    小白	小明
    小白	小张
    小明	小胖

    很简单的两列数据,说明了小明-小红、小张-小白的社会关系。当然需要注意,重名问题,名字可能有重叠,可以给每个人一个编号,这样就不会出现重名。

    实战中,一般是拿编号作为输入变量,拿名字作为编号的标签,加入到关系网络中。

    (2)有向平行数据。举一个书(《R语言与网站分析》)上的例子。解读一下这个图,这是一条微博的转发情况,“老牛”用户这个微博号转发,让“晴”、“四眼看八方”两个用户看到了。

    “老牛”用户发出,“晴”、“四眼看八方”用户分别接收到。

    2、文本型

    文本型主要针对的是文本数据,笔者在参赛时就用到这个。文本型也有两种情况:有向型以及词条-文本矩阵。这部分内容跟文本挖掘相关,关于分词内容可以参考中文分词包Rwordseg。

    (1)有向型就如同平行关系型有向数据结构一样,人名-词条两个

    人名词条
    小明小气
    小张帅气
    小红好看
    小胖
    小白帅气
    小白阳光
    小明贪吃

    (2)词条-文本矩阵

    文本挖掘中,一般都能获得这个矩阵,可以看一下tm包的博客,文档-词频矩阵。tm包中用DocumentTermMatrix函数可以获得。

     小气帅气好看阳光贪吃
    小明1 0001
    小张010000
    小红001000
    小胖000100
    小白010010

    跟上面的对比一下就了解,变成了一个稀疏矩阵,相关的关联规则、随机森林中中也会用到这个矩阵。tm包可以实现,也可以通过reshape包中的cast函数,构造这个函数。

    需要原来的数据框调整为以每个词作为列名称(变量)的数据框。也就是一定意义上的稀疏矩阵(同关联规则),也就是将long型数据框转化为wide型数据框。转换可以用的包有reshape2以及data.table。

    其中,data.table里的`dcast`函数比reshape2包里的`dcast`好用,尽管他们的参数都一样,但是很多人还是比较喜欢老朋友reshape2包,然而这一步需要大量的内存,本书在服务器上完成的,如果你的电脑报告内存不足的错误,可以使用data.table包里的`dcast`函数试试。转化为稀疏矩阵,1表示访问,0表示未访问。

    ————————————————————————————————————————

    二、构造关系网络


    1、自编译函数init.igraph


    看到了数据类型,大概知道其实需要两样东西,一个起点数据列、一个终点数据列。那么构造数据就只需要调用一下函数,在这里选用《R语言与网站分析》书中第九章关系网络分析中,李明老师自己编译的函数来直接构造。

    在使用之前需要library调用igraph包,该函数的好处就是直接帮你打上点标签以及线标签。

    init.igraph<-function(data,dir=F,rem.multi=T){
      labels<-union(unique(data[,1]),unique(data[,2]))
      ids<-1:length(labels);names(ids)<-labels
      from<-as.character(data[,1]);to<-as.character(data[,2])
      edges<-matrix(c(ids[from],ids[to]),nc=2)
      g<-graph.empty(directed = dir)
      g<-add.vertices(g,length(labels))
      V(g)$label=labels
      g<-add.edges(g,t(edges))
      if (rem.multi){
        E(g)$weight<-count.multiple(g)
        g<-simplify(g,remove.multiple = TRUE,
                    remove.loops = TRUE,edge.attr.comb = "mean")
      }
      g
    }
    这个函数有这么几个参数:

    data,是两列关系数据,前面已经讲过了,只能两列,而且要同等长度;

    dir,逻辑值,T代表有向图,F无向图;

    rem.multi,逻辑,T删除重复变量并更新线权重weight,F不删除并且线权重为1。
    使用方法直接init.igraph(data,dir=T,rem.multi=T)即可。


    2、文本型数据


    一般数据结构都可以套用上面的函数,包括平行关系型的有向、无向;文本型。其中对于文本矩阵型数据还有一个办法,参考于统计词画番外篇(一):谁共我,醉明月?

    利用igragh包中的graph_from_adjacency_matrix函数。


    adjm <- matrix(sample(0:1, 100, replace=TRUE, prob=c(0.9,0.1)), nc=10)
    g1 <- graph_from_adjacency_matrix( adjm ,weighted=TRUE,mode="undirected")
    
       ## 给稀疏矩阵行列进行命名
    rownames(adjm) <- sample(letters, nrow(adjm))
    colnames(adjm) <- seq(ncol(adjm))
    g10 <- graph_from_adjacency_matrix(adjm, weighted=TRUE, add.rownames="row",add.colnames="col")


    代码解读:adjm是随便构造的一个矩阵,函数;

    graph_from_adjacency_matrix中,

    weighted=TRUE,是否需要加入权重;
    mode有directed, undirected, upper, lower, max, min, plus有这么几种,min代表把无向图中,只选取最小数字的线(1,1)与(1,2)只选择(1,1)。具体请参看函数官方解释。

    add.rownames以及add.colnames,因为前面的自编译函数init.igraph可以自定义标签,这里定义名称,可以用add.rownames加入标签列,这样你可以用V(g10)$row以及V(g10)$col直接看到标签。其中还可以自己定义名字,row,col都是笔者自己定义的。


    ————————————————————————————————————————



    三、一些基本操作


    关系网络中,每一个点的信息存放在V中,每一个线的信息存放在E中。并且通过自编译的init.igraph函数,V(g)$label以及E(g)$weight都是自带的属性。

    可以生成一个空的关系网络。

    并且关系网络生成之后,R里面就不是用真实的名字来做连接,是采用编号的。例如(小明-小红)是好朋友,在R里面就显示为(1-2),所以需要单独把名字属性加到序号上。


    g<-graph.empty(directed=F)

    1、关系网络中的点集V


    点集就是网络中所有的点,如有向文本型那个数据格式,包括了14个点;7条线。


    (1)点集属性


    点集与数据框的操作很相似,属性是可以自己赋上去的,比如V(g)$label就是赋上去的,你还可以给点集加上颜色(V(g)$color)、加上每个点的尺寸(V(g)$size),加上分类(V(g)$member)

    点集的选择跟数据框操作一样,比如我要选择群落为1的点集,就是V(g)[which(V(g)$member==1)]

    比如我要选择点度数大于1的点集,V(g)[degree(g)>1]

    如果我想知道一下这两个点之间是否有关系,可以用edge.connectivit函数,edge.connectivity(g, 4,9)  代表着第四个点与第九个点之间是否有连接关系。返回的0/1。0是没有线,1代表有线。


    (2)点集加减操作


    我想在原来的基础上加入一些点,用add.vertices

    g<-add.vertices(g,length(labels))#关系网络中加入“点”
    如果我想减去点度数为0的点
    g<-g-V(g)[degree(g)==0] 


    (3)相邻点的集合——neighbors(很重要)


    neighbors(g.zn,v=which(V(g.zn)$label=="会计"))
    V(g.zn)$label[neighbors(g.zn,v=which(V(g.zn)$label=="取向"),mode="total")]
       #默认mode设置是out,还有 in,total;其中V(g.zn)$label和V(g.zn)一个返回标签,一个返回值
    eighbors可以找出标签如果是“会计”的点,与之有关系的点的序号是啥;不过你也可以通过V(g.zn)$label让临近点的标签一起筛选出来

    其中mode代表点出度(out)以及点入度(in),还有两个都有的点度(total)。
    该函数可以对于点集,做附近的画像,比较好用。



    2、关系网络中的线集E


    (1)线集的类型


    关系网络中线的关系比较多,loop线就是循环到自己的点,1-2-1;multiple代表线的重叠。

    which_loop(g)  #线是否能够指回自己,1-1就是指回自己
    which_multiple(g)  #是否有重复线,后面1-1与前面1-1重复了


    (2)线集属性


    线的属性中,自编译函数能够拿到线权重,E(g)$weight。但是没有标签项,这时候需要用set_vertex_attr加入线标签。

    g<-set_vertex_attr(g,"name",value=V(g)$label)
    原理就是把点集的标签,打到线集上来,name是默认的设置。
    线集的属性中也可以跟数据集一样进行筛选操作。

    temp<-E(g)[order(E(g)$weight>25000)]


    (3)线集加减


    线集的加减可以用add.edges以及-来实现


    g<-add.edges(g,t(edges))  #edges需要先转置
    g<-g-E(g)[(weight>1)]  #删除部分线


    其中需要注意,add.edges中,需要把列数据,转置为行数据,平放id与词条。

    同时线集也会有重复性的问题,见下文count.multiple(g) 以及simplify函数。

    还有一些特别的函数,diameter(g)可以做到最长的链接经过了多少根线。


    4、关系网络的重复性问题


    在关系网络中,重复是常见的,而且无向线中1-2与2-1是重复的,重复线的数量也可以作为线的权重。也就是E(g)$weight。其中igrarh包中笔者看到两个函数跟重复性问题有关。count.multiple(g) 以及simplify函数。


    (1)count.multiple(g) 函数


    可以获得网络中线的重复情况。不重复是1,重复一次+1。比如:无向网络(1-2,2-3,2-1)就是(2,1,2)

    等价于E(g)$weight


    (2)simplify函数


    函数常规式:simplify(g,remove.multiple = TRUE,remove.loops = TRUE,edge.attr.comb = "mean")

    其中loops是指是否循环回自己,比如1-2-1就是一个循环到自己;multiple是指重复比如1-2,2-1。


    h <- graph( c(1,2,1,2,3,3,2,1,4,4) );h   
    is_simple(h)
    simplify(h, remove.loops=FALSE)   #线重复,删除a->b,a->b删掉
    simplify(h, remove.loops=TRUE)    #在线方向性重复基础上删掉点重复,a->a,b->b
    simplify(h, remove.multiple=FALSE)#删掉点重复
    simplify(h, remove.multiple=TRUE)#删掉点重复同时,删除线a->b,a->b
    simplify(h, remove.multiple=TRUE,remove.loops=TRUE) #删掉线重复、点重复


    simplify函数识别了两种重复方式,一种是线重复,比如1-2,2-1,;一种是点重复比如1-1,2-2就是点重复。

    remove.multiple=TRUE,把重复的线删除
    edge.attr.comb,使用重复次数来更新线权重E(g)$weight


    每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~

    ———————————————————————————

    展开全文
  • R语言Rstudio的介绍和安装 R语言的来源: R是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS.S-PLUS是一个商业软件,它...
  • R为非空集合上的的关系如果R是自反的.pptx设R为非空集合上的的关系如果R是自反的.pptx设R为非空集合上的的关系如果R是自反的.pptx设R为非空集合上的的关系如果R是自反的.pptx设R为非空集合上的的关系如果R是自反的...
  • 语言智商和全面智商通常显示出与成就的中等相关性,但表现智商通常与成就没有或几乎没有关系。这种发现模式与之前的韦克斯勒 r 有所不同 与其他人群一起研究。 讨论了对学校心理学家诊断活动的影响。 Wechsler 量表...
  • 关系代数之基本操作 关系代数操作分为集合操作和纯关系操作: 并相容性 某些关系代数操作,如并、差、交等,需满足“并相容性”。 参与运算的两个关系及其相关属性之间有一定的对应性、可比性或意义关联性...两个关系R
  • 变量间的关系分析_R语言

    千次阅读 2018-10-14 16:27:47
    1 变量间的关系分析 1.1 变量间的关系 函数关系(确定性关系)数学模型 相关关系(非确定性关系)统计学 平行关系(相关关系) 一元相关分析 多元相关分析 依存关系(回归分析) 一元回归分析 多元回归分析 ...
  • 实证检验步骤:先做单位根...若所有检验序列均服从同阶单整,可构造VAR模型,做协整检验(注意滞后期的选择),判断模型内部变量间是否存在协整关系,即是否存在长期均衡关系。如果有,则可以构造VEC模型或者进行Gran...
  • 等价关系:集合A上的二元关系R 同时具有自反性、对称性和传递性,则称R是 A上的等价关系。 自反性 从给定的关系矩阵来断判关系 R是否为自反是很容易的。 若M(R的关系矩阵)的主对角线元素均为 1,则 R是自反关系...
  • 原标题:ceRNA关系网络冲击图—桑基图(R语言绘制)在ceRNA相关的研究中,例如circRNA-miRNA-mRNA,或者lncRNA-miRNA-mRNA的靶向关系图谱,一般通过网络图呈现。首先可以肯定的是,网络图是一种清晰展示ceRNA网络结构...
  • 关系模式定义 第一范式 数据库设计原则 规范化 逻辑设计问题⭐ 关系模式中存在的问题 数据冗余大 更新异常 插入异常 删除异常 结论 规范性设计 数据依赖 函数依赖分类 函数依赖...
  • R语言Rstudio入门小建议(一)

    千次阅读 2021-11-20 12:05:49
    R语言Rstudio入门小建议(一)前言相关背景及学习资料基本操作数据导入包(package)外部数据的导入数据类型和数据转换Rstudio的辅助功能强大的查询功能其余功能后记 前言 这学期选修了回归分析,恰巧大作业要用到...
  •  第三范式的定义:如果关系模式R中的所有非主属性对任何候选关键字都不存在传递依赖,则称关系R属于第三范式的。记作R 3NF。  如:学生关系模式S1(学号,姓名,系号,系名,系地址)  (学号)为关键字,因...
  • 等价关系:集合A上的二元关系R 同时具有自反性、对称性和传递性,则称R是 A上的等价关系。 自反性 从给定的关系矩阵来断判关系 R是否为自反是很容易的。 若 M(R的关系矩 阵)的主对角线元素均为 1,则 R是...
  • 在介绍关系运算和逻辑运算之前,先说下R的逻辑常量:TRUE和FALSE。 在R中,TRUE和FALSE分别表示逻辑常量真和假,其值分别为1和0。 &gt; TRUE + 0 [1] 1 &gt; FALSE + 0 [1] 0 在其它语言中,TRUE和FALSE...
  • 我的数据是(一部分):这是相互之间的关系对ENSG00000082929 miR-193b ENSG00000082929 miR-150 ENSG00000082929 miR-96 ENSG00000082929 miR-205 ENSG00000082929 miR-375 ENSG00000082929 miR-145 ENSG...
  • 以Sepal.Length和Sepal.Width为横纵坐标,分水平,以Petal.Width大小为颜色,探索数据之间的关系: library(lattice) levelplot(Petal.Width~Sepal.Length*Sepal.Width, iris, cuts=9,col.regions=grey....
  • 1.设关系模式R(U,F),U={E,G,H,I,J},F={E->I , J->I , I->G , GH->I , IH->E},判断关系R属于第几范式? Ø 关系模式R的候选码为: JH Ø 码属性集为{H,J},非码属性集{E,G,I} Ø 存在非主属性对码的部分...
  • &#13; &#13; &#13; &#13; &#13; &#13; &#13; 来源:R语言中文社区作者:赵镇宁本文约3177字,建议阅读6分钟。本文为你介绍R语言相关关系可视化的...
  • 当数据存储为data.frame格式时,我们通常先将其转为可以使用 PerformanceAnalytics 包之间求相关,并将结果可视化。 chart.Correlation(dda, histogram=TRUE, pch=19) 其中,dda 为data.frame格式的数据,要求...
  • R——相关关系热图

    万次阅读 多人点赞 2019-07-26 22:25:39
    本文介绍了如何画两组变量(特征)的相关关系热图。 准备数据 两组变量的数据可以像下面这样处理,分别保存在两个csv文件中。 > # 导入数据及数据预处理 > setwd("D:/weixin/") > rows <- read.csv(...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 966,611
精华内容 386,644
关键字:

关系r属于