精华内容
下载资源
问答
  • 社交网络分析

    2014-08-08 16:41:34
    社交网络的舆情分析模型,话题的监测和跟踪
  • 实践社交网络分析

    2018-11-15 20:36:21
    介绍了社交网络分析中的理论,并给出了许多具体的案例
  • 大数据社交网络分析

    2018-03-17 19:13:44
    大数据 社交网络社交网络分析   基于社交关系、结构进行挖掘 例如:社区检测、链接预测、影响力分析等  社交内容挖掘   基于文本等内容数据进行挖掘 例如:摘要、关键词、情感分析等   上述二者可结合...
  • 从在线社交网络的“结构与演化—群体与互动—信息与传播”三个方面展开,系统、深入地阐述了在线社交网络分析中的基础理论、关键方法和技术,主要内容包括社交网络的结构特性与演化机理分析、社交网络群体行为的形成...
  • 社交网络分析技术是一种通用有效的研究社会人员之间复杂关系模式的方法。以公安领域为背景,首先介绍了社交网络分析理论,然后详细阐述该技术在公安领域的3个应用案例,包括犯罪团伙挖掘、核心成员识别和串并案挖掘...
  • 社交网络成为推动移动互联网迅猛发展的生力军,人与人的交往数据越来越集中,随着数据条件的成熟,社交网络分析迅速成为一个新兴的跨学科的专业研究方向。电信网络原本就是一个巨大的社交网络,电信企业如何才能让...
  • 社交网络分析结果

    2013-01-22 23:52:50
    社交网络分析的结果,对于数据中5000个用户进行分析,计算网络密度
  • 基于社交网络分析的新星预测
  • 学术社交网络分析的语义模型
  • Facebook社交网络分析和营销
  • 基于社交网络分析的安全的社交多媒体内容分发
  • 分析工具 社交网络分析工具。
  • 方滨兴 在线社交网络分析 方滨兴。 鉴于免费版访问量过大对于服务器压力过大现将免费版开源供大家离线调用. 节假日api 开源免费
  • 斯纳 社交网络分析-应用课程
  • 2017年,通过社交网络分析和常规统计数据对希腊色萨利各个高等教育部门的五个学生网络(体育,兽医,工商管理)(总节点N = 245)进行了检查。主要结果:体育课由于体力运动的强度和压力。 社会排斥似乎是更常见的...
  • Stock-sna:股票社交网络分析
  • Boeing数据集分析--可以用于社交网络分析/社区划分,用户微博之间的关系我都已经分别导出,可以自己导入gephi中进行操作
  • 第07课 Python社交网络分析igraph.pdf第07课 Python社交网络分析igraph.pdf
  • 社交网络分析算法(SNA)

    万次阅读 多人点赞 2017-10-30 22:11:11
    近来学习聚类,发现聚类中有一个非常有趣的方向—社交网络分析,这篇只是一篇概况,并没有太多的公式推导和代码,基本是用人话解释社交网络分析中的常用的几种算法。详细到每个算法的以后有空再把详细的公式和代码补...

    近来学习聚类,发现聚类中有一个非常有趣的方向—社交网络分析,这篇只是一篇概况,并没有太多的公式推导和代码,基本是用人话解释社交网络分析中的常用的几种算法。详细到每个算法的以后有空再把详细的公式和代码补上。
    目录:
    1.应用场景
    2.分析指标
    3.社区发现算法
    3.1 GN算法
    3.2 Louvain算法
    3.3 LPA与SLPA

    1. 应用场景

    社交网络分析中最常用的就是社交圈子的识别,所谓物以类聚,人以群分,一旦能对社交圈子进行分类,能做的事情就会很多。

    FaceBook和微信是关于人与人之间的强关系网络,划分社交圈有助于朋友间相互推荐。
    领英是关于职业的社交的社交网络,有助于求职和商务合作交流。
    微博,Twitter,豆瓣,微信公众号是关于关注与被关注的的弱关系网络,有助于消息和知识的传播。

    分好社交网络之后可以对人进行精准化营销,推荐个性化的商品和服务,比如京东;
    疾病传播也是由一个中心点向外扩散,切断网络中的关键节点就可以有效阻止传染病的传播;
    识别互联网金融行业中的欺诈团伙,进行反欺诈预测;

    这只是其中的三个方面,还有很多应用在此不作细讲。

    2.分析指标

    图,简单来说就是人物(事物)关系的形象化表示。节点(node)代表一个人物,边(edge)代表人物关系。有向图用箭头表示人物间的关系,无向图用线段表示人物间的关系。
    顺便提供两份图数据集,可以自己拿来做实验:
    斯坦福大学实验数据

    网络分析数据集

    这里重点讲述社交网络算法的分析指标。

    度(Degree)
    连接点活跃性的度量;与点相连的边的数目。在有向图中,以顶点A为起点记为出度(out degree)OD(A),以顶点A为终点入度(In degree)ID(A),则顶点A的度为D(A) = OD(A) + ID(A)。
    Igraph是图计算和社交网络分析的常用工具,提供了python的接口,安装方式参考官网:Igraph官网点这

    这里写图片描述

    算了,还是拿权游的数据玩一下比较爽。
    计算度:

    import csv
    edges = []
    firstline = True
    with open('/Users/huanghuaixian/desktop/stormofswords.csv','r') as f:
        for row in csv.reader(f.read().splitlines()):
            if firstline == True:
                firstline = False
                continue
            u,v,weight = [i for i in row]
            edges.append((u,v,int(weight)))
    from igraph import Graph as IGraph
    g = IGraph.TupleList(edges ,directed = True ,vertex_name_attr = 'name' ,edge_attrs = None ,weights = True)
    print(g)
    for p in g.vs:
        print(p['name'],p.degree())

    分析一下网络结构:

    #角色数
    g.vcount()
    #143个角色
    #网络直径,网络中最长最短路径
    print(g.diameter())
    #输出7

    最短路径

    print(g.shortest_paths("Sansa","Margaery"))
    print([ names[x] for x in g.get_all_shortest_paths("Sansa","Margaery")[0]])
    for p in g.get_all_shortest_paths('Sansa'):
        print([names[x]for x in p])
    #输出1和所有以Sansa开始的最短路径

    紧密中心性(closness centrality)
    节点V到达其他节点的难易程度,也就是到其他所有节点距离的平均值的倒数。
    这里写图片描述
    代码实现:

    ccvs = []
    for p in zip(g.vs, g.closeness()):
        ccvs.append({"name": p[0]["name"], "cc": p[1]})
    sorted(ccvs, key=lambda k: k['cc'], reverse=True)[:10]

    [{‘cc’: 0.5120772946859904, ‘name’: ‘Tyrion’},
    {‘cc’: 0.5096153846153846, ‘name’: ‘Sansa’},
    {‘cc’: 0.5, ‘name’: ‘Robert’},
    {‘cc’: 0.48847926267281105, ‘name’: ‘Robb’},
    {‘cc’: 0.48623853211009177, ‘name’: ‘Arya’},
    {‘cc’: 0.4796380090497738, ‘name’: ‘Jaime’},
    {‘cc’: 0.4796380090497738, ‘name’: ‘Jon’},
    {‘cc’: 0.4796380090497738, ‘name’: ‘Stannis’},
    {‘cc’: 0.4690265486725664, ‘name’: ‘Tywin’},
    {‘cc’: 0.4608695652173913, ‘name’: ‘Eddard’}]

    介数中心性(betweenness centrality)
    核心思想是两个非邻接成员间的相互作用依赖于网络中的其他成员,特别是两成员间路径上的成员,它们对两非邻接成员间起着某种控制或依赖关系。如果一个成员A位于其他成员的多条最短路径上,那么成员A的作用就比较大,也具有较大的介数中心性。
    本质:网络中包含成员B的所有最短路径条数占所有最短路径条数的百分比。
    计算公式如下:
    这里写图片描述
    计算步骤:
    1.计算每对节点(i,j)的最短路径(需要得到具体的路径)
    2. 对各节点判断v是否在最短路径下
    3. 累加经过v的最短路径条数

    #偷懒一下
    btvs = []
    for p in zip(g.vs, g.betweenness()):
        btvs.append({"name": p[0]["name"], "bt": p[1]})
    sorted(btvs, key=lambda k: k['bt'], reverse=True)[:10]

    结果:

    [{‘bt’: 332.9746031746032, ‘name’: ‘Tyrion’},
    {‘bt’: 244.63571428571433, ‘name’: ‘Samwell’},
    {‘bt’: 226.2047619047619, ‘name’: ‘Stannis’},
    {‘bt’: 208.62301587301587, ‘name’: ‘Robert’},
    {‘bt’: 138.66666666666666, ‘name’: ‘Mance’},
    {‘bt’: 119.99563492063493, ‘name’: ‘Jaime’},
    {‘bt’: 114.33333333333334, ‘name’: ‘Sandor’},
    {‘bt’: 111.26666666666665, ‘name’: ‘Jon’},
    {‘bt’: 90.65, ‘name’: ‘Janos’},
    {‘bt’: 64.59761904761905, ‘name’: ‘Aemon’}]

    3 . 社区发现算法

    社区相当抱团,类似群的概念,同一个社区内的连接紧密,而社区间的连接非常稀疏。社区发现可以理解为在图中发现n个社区,他们连接非常紧密。

    3.1 GN 算法

    边介数(betweenness):网络中经过该边的最短路径占所有最短路径的比例。
    GN算法计算步骤:
    1. 计算网络中所有边的介数
    2. 找到介数最高的边,并将它从网络中移除
    3. 重复以上步骤,直到每个节点就是一个社区为止。
    这里写图片描述

    3.2 Louvain 算法
    Louvain算法是基于模块度的算法,其优化目标就是最大化整个社区网络结构的模块度。

    模块度
    它的物理含义是社区内节点的连边数与随机情况下节点的连边数之差,它可以衡量一个社区紧密程度的度量。因此模块度就可以作为优化函数优化社区的分类。
    计算方法如下:
    这里写图片描述
    其中 Aij 是节点i与节点j之间的权重,网络不是带权图时,所有边的权重看作是1; ki = jAij 表示所有与节点i相连的权重之和; ci 表示节点i所属的社区;
    m= 12ijAij 表示所有边的权重之和,取值范围:[-1/2,1)。

    算法思想
    1. 不断遍历网络中的节点,尝试把单个节点加入能使模块度提升最大的社区,直到所有节点不再改变
    2. 将第一阶段形成的一个个小的社区并为一个节点,重新构造网络。这时边的权重为两个节点内所有原始节点的边权重之和。
    3. 重复以上两步

    更多请参考:点这

    3.3 LPA与SLPA

    LPA算法思想:
    1. 初始化每个节点,并赋予唯一标签
    2. 根据邻居节点最常见的标签更新每个节点的标签
    3. 最终收敛后标签一致的节点属于同一社区

    SLPA算法思想:
    SLPA是LPA的扩展。
    1. 给每个节点设置一个list存储历史标签
    2. 每个speaker节点带概率选择自己标签列表中标签传播给listener节点。(两个节点互为邻居节点)
    3. 节点将最热门的标签更新到标签列表中
    4. 使用阀值去除低频标签,产出标签一致的节点为社区。

    参考:
    代码部分取自该博客
    七月在线算法课程课件
    概念解释的通俗易懂

    展开全文
  • NFL 教练的社交网络分析,1980-2013 这是Lada Adamic的Coursera“社交网络分析”课程项目。 要求 安装了 igraph 和 knitr 软件包的 R LaTeX - 特别是pdflatex 编译 运行make 打开project.pdf
  • 实施了社交网络分析和横断面统计(Spearman检验和主成分分析)。 基本结果:女性和出国参加运动,在科学上有与众不同的愿望和对社会的选择性倾向于防止遭受欺凌。 高学期,身材高大,家庭受教育程度高以及网络欺凌...
  • 社交网络分析调研上

    2019-08-15 11:09:00
    一、相关概述 1、定义:“由许多节点构成...*在之前是社会学和人类学的研究分支,现在所指的社交网络分析专指在线社交网络分析,该科学的发展是随着在线社交服务的出现而诞生的。 *在线社交服务种类:即时消息...

    //2019年08月15日

    文章来源:https://mp.weixin.qq.com/s/39_r3idlE3plqJwlhrvpAQ

     

    一、相关概述

    1、定义:“由许多节点构成的一种社会结构,节点通常是指个人或者组织,而社交网络代表着各种社会关系。”

    *在之前是社会学和人类学的研究分支,现在所指的社交网络分析专指在线社交网络分析,该科学的发展是随着在线社交服务的出现而诞生的。

    *在线社交服务种类:即时消息类(QQ\wechat\whatsApp\Skype)、在线社交类应用(QQ空间、人人、Facebook)、微博类、共享空间类应用(论坛、博客、视频分享、评价分享等)

    *在线社交网络的特点:迅捷、蔓延、平等、自组织

    2、研究背景

    *社交网络因为四大特性,产生了正面影响,很多事件会在社交网络上迅速发酵

    *与此同时,也产生了很多负面影响,一些谣言和假新闻会借助社交网络迅速传播,造成不可控的影响

    *社交网络分析是基于信息学、数学、社会学、管理学和心理学等科学的交叉学科

    3、研究方向和内容

    *结构与演化

    *群体和互动

    *信息与传播

    二、社交网络的结构特性和演化机理

    1、社交网络的结构分析(建模)

    (1)统计特征:模型中的很多概念来源于图论,因为其本质就是一个由节点和边组成的“图”

    相关概念:

    • 度:网络平均度反映了网络的稀疏程度;度的分布可以刻画不同节点的重要性;
    • 网络密度:定义为网络中实际存在的边数与可容纳边上限的比值,刻画节点间相互连边(社交关系)的密集程度
    • 聚类系数:描述网络中与同一节点相连的结点间也互为邻节点的程度,刻画社交网络中一个人朋友们之间也互相是朋友的概率,反映了社交网络中的聚集性
    • 介数:图中某点承载整个图所有最短路径的数量,通常用来评价节点的重要程度

    (2)网络特性

    • 小世界现象:“地理位置相距较远的人”可能具有较短的社会关系间隔
    • 无标度特性:节点度分布不存在有限衡量分布范围的性质称为无标度,无标度网络表现出来的度分布特征为幂律分布,这是此类网络的无标度特性。

    *小世界现象,最初的提出是哈佛教授提出的”六度分割理论”,然后19998年正式提出这个概念,并建立了小世界模型。

    (3)网络模型

    • WS模型:即小世界模型,通过该模型生成的小世界网络,是从规则网络向随机网络过渡的中间形态
    • BA模型:考虑现实网络中节点的幂律分布特性,生成无标度网络
    • 其它:森林火灾模型、Kronecker模型、生产模型

    2、虚拟社区发现技术

    (1)定义:虚拟社区基于子图局部性(社区结构是若干节点子集的集合,每个子集内部点连接紧密,不同子集节点之间的连边相对稀疏),瑞格尔德对其最早的定义“一群主要藉由计算机网络彼此沟通的人们,他们彼此有某种程度的认识、分享某种程度的知识和信息、在很大程度上如同对待朋友般彼此关怀,从而所形成的团体”。

    *个人理解:应该是社交网络中联系紧密的一个子图

    (2)研究意义

    *有助于理解网络拓扑结构特点,揭示复杂系统内在功能特性,理解社区内关系

    *为信息检索、信息推荐、信息传播控制和公共事件管控提供有力支撑。

    理解:就相当于现在所做的工作,将所有的信息建模,然后找到相应的一堆关系子图,其实就是寻找到社交网络有价值的群体子图???然后再根据此子图进行研究。

    (3)社区发现评价指标

    • 模块度:通过比较现有网络与基准网络在相同社区划分下的连接密度差来衡量网络社区的优劣
    • NMI:利用信息熵来衡量预测社区结构一直社区结构的差异,差值越大,划分越好;
    • Rand Idex:表示在两个划分中都属于同一社区或者都属于不同社区的结点对的数量的比值 
    • Jaccard Index:用来衡量样本之间的差异性

    (4)发现算法

    *社区静态发现

    • 模块度最优化算法
    • 多目标优化算法
    • 基于概率模型的算法
    • 信息编码算法

    *社区动态发现

    • 派系过滤算法
    • 基于相似度的聚合算法
    • 标签传播算法
    • 局部扩展优化算法

    3、虚拟社区的演化分析

    *在线社交网络中存在的大量显性或者隐性的虚拟社区结构,但是这些社区的结构不是永恒不变的,随着事件的变化,社区结构也在不断演变,所以要分析动态的虚拟社区结构演化

    (1)虚拟社区的涌现:其从无到右的过程,最重要的特征是网络聚集现象。

    • 周期闭包:网络节点倾向于和自己在网络中邻居的邻居建立连接关系而形成的结构,这是虚拟社区形成的主要因素。(焦点闭包:两个节点间有共同的兴趣或者参与共同的活动)
    • 偏好连接:很多真实网络中,新增加的边并不是随机连接的,而是倾向于和具有较大度数的连接

    (2)虚拟社区的演化

    *影响因素很多,重点是如何挖掘虚拟社区演化中的关键因素!

    *用户个体的累积效应,结构的多样性和结构平衡性对虚拟社区的演化都存在影响

    (3)演化虚拟社区的发现(有很多研究资料)

    相关算法

    • 基于相邻时刻相似度直接比较的演化虚拟社区发现
    • 基于演化聚类分析的演化虚拟社区发现
    • 基于拉普拉斯动力学方法的演化虚拟社区发现
    • 基于派系过滤算法的虚拟社区发现
    • 基于节点行为趋势分析的演化虚拟社区发现

    问题理解:这个演化虚拟社区发现和之前静/动的演化社区发现有什么区别,这里的研究工作还是在虚拟社区发现上是嘛?

    三、社交网络群体行为和互动规律

    1、用户行为

    *定义:使用户对自身需求,社会影响和社交网络技术进行综合评估的基础上做出的使用社交网络服务的益园,以及由此引起的各种使用活动的总和。

    *用户行为的研究:

    • 将在线社交网络作为一种特定的信息技术,研究用户对在线社交网络技术的采纳行为、拒绝行为和用户忠诚;
    • 将在线社交网络视为提供各种服务和应用的平台,研究用户使用各种服务和应用所表现出来的特征和规律

    (1)用户采纳和忠诚度:用户在对自身需求、社会影响和在线社交技术进行综合评估的基础上做出的使用在线社交网络服务的意愿或行为,在线社交网络再出现初期能否被尽可能多的用户采纳和试用对于其后续的扩散至关重要。

    目前,会对用户忠诚做相关的研究

    *相关算法

    • 基于技术接受模型的在线社交网络用户采纳模型
    • 基于计划行为理论的在线社交网络用户采纳模型
    • 基于期望确认理论的在线社交网络用户忠诚模型
    • 基于心流体验理论的在线社交网络用户忠诚模型

    (2)用户个体使用行为

    • 一般使用行为
    • 内容创建行为
    • 内容消费行为

    (3)用户群体互动行为

    • 群体互动关系选择
    • 群体互动的内容选择
    • 群体互动的时间规律

    2、社交网络情感分析

    *网络已经是人们获取信息,发表意见的主要途径,根据文本内容,可以分成两种:客官描述信息和主观性信息。

    *情感分析在这里等同于“意见挖掘“,是针对主观性信息进行分析、处理和归纳过程。

    (1)文本情感分析

    (2)社交网络情感分析技术

    3、个体影响力分析

    *发现社交网络中有影响力的个体

    (1)基于网络结构的个体影响力计算:度中心度(与该节点直接相连的节点的数量)、接近中心度(某节点与网络中所有其他节点的最短距离之和)、介数(衡量某节点在社交网络中中介作用大小,网络中某两个节点所有最短路径的数量除以这些路径中经过A节点路径的数量便是A节点的介数)

    (2)基于行为的个体影响力计算

    (3)基于话题的个体影响力计算

    4、群体聚集及影响机制分析

    *群体极化:在群体决策的情境中,个体意见或决定往往会受到群体间的彼此讨论的影响,而产生一个群体性的结果。群体极化往往表现 为群体内的个体不经过个人思考而同意大多数人的观点。

    *产生条件:

    • 必须有激发事件出现
    • 群体内的个人能看到前人的选择
    • 群体信息缺乏
    • 群体有一定的同质性

    四、社交网络信息传播与演化机理

    1、在线社交网络信息检索

    *信息检索:从大规模非结构化数据中获取信息的过程

    (1)社交网络内容搜索

    • 时间先验方法
    • 多特征组合的方法

    (2)社交网络内容分类

    (3)社交网络推荐

    • 协同过滤推荐
    • 基于模型的推荐:邻居模型,矩阵分解模型,融入社交网络信息

    2、社交网络信息传播规律

    *信息传播是人们通过符号、信号、传递、接收与反馈信息的活动,是人们彼此交换意见、思想、情感已达到互相了解和影响的过程。

    (1)基于网络结构的传播模型

    • 线性阈值模型
    • 独立级联模型

    (2)基于群体状态的传播模型

    • 线性影响力模型

    (3)基于信息特征的传播模型

     

    3、话题发现与演化

    (1)基于主题模型的话题发现

    (2)基于向量空间模型的话题发现

    (3)基于词项关系图的话题发现

    (4)基于主题模型的话题演化

    (5)基于相邻时间片关联的话题演化

    、4、影响力最大化

    *在社交网络中选定信息初始传播用户,使得信息的传播范围能达到最大,即影响力最大。

    *目的:找到一定数量的用户作为影响力传播的初始节点,对影响力最大化的问题的建模是基于社交网络信息传播模型的。

    • 贪心算法
    • 启发式算法

     

    理解总结:社交网络总共的方向是三个,社交网络的构建和分析、社交网络的群体和用户分析、社交网络的信息传播。在社交网络中,社交网络的构建和分析是基础,其中包括网络的分析(分析现实网络的规律和特性,从而更好的进行建模,研究构建算法)、虚拟社区的发现和分析(在构建的网络中发现有价值的网络信息)、虚拟社区的演化(就是在网络的发展过程中,这个社区是不断变化和发展的,要在动态中去发现新的社区);在这些基础上,去研究个体的行为和群体的行为,然后得到有价值的信息,与此同时利用构造的网络,利用算法,进行信息的传播。

     

    问题理解:

    1、动态社区发现与社区演化的区别:

    静态和动态是计算方法的不同,所谓静态计算发现方法,是通过优化网络的局部目标函数,搜索网络社区划分的空间,静态的找出最佳的虚拟社区结构;动态计算方法是基于网络局部拓扑信息,由网络中的结点动态逐步推演,最终形成虚拟社区结构。

    对于社区的演化,是指网络是不断改变的,自己的理解,在动态的社交网络中怎么去发现虚拟社区。

    2、如何知道找到的虚拟社区是对的?

    算法评价标准:上面所提到的准确度指标。

    3、目前的研究难点

    (1)网络的规模急剧膨胀

    (2)人际关系的复杂性决定了社会网络的动态变化性

     

     

     

     

     

     

     

     

     

     

    展开全文
  • SNA:课程 社交网络分析分配和任务
  • igraph”软件包,通过应用研究项目向学生介绍社交网络分析。 “网络和关系管理”模块是面向本科生主要学习的研讨会。 该模块的目的是在较小的案例研究中从理论和经验上学习社交网络分析,然后在单独的项目中实施。 ...
  • 社交网络分析是分析社会关系结构模式的社会学范式。 它提供了一套方法和措施来识别,可视化和分析组织内部以及组织之间的非正式个人网络。 因此,社交网络分析提供了一种识别,检查和支持社交网络中知识共享过程的...
  • 根据我们的经验,我们发现树状图在社交网络分析设置中也很有用。 树状图以镶嵌形式表示分层和分类数据,其中包含嵌入的矩形形状,其中每个形状的大小密切相关。 在以交互模式(而不是静态或打印形式)检查数据时,...
  • 社交网络分析及案例详解》共分三大部分:第一部分介绍了社交网络分析的原理,社交网络分析研究立足社会学的角度,介绍了基于图论原理的社交网络理论基础,以及一些常用的计算指标和社交网络总体网络架构;...
  • 社交网络分析附应用前沿学习资源 本文主要阐述 社交网络的结构特性与演化机理 社交网络群体行为形成与互动规律 社交网络信息传播与演化机理 社交网络分析的应用 社交网络前沿研究 学习资料 参考资料 前言 社交网络在...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 74,092
精华内容 29,636
关键字:

社交网络分析