‘壹’ 复杂网络 --- 社会网络分析
“社会网络”指的是社会成员及其相互关系的集合。社会网络中所说的“点”是各个社会成员,而社会网络中的“边”指的是成员之间的各种社会关系。成员间的关系可以是有向的,也可以是无向的。同时,社会关系可以表现为多种形式,如人与人之间的朋友关系、上下级关系、科研合作关系等,组织成员之间的沟通关系,国家之间的贸易关系等。社会网络分析(Social Network Analysis)就是要对社会网络中行为者之间的关系进行量化研究,是社会网络理论中的一个具体工具。
因此,社会网络分析关注的焦点是关系和关系的模式,采用的方式和方法从概念上有别于传统的统计分析和数据处理方法。
社会网络通常表达人类的个体通过各种关系连接起来,比如朋友、婚姻、商业等,这些连接宏观上呈现出一定的模式。很早的时候,一些社会学家开始关注人们交往的模式。Ebel等进行了一个电子邮件版的小世界问题的实验,完成了Kiel大学的5000个学生的112天电子邮件连接数据,节点为电子邮件地址,连接为消息的传递,得到带指数截断的幂律度分布,指数为r=1.18。同时证明,该网络是小世界的,平均分隔为4.94。
社会网络分析,可以解决或可以尝试解决下列问题:
“中心性”是社会网络分析的重点之一,用于分析个人或组织在其社会网络中具有怎样的权力,或者说居于怎样的中心地位,这一思想是社会网络分析者最早探讨的内容之一。
点度中心度表示与该点直接相连的点的个数,无向图为(n-1),有向图为(入度,出度)。
个体的中心度(Centrality)测量个体处于网络中心的程度,反映了该点在网络中的重要性程度。网络中每个个体都有一个中心度,刻画了个体特性。除了计算网络中个体的中心度外,还可以计算整个网络的集中趋势(可简称为中心势,Centralization)。网络中心势刻画的是整个网络中各个点的差异性程度,一个网络只有一个中心势。
根据计算方法的不同,中心度和中心势都可以分为3种:点度中心度/点度中心势、中间中心度/中间中心势、接近中心度/接近中心势。
在一个社会网络中,如果一个个体与其他个体之间存在大量的直接联系,那么该个体就居于中心地位,在该网络中拥有较大的“权力”。在这种思想的指导下,网络中一个点的点度中心性就可以用网络中与该点之间有联系的点的数目来衡量,这就是点度中心度。
网络中心势指的是网络中点的集中趋势,其计算依据如下步骤:首先找到图中的最大点度中心度的数值,然后计算该值与任何其他点的中心度的差值,再计算这些“差值”的总和,最后用这个总和除以各个“差值”总和的最大可能值。
在网络中,如果一个个体位于许多其他两个个体之间的路径上,可以认为该个体居于重要地位,因为他具有控制其他两个个体之间的交往能力,这种特性用中间中心度描述,它测量的是个体对资源控制的程度。一个个体在网络中占据这样的位置越多,代表它具有很高的中间中心性,就有越多的个体需要通过它才能发生联系。
中间中心势定义为网络中 中间中心性最高的节点的中间中心性与其他节点的中间中心性的差距,用于分析网络整体结构。中间中心势越高,表示该网络中的节点可能分为多个小团体,而且过于依赖某一个节点传递关系,说明该节点在网络中处于极其重要的地位。
接近中心性用来描述网络中的个体不受他人“控制”的能力。在计算接近中心度的时候,我们关注的是捷径,而不是直接关系。如果一个点通过比较短的路径与许多其他点相连,我们就说该点具有较高的接近中心性。
对一个社会网络来说,接近中心势越高,表明网络中节点的差异性越大;反之,则表明网络中节点间的差异越小。
注:以上公式都是针对无向图,如果是有向图则根据定义相应修改公式即可
当网络中某些个体之间的关系特别紧密,以至于结合成一个次级团体时,这样的团体在社会网络分析中被称为凝聚子群。分析网络中存在多少个这样的子群,子群内部成员之间关系的特点,子群之间关系特点,一个子群的成员与另一个子群成员之间的关系特点等就是凝聚子群分析。
由于凝聚子群成员之间的关系十分紧密,因此有的学者也将凝聚子群分析形象地称为“小团体分析”或“社区现象”。
常用的社区检测方法主要有如下几种:
(1)基于图分割的方法,如Kernighan-Lin算法,谱平分法等;
(2)基于层次聚类的方法,如GN算法、Newman快速算法等;
(3)基于模块度优化的方法,如贪婪算法、模拟退火算法、Memetic算法、PSO算法、进化多目标优化算法等。
凝聚子群密度(External-Internallndex,E-IIndex)主要用来衡量一个大的网络中小团体现象是否十分严重,在分析组织管理等问题时非常有效。
最差的情形是大团体很散漫,核心小团体却有高度内聚力。另外一种情况是,大团体中有许多内聚力很高的小团体,很可能就会出现小团体间相互斗争的现象。凝聚子群密度的取值范围为[-1,+1]。该值越向1靠近,意味着派系林立的程度越大;该值越接近-1,意味着派系林立的程度越小;该值越接近0,表明关系越趋向于随机分布,未出现派系林立的情形。
E-I Index可以说是企业管理者的一个重要的危机指数。当一个企业的E-I Index过高时,就表示该企业中的小团体有可能结合紧密而开始图谋小团体私利,从而伤害到整个企业的利益。其实E-I Index不仅仅可以应用到企业管理领域,也可以应用到其他领域,比如用来研究某一学科领域学者之间的关系。如果该网络存在凝聚子群,并且凝聚子群的密度较高,说明处于这个凝聚子群内部的这部分学者之间联系紧密,在信息分享和科研合作方面交往频繁,而处于子群外部的成员则不能得到足够的信息和科研合作机会。从一定程度上来说,这种情况也是不利于该学科领域发展的。
核心-边缘(Core-Periphery)结构分析的目的是研究社会网络中哪些节点处于核心地位,哪些节点处于边缘地位。核心-边缘结构分析具有较广的应用性,可用于分析精英网络、论文引用关系网络以及组织关系网络等多种社会现象。
根据关系数据的类型(定类数据和定比数据),核心—边缘结构有不同的形式。定类数据和定比数据是统计学中的基本概念,一般来说,定类数据是用类别来表示的,通常用数字表示这些类别,但是这些数值不能用来进行数学计算;定比数据是用数值来表示的,可以用来进行数学计算。如果数据是定类数据,可以构建离散的核心-边缘模型;如果数据是定比数据,可以构建连续的核心-边缘模型。
离散的核心-边缘模型,根据核心成员和边缘成员之间关系的有无及紧密程度,又可分为3种:核心-边缘全关联模型、核心-边缘局部关联模型、核心-边缘关系缺失模型。如果把核心和边缘之间的关系看成是缺失值,就构成了核心-边缘关系缺失模型。
这里介绍适用于定类数据的4种离散的核心-边缘模型:
参考
社会网络关系由节点和关系两部分组成,围绕这两部分进行计算。
社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系。
社会网络关系就是社会资本,在新经济中,社会网络关系即指社会资本已经成为科技创新的一个关键因子,是在一个组织网络能够进行团结协作、相互促进生产收益的情况下而形成的“库存”。
‘叁’ 社会网络的特征有哪些
1、基于“网络”(节点之间的相互连接)构成的一种社会结构;
2、具有个人化与互动性,信息传播更加自主化、个人化,每个人既是信息的接受者,也是创造者;
3、社会网络是一对一交流,基于多样化群体;
4、以朋友为基础建立关系,较弱的社会控制及转向其他网络,与其他网络界限模糊;
5、更偏向于私人空间和线上活动,是属于网络化组织。
6、社会网络具有多变性、不确定性。
(3)社会网络主要元素节点和连接扩展阅读:
社会网络的发展
社会网络作为一种社会学视角发端于德国社会学家齐美尔(Georg Simmel, 1858-1918),并在 1960 年代随着冷战的开始和西方普遍出现的社会动乱开始在西方广为发展。
一个多世纪以来,社会科学家都在使用“社会网络”这一隐喻表示不同尺度上的各种复杂社会关系。直到 1950 年代,才开始系统化而自知地使用这一词汇表示一种不同于传统意义上的有边界的社会群体和将人看作分离的个体的社会类别的联系方式。
‘肆’ 社会化网络分析论文的一般结构是什么
1、 点:行动者、节点(actors, nodes)
即为社会网络中的一个功能个体(包括个人、单位、团体(看成一个整体)),在虚拟网络中表现为一个注册用户,ID等。
在社会网络研究领域,任何一个社会单位、社会实体或功能个体都可以看成是“节点”,或者行动者。
一个图中: 节点集合N={n1,n2,、、、n3}
2、 线,关系(relationship):
用来刻画关系数据,关于接触、联络、关联、群体依附和聚会等方面的数据,这类数据把一个能动者与另外一个能动者联系在一起,因而不能还原为单个行动者本身的属性。如上图表示的线arc。
一般称由一条线连着的点是相互“邻接的(adjacent)”,邻接是对由两个点代表的两个行动者之间直接相关这个事实的图论表达。
一般有无向线、有向线、多值线、有向多值线。
由线构成的图无向图、有向图、有向多值、无向多值图。
3、 邻域(neighborhood):
与某个特定点相邻的那些点成为该点的“邻域”。
4、 度数(degree):
邻域中的总点数成为度数。(严格的说应该是“关联度”,(degree of connection)),一个点的度数就是对其“邻域”规模大小的一种数值侧度。
一个点(无向图)的度数,在邻接矩阵中,一个点的度数用该点所对应的行或者列的各项中的非0值总数来表示。如果是二值(有项)的,那么一个点的度数就是该点所在行和所在列的总合。
在有向图中,“度数”包括两个不同方面,表达社会关系的线的方向。分别称为“点入度(in-degree)”:直接指向该点的点数总合;和“点出度(out-degree)”:该点所直接指向的其它点的总数。因此,对应在有向图的矩阵上,点的入度:对应该点所在列的地总和上。出度:该点所在行的总和上。
所有点的度数总合:无向图的总度数查线(关系)即可,有项图的总度数查线的2倍。
5、 线路(walk):
各个点可以通过一条线直接相连,也可以通过一系列线间接相连,在一个图中的这一系列线叫做一条“线路”。
6、 途经(path):
线路中每个点和每条线都各不相同,则称该线路为“途经”,“途经”的“长度”,用构成该途经的线的条数来测量。
7、 距离(distance):
一个重要的概念,指连接两个点的最短路径(即捷径,geodesic)的长度。在图论中一般称作最短路经。要与“途经”的概念相区分。
8、 方向
主要是看有向图的方向问题。
9、 密度(density)
描述了一个图中各个点之间关联的紧密程度。一个“完备(complete)图”(在图论中称完全图)指的是一个所有点之间都相互邻接的图。这种完备性即使在小网络中也积极少见。密度这个概念试图对线的总分布进行汇总,以便测量图在多大程度上具有这种完备性。密度依赖于另外两个网络结构参数:图的内含度和图中各点的度数总和。密度指的是一个图的凝聚力的总体水平。
“密度”和“中心势”这两个概念代表的是一个图的总体“紧凑性(compactness)”的不同方面。
图的内含度(inclusiveness):图中各类关联部分包含的总点数,也可表述为图的总点数减去孤立点的数。不同的图进行比较常用的侧度为: 关联点数/总点数 15/20=75%
各点度数总和:
密度计算公式: 图中实际拥有的连线数与最多可能拥有的线数之比,其表达式为2l/n(n-1)。 有向图的表达式为:l/n(n-1)
多值图的密度:需要估值多重度问题,显然多重度高的线对于网络密度的贡献要比多重度低的线的贡献大。比较有争议的一种测度。
巴恩斯(Barnes,1974)比较了两类社会网络分析:
10、 个体中心(ego-centric) 网研究
围绕特定的参考点而展开的社会网,密度分析关注的是围绕着某些特定行动者的关系的密度。计算个体中心网密度的时候,通常不考虑核心成员及与该成员有直接关系的接触者,而是只关注在这些接触者之间存在的各种联系(links)。
11、 社会中心(socio-centric)网研究
关注的是作为一个整体的网络关联模式,这是对社会网络分析的另外一类贡献,从这一角度出发,密度则不再是局部行动者的“个体网”密度,而是整个网络的密度。密度计算上文已经提到。
12、 点度中心度(point centrality)
一个图中各个点的相对中心度
13、 图的中心度(graph centrality) 即为中心势的概念
14、 整体中心度(global centrality) (弗里曼Freeman 1979,1980)
整体中心度指的是该点在总体网络中的战略重要性。根据各个点之间的接近性(closeness),根据不同点之间的距离。可以计算出图中某点与其他各个点之间的最短距离之和。
无向图:可以通过软件计算出来一个无向图中各个点之间的距离矩阵,那么一个点的“距离和”比较低的点与其他很多点都“接近”。接近性和距离和呈反向关系。
有向图:“内接近性(in-closeness)”和“外接近性(out-closeness)”来计算
15、 局部中心点
一个点在七紧邻的环境中与很多点有关联,如果一个点有许多直接相关的“邻点”,我们便说该点是局部中心点。
16、 整体中心点
如果一个点在网络的总体结构上占据战略上的重要地位,我们就说该点是整体中心点。
17、 局部中心度(local centrality)
局部某点对其邻点而言的相对重要性。测量仅仅根据与该点直接相连的点数,忽略间接相连的点数。在有向图中有内中心度(in-centrality)和外中心度(out-centrality)。也可以自定义距离为1或2进行测度,如果定义为4(大多数点的距离为4),就毫无意义,也没有信息。
18、 局部中心度的相对测度
点的实际度数与可能联络得最多度数之,注意要去掉该点本身。
19、 中心势(centralization) 弗里曼(freeman,1979)
指的不是点的相对重要性,而是整个图的总体凝聚力或整合度。很少有人试图界定一个图的结构中心思想。中心势描述的则是这种内聚性能够在多大程度上围绕某些特定点组织起来。因此,中心势和密度是两个重要的、彼此相互补充的量度。
核心点的中心度和其它点的中心度之差。因此得出概念:实际的差值总和和与最大可能的差值总和相比。
‘伍’ 怎么解释社会网络的概念
社会网络(socialnetwork)是一种基于“网络”(节点之间的相互连接)而非“群体”(明确的边界和秩序)的社会组织形式,也是西方社会学从1960年代兴起的一种分析视角。随着工业化、城市化的进行和新的通讯技术的兴起,社会呈现越来越网络化的趋势,发生“社会网络革命”(socialnetworkrevolution),与移动革命(mobilerevolution)、互联网革命(internetrevolution)并列为新时期影响人类社会的三大革命. 社会网络是指社会个体成员之间因为互动而形成的相对稳定的关系体系,社会网络关注的是人们之间的互动和联系, 社会互动会影响人们的社会行为。社会网络是由许多 节点构成的一种社会结构,节点通常是指个人或组织,社会网络代表各种 社会关系,经由这些社会关系,把从偶然相识的泛泛之交到紧密结合的家庭关系的各种人们或组织串连起来。社会关系包括朋友关系、同学关系、生意伙伴关系、种族信仰关系等。社会网络作为一种社会学视角发端于德国社会学家齐美尔(Georg Simmel, 1858-1918),并在 1960 年代随着冷战的开始和西方普遍出现的社会动乱开始在西方广为发展。社会网络分析不把人看作是由个体规范或者独立群体的共同活动所驱动,相反它关注人们的联系如何影响他们行动中的可能性和限制。一个多世纪以来,社会科学家都在使用“社会网络”这一隐喻表示不同尺度上的各种复杂社会关系。
‘陆’ 社会网络(一):思维和节点
郑路老师社会网络课简易思考和总结
1.用网络思维思考问题
很多事情从网络视角解释和个体视角解释是不同的,我们常常放大了个体的主观性而忽略了网络(环境,与他人的连接)对个体判断和行为的影响,在社会网络中,我们常常会发现:网络的影响往往大于个体自己,每个人在做决定时很多时候是受到他人和环境的影响更大。
网络由两个基本要素组成: 网络 = 节点 + 连接
2.节点:中心度 ---3个维度的判断
(1) 度中心度 :自己直接连接的数量,直接连接的数量越多,度中心度越大。
(2) 中介中心度 :其他节点连接时经过和过渡的数量,即作为其他节点连接的中介的次数,作为中介的次数越多,中介中心度越大。
(3) 特征向量中心度 :直接连接或者作为中介连接的其他节点自身的影响力,即连接的对象越厉害,特征向量中心度就越高。
一个人影响力的大小或者重要性可以从3个维度看:他直接认识的人的数量,有多少人通过他而相互连接,他连接的人有多么牛。
3.结构洞- -作为两个或多个节点的连接和链接渠道
结构洞:信息优势 + 控制优势
4.多重网络---穿越多个网络,构建新的网络
后来者居上的方法:构建新的网络并占据有利位置。
‘柒’ 社会网络
什么是网络?
简单来讲,网络的构成有两个要素。
一个是节点;另一个是节点和节点之间的连接。
节点,一般指的是行动者,比如个人、群体、组织,也可能是城市或国家。
连接,反映的是节点间的某种互动关系。最常见的是人际关系,由此构成朋友网、讨论网、拜年网等等。
在更加宽泛的意义上,网络的研究可以看成是一切互动形式的研究,从信息交流、情感支持、贸易往来、信用与资金的流动,到疾病的传播、创新与文化要素的扩散,都可以作为网络分析的对象。
什么是网络视角?
首先,网络科学强调连接的重要性。
在网络科学看来,比起节点自身的特征或属性,节点之间的关系对节点的影响更大。这种思维方式,在很多学科都掀起了认知革命。
比如说,市场营销。传统的市场营销往往关注的是潜在消费者的个体特征。推出一款新的手机,就会研究多大年龄段、什么教育程度、多少收入、从事哪些职业的人更容易购买?然后,再给消费者做用户画像,选择广告渠道,制定营销策略。
但实际上,研究发现,我们99%的决定或行为都是在他人影响下做出的,个人品味和喜好的决定作用非常有限。虽然社会告诉我们要做自己,不要随波逐流、受他人影响,但其实,我们无时无刻不在受到我们身边的朋友喜欢什么,选择了什么品牌的影响,他们构成了我们的参照群体(reference group)。
比如说,有一个青春期的男孩子,父母想让他学医,老师觉得他是学计算机的料,但他却想玩摇滚。原因很简单,他喜欢的那个隔壁班的女孩子,最爱摇滚乐。
还有,我们熟知的孟母三迁的故事,表面上看是为了改变孩子成长的环境,更准确地说为了要改变他的同伴网络。如果你的小孩正在念书,你了解孩子身边最好的朋友都是谁吗?这可是做父母不可忽视的大问题。
第二,网络视角除了强调连接的重要性之外,还强调整个网络对节点的影响。
问你一个问题,你知道世界上最赚钱的公司是哪一家吗?
是Facebook。Facebook的市值高达5000亿美金,但奇怪的是Facebook并没有什么资产。它既没有Apple的生产线,也没有Amazon的物流,更没有Goolge诸多的发明专利。那么,Facebook为什么这么值钱呢?为什么资本市场给了Facebook这么高的评价呢?
这是因为Facebook最值钱的资产,不是生产线,不是大楼,也不是发明专利,而是它拥有的全球20亿用户的社会网络。拥有了这个网络,Facebook就能准确地洞察人与人之间的互动和影响,就成为了世界上最精准、最高效的广告平台。
Facebook的创始人扎克伯格在接受《商业周刊》采访时,讲了这样一段话,大意是说,可口可乐可以出最高的价格,请全世界最有创意的广告师设计出一个广告,告诉世人可口可乐有多么美味;但对我们每一个人来说,如果我们的好朋友在身边喝了一口可乐,然后感叹道它是多么令人爽快,这对可口可乐来说,才是最有效果的广告。Facebook的高明之处,就是它建立了一个网络,而大家都愿意成为这个网络上的一个节点,相互连接起来。
第三,一个网络的整体结构特征,不仅对每个节点会产生影响,对整个网络的生存和竞争力也至关重要。
我们之前以为,做生意,比拼的是经营者聪明的头脑,优质的产品或服务。其实,很多生意之所以成功,靠的也是社会网络,比如传统的老乡网络。
你可能注意过,开复印店的人一般都操着相似的口音。对,他们都来自同一个地方:湖南省新化县。据说,有超过20万新化人在全国各地开复印店。不管你是在北京、上海,还是东北、拉萨,只要走进街边随便哪家复印店,都有75%以上的概率碰到新化人。
那么,为什么新化人能够牢牢占住这个市场,外人想进也进不了呢?这是因为新化人有一个绝招,就是他们建立了一个二手复印机国际贸易、复印机维修翻新的网络。这个网络里提供的知识、设备和资本,能够帮助他们把成本降下去,把利润提上来。在新化人开店之前,一台复印机的成本是十几万元,平摊到每次复印的成本就非常地高昂。新化人进来以后,居然就把复印的价格降到了一张只卖一毛钱。这条路蹚出来以后,新化人就开始以亲带亲、以邻带邻、以友带友,把复印店开到全国各地。
其实,这种同乡同业的现象并非特例。从新化人开复印店,到浙江桐庐人送快递,再到青海人卖拉面、安徽人搞装修,他们成功的秘诀,借用美国社会学家沃尔特·鲍威尔(Walter Powell)的一句名言——既不是市场,也不是厂商,而是网络。