A. 使用python對復雜網路進行模擬,其他都挺正常,聚類系數全顯示是0,如何破
復雜網路模擬 具體是做哪方面的呢?
B. 神經網路模型的介紹
神經網路(Neural Networks,NN)是由大量的、簡單的處理單元(稱為神經元)廣泛地互相連接而形成的復雜網路系統,它反映了人腦功能的許多基本特徵,是一個高度復雜的非線性動力學習系統。神經網路具有大規模並行、分布式存儲和處理、自組織、自適應和自學能力,特別適合處理需要同時考慮許多因素和條件的、不精確和模糊的信息處理問題。神經網路的發展與神經科學、數理科學、認知科學、計算機科學、人工智慧、信息科學、控制論、機器人學、微電子學、心理學、光計算、分子生物學等有關,是一門新興的邊緣交叉學科。
神經網路的基礎在於神經元。
神經元是以生物神經系統的神經細胞為基礎的生物模型。在人們對生物神經系統進行研究,以探討人工智慧的機制時,把神經元數學化,從而產生了神經元數學模型。
大量的形式相同的神經元連結在—起就組成了神經網路。神經網路是一個高度非線性動力學系統。雖然,每個神經元的結構和功能都不復雜,但是神經網路的動態行為則是十分復雜的;因此,用神經網路可以表達實際物理世界的各種現象。
神經網路模型是以神經元的數學模型為基礎來描述的。人工神經網路(ArtificialNuearlNewtokr)s,是對人類大腦系統的一階特性的一種描。簡單地講,它是一個數學模型。神經網路模型由網路拓撲.節點特點和學習規則來表示。神經網路對人們的巨大吸引力主要在下列幾點:
1.並行分布處理。
2.高度魯棒性和容錯能力。
3.分布存儲及學習能力。
4.能充分逼近復雜的非線性關系。
在控制領域的研究課題中,不確定性系統的控制問題長期以來都是控制理論研究的中心主題之一,但是這個問題一直沒有得到有效的解決。利用神經網路的學習能力,使它在對不確定性系統的控制過程中自動學習系統的特性,從而自動適應系統隨時間的特性變異,以求達到對系統的最優控制;顯然這是一種十分振奮人心的意向和方法。
人工神經網路的模型現在有數十種之多,應用較多的典型的神經網路模型包括BP神經網路、Hopfield網路、ART網路和Kohonen網路。 學習是神經網路一種最重要也最令人注目的特點。在神經網路的發展進程中,學習演算法的研究有著十分重要的地位。目前,人們所提出的神經網路模型都是和學習演算法相應的。所以,有時人們並不去祈求對模型和演算法進行嚴格的定義或區分。有的模型可以有多種演算法。而有的演算法可能可用於多種模型。在神經網路中,對外部環境提供的模式樣本進行學習訓練,並能存儲這種模式,則稱為感知器;對外部環境有適應能力,能自動提取外部環境變化特徵,則稱為認知器。神經網路在學習中,一般分為有教師和無教師學習兩種。感知器採用有教師信號進行學習,而認知器則採用無教師信號學習的。在主要神經網路如Bp網路,Hopfield網路,ART絡和Kohonen網路中;Bp網路和Hopfield網路是需要教師信號才能進行學習的;而ART網路和Khonone網路則無需教師信號就可以學習49[]。所謂教師信號,就是在神經網路學習中由外部提供的模式樣本信號。
C. 如何理解道路流的復雜性
城市道路網路復雜性的研究方法
一、引言
空間句法理論1984年由Hillier和Hanson在其著作《空間的社會邏輯》一書中首先提出後,引起了學者的廣泛注意,他們認為建築及城鎮的空間布局會對人類活動、社會交往的方式及強度產生影響[1]。此後學者們進行了大量的應用實踐,其中Peponis和他的合作者提出了一套新的空間分割方法,即用特徵點代替軸線[2],而江斌首次將空間句法理論集成到GIS中[3]。復雜網路理論最初產生於著名的「七橋問題」,而隨機圖論的發展為復雜網路的發展奠定了基礎。之後Milgram 做了著名的小世界試驗,並首次提出小世界現象[4]。而Watts及Strogatz發表的題為Collective dynamics of 「small world」 networks[5]和Barabasi及Albert發表的題為Emergence of Scaling in Random Networks[6]的兩篇文章開創了復雜網路研究的新紀元。這兩篇文章分別解釋了復雜網路的小世界特徵和無標度性質,並建立了相應的模型以闡述這些特性的產生機理。此後,大量的學者從不同的角度出發提出了各種各樣的網路拓撲結構模型並進行了大量的應用實踐。
但是,目前空間句法和復雜網路在城市交通網路方面的應用都存在著缺陷,空間句法理論在研究城市交通中,並沒有考慮道路的寬度對交通的影響;復雜網路在很多應用領域中,都有非常合理的模型,而目前在道路交通網路的應用中卻缺少合理的模型。本文中將主要來解決這些問題,文章將先從空間句法理論的研究入手,通過分析37個有代表性的國內外城市的道路交通網路,將道路的寬度對城市交通的影響加入到空間句法理論中。並在此基礎上,將空間句法理論和復雜網路理論結合使用,建立復雜網路在城市交通方面的應用模型。然後將加入道路寬度的影響因子的空間句法理論和建立的交通應用模型進一步進行集成分析,得到了一些重要的結論。這些結論,對城市規劃有著重要的指導性意義,可以使城市規劃者在規劃城市時,根據城市道路的實際需要確定城市道路的寬度,這將在城市規劃中起到重要的作用。
二、 研究方法
2.1 空間句法理論擴展
空間句法理論作為一種新的描述現代城市空間模式的計算機語言,其基本思想是對空間進行尺度劃分和空間分割,並基於各種空間分割方法,空間句法導出相應的連接圖,由此計算連接值、控制值、深度值和集成度等形態分析變數[7],並將這些形態分析變數提供給研究者進行相應的分析來得到最終需要的結果。
在這些形態分析變數中,可以進行擴展計算的為集成度。集成度是指集成度描述了系統中某一空間與其他空間集聚或離散的程度。考慮到結點研究選擇范圍的大小,集成度可分為局部集成度和整體集成度兩種。整體集成度表示一個空間與其他所有空間的關系,而局部集成度則只考慮某一空間與距其幾步范圍內空間之間的相互關系。集成度值可由下面的和來表達,
和
公式(1)中是用來標准化集成度值,是一個連接圖的總結點數。為某一結點的平均深度值。深度值是指某一個結點距其它所有結點的最短距離。假設是連接圖上任何兩點和之間的最短距離,那麼總深度值是,而平均深度值為,
上面的所說的深度值為總深度值,與此相對應的還有局部深度值。局部深度值是指從某結點出發,要走步才能覆蓋整個系統,那麼在步內走過的路程即為局部深度值。
集成度是通過對城市的空間結構的分析,來預測的人流的空間分布。因此,針對空間句法在交通網路的應用中,集成度在一定程度上表現了一條道路對車流的吸引力,集成度值越大,其對車流的吸引力就越大,而對應的道路的交通壓力也就越大。但是從公式(1)中可以看出,空間句法理論在計算集成度值時,沒有考慮道路寬度的影響,這是不符合實際的情況的。經過我們的分析和驗證,我們將空間句法理論進行了改進,加入了寬度的影響因素,得出集成度新的計算公式,
公式(4)中的計算公式為,
為道路的寬度值,和在一個城市的道路交通網路中為固定的常數,為平均總深度值。
D. 大數據與復雜網路
寫這篇文章,有兩個原因:
看了李院士的《大數據研究的科學價值》,有些感觸。
我自己做了一段時間社交,也有一些想法。
之前也寫過復雜網路的東西,但是都非常膚淺,沒有真正的理解復雜網路,近期看了一些資料,有了進一步的理解。
李院士的文章,是從科學家的角度,理解大數據的價值。從文章中,我了解到以下幾點:
數據inside:未來數據將數據轉換為產品或者服務的人。
分析即服務:Aaas。構建一個統一的數據分析平台,提供豐富的api,供數據分析師進行分析,挖掘金礦。是一件很有用,同時也很有錢途的事業。
大數據的存儲、計算、挖掘分析的技術,還需要更進一步的發展。一些同學,規劃自己的職業生涯,把這個作為儲備,現在開始學習,是一個非常好的選擇。我之前做過一些存儲相關的東西,存儲還是要往多層方向發展。
在大數據中的個體之間存在著關系,有可能大數據的本質就是復雜網路的本質。為研究指名了一個方向。
第四範式:之前的研究都需要有模型,在大數據的背景之下:所有的模型都是錯誤的,進一步說,沒有模型你也可以成功。
文章中,李院士提到大數據的本質,可能就是復雜網路的本質。這是因為大數據個體之間都是關系的。舉個例子,互聯網。個體是網頁,網頁和網頁之間通過超鏈接互相鏈接,當然也可能有單向的。互聯網就是一個復雜網路。其中的關系已經被驗證了意義的重大——PageRank演算法——搜索引擎的核心之一。另一方面,大數據的產生,整體分為兩類:1)生物科學中,人腦細胞、神經元,基因等等。都是大數據。桐改2)還有就是社會群體產生的。國內現在火熱的微博。就每天會產生很大量的數據。在這兩類中,我們都要考慮個體之間的關系,都有一些參數和性質:平均路徑長度、度分布、聚集系數、核數和介數等。這些都可以歸結到復雜網路的研究當中。不過,大數據的研究剛剛開始,其本質是否就是復雜網路所能解釋的還很難說。復雜網路本身也在發展演變的過程中,幾年之後,那時的復雜網路也不是現在的樣子。但是,社交網路確確實實是復雜網路的體現。所以,通過復雜網路的理論,研究大數據,研究社交網路,一定是一個很好的方向。
說了半天的復雜網路,到底復雜網路是什麼呢?這里,我只說說我對復雜網路的淺顯理解。也歡迎大家指點、討論。我們一般所說的復雜網路具備兩個特點:
無尺度
小世界
看起來很玄的兩個詞,那麼該如何理解呢?無尺度的概念,比較好理解:就是網路中的度分布滿足冪律分布。冪律分布可以理解度的分布比較集中。我們以新浪微博為例,粉絲上千萬那的人非常少,百萬的人也非常少。更多的是幾百粉絲的。直白一點說,就是粉絲非常多的人很少,很集中。粉絲比較少的,分布就比較廣,比較多。我之前做微博數據分析的時候,有統計過幾乎所有用戶的粉絲數分布的。完全符合冪律的分布。如果大家需要,可以和我進一步討論之類。我也可以找找之前的統計數據。
小世界我覺得需要從兩個角度考慮:第一個,就是網路中兩點的平均最短路徑很小。著名的米爾格拉姆實驗的第一個結果就是:六度分隔。意思就是在我們的世界上,你想聯系任何一個人,你不認識的,平均就需要找5、6個人就可以了。隨著社會的發展,facebook等社交網路興起,這個度越來越小。有報道說,已經是4.5個人就可以了。這個事情比較有意思,前些日子,還有個開發者做了一個微博應用,計算你到某個明星的距離。很多人會想,是不是很遠,是不是計算很復雜?其實都不是的,小世界的特性告訴我們,這個值會很小。同時,即使在線讀取關注,深度搜索的暴力方式解決,這也是很快的。第二個,不僅僅平均最短路徑很小,如果消息在網路中耐鎮傳播,會以很大的概率,通過最短路徑傳播到目的地。這個很重要,這個是根本。這個是,現在微博上進行微博營銷的根本所在。如果沒有這個特性,通過轉發,甚至是大號的轉發,很難出現傳播爆發的情況,很難讓更多的人知道。所以這個很重要,這個也是米爾格拉姆試驗的第二個重要的結果。
其實上面兩個結果,都有對應的模型,能夠很好的證明,而且,在實際的社交網路中,也得到的驗證。局畝判大家感興趣,可以自己研究。
那麼大數據,我們作為程序員、作為研究者,能夠做什麼呢?其實前面也說過了,主要就三點:
存儲
計算
演算法
我們圍繞著這三塊進行,無論是工程開發者,還是研究者,都可以在這個過程中發現問題,歸納共性,提煉本質,然後上升到科學的高度。
我目前還沒有李老師的高度,我也是圍繞著微博做了一些復雜網路相關的研究。我希望,以後,我的工作,也能夠為大數據科學進步,起到一點點作用。那我的工作,就真的有價值了。
下面是我自己感興趣的一些點,歡迎大家討論:
復雜網路社團結構的發現,對應社交網路中的圈子挖掘。
社交網路中,特定領域,人物影響力的排名。
社交網路中,信息傳播的研究
社交網路用戶關系的存儲
其中,1、2、4我做了比較多的嘗試,1、2效果還不錯,4沒有好的方法。3目前只是了解階段,還沒有開始動手。
僅以此文,拋磚引玉。
【完】
E. 網路安全工程師要學些什麼
網路安全工程師需要學服務漏洞掃描、程序漏洞分析檢測、許可權管理、入侵和攻擊分析追蹤、網站滲透、病毒木馬防範、計算機語言等內容,還需要懂得網路安全產品的配置和使用。
網路安全工程師的工作職責:
主持項目網路安全產品的需求分析、項目可行性分析、技術評測、方案規劃和搭建,提供相關技術支持;
設計滿足顧客和網路安全性要求的網路安全解決方案;
通過數據分析和其他相關工具,排查解決項目實施過程中的復雜網路故障問題;
根據公司流程,規范化的進行項目實施並編寫輸出實施報告;
處理和解決客戶的疑問與困難,做好客戶的支持與服務工作;
其他專項或上級領導安排或支撐工作。
一般情況下,企業招聘網路安全工程師,要求應聘者具備網路安全通信協議、系統漏洞、惡意代碼檢測與分析、安全攻防、信息安全技術及產品等方面的理論基礎和實踐經驗,同時具有較強的溝通協作能力。
F. 復雜網路介紹(Network Analysis)
網路,清悉數學上稱為圖,最早研究始於1736年歐拉的哥尼斯堡七橋問題,但是之後關於圖的研究發展緩慢,直到1936年,才有了第一本關於圖論研究的著作。
1960年,數學家Erdos和Renyi建立了隨機圖理論,為構造網路提供了一種新的方法。在這種方法中,兩個節點之間是否有邊連接不再是確定的事情,而是根據一個概率決定,這樣生成的網路稱作隨機網路。隨機圖的思想主宰復雜網路研究長達四十年之久,然而,直到近幾年,科學家們對大量的現實網路的實際數據進行計算研究後得到的許多結果,絕大多數的實際網路並不是完全隨機的,既不是規則網路,也不是隨機網路,而是具有與前兩者皆不同的統計特徵的網路。這樣的一•些網路稱為復雜網路,對於復雜網路的研究標志著網路研究的第三階段的到來。
1998年,Watts及其導師Strogatz在Nature上的文章《Collective Dynamics of Small-world Networks》,刻畫了現實世界中的網路所具有的大的凝聚系數和短的平均路徑長度的小世界特性。隨後,1999年,Barabasi及其博士生Albert在Science上的文章《Emergence of Scaling in Random Networks》提出無尺度網路模型(度分布為冪律分布),,刻畫了實際網路中普遍存在的「富者更富」的現象,從此開啟了復雜網路研究的新紀元。
隨著研究的深入,越來越多關於復雜網路的性質被發掘出來,其中很重要的一項研究是2002年Girvan和Newman在PNAS上的一篇文章《Community structure in social and biological networks》,指出復雜網路中普遍存在著聚類特性,每一個類稱之為一個社團(community),並提出了一個發現這些社團的演算法。從此,熱門對復雜網路中的社團發現問題進行了大量研究,產生了大量的演算法。
許多復雜系統都可以建模成一種復雜網路進行分析,比如常見的電力網路、航空網路、交通網路、計算機網路以及社交網路等等。復雜網路不僅是一種數據的表現形式,它同樣也是一種科學研究的手段。
復雜網路的定義
錢學森對於復雜網路給出了一種嚴格的定義:
復雜網路具有網路平均路徑長度較小、聚類系數較大、節點度分度服從冪律分布等相同特性
言外之意,復雜網路就是指一種呈現高度復雜性的網路,其特點主要具體體現在如下幾個方面:
小世界特性(Small world theory)又被稱之為是六度空間理論或者是六度分割理論(Six degrees of separation)。小世界特性指出:社交網路中的任何一個成員和任何一個陌生人之間所間隔的人不會超過六個。
在考慮網路特徵的時候,通常使用兩個特徵來衡量網路:
對於規則網路,任意兩個點(個體)之間的特徵路徑長度長(通過多少個體聯系在一起),但聚合系數高(你是朋友的朋友的朋友的幾率襪旦高)。對於隨機網路,任意兩個點之間的特徵路徑長度短,但聚合系數低。而小世界網路,點之間特徵路徑長度小,接近隨機網路,而聚合系數依舊相當高,接近規則網路。
復雜網路的小世界特性跟網路中的信息傳播有著密切的聯系。實際的社會、生態、等網路都是小世界網路,在這樣的系統里,信息傳遞速度快,並且少量改變幾個連接,就可以劇烈地改變網路的性能,如對已存在的網路進行調整,如蜂窩電話網,改動很少答好乎幾條線路,就可以顯著提高性能。
現實世界的網路大部分都不是隨機網路,少數的節點往往擁有大量的連接,而大部分節點卻很少,節點的度數分布符合冪率分布,而這就被稱為是網路的無標度特性(Scale-free)。將度分布符合冪律分布的復雜網路稱為無標度網路。
例如,知乎中用戶的fellow數的分布情況:
無標度特性反映了復雜網路具有嚴重的異質性,其各節點之間的連接狀況(度數)具有嚴重的不均勻分布性:網路中少數稱之為Hub點的節點擁有極其多的連接,而大多數節點只有很少量的連接。少數Hub點對無標度網路的運行起著主導的作用。從廣義上說,無標度網路的無標度性是描述大量復雜系統整體上嚴重不均勻分布的一種內在性質。
其實復雜網路的無標度特性與網路的魯棒性分析具有密切的關系。無標度網路中冪律分布特性的存在極大地提高了高度數節點存在的可能性,因此,無標度網路同時顯現出針對隨機故障的魯棒性和針對蓄意攻擊的脆弱性。這種魯棒且脆弱性對網路容錯和抗攻擊能力有很大影響。
研究表明,無標度網路具有很強的容錯性,但是對基於節點度值的選擇性攻擊而言,其抗攻擊能力相當差,高度數節點的存在極大地削弱了網路的魯棒性,一個惡意攻擊者只需選擇攻擊網路很少的一部分高度數節點,就能使網路迅速癱瘓。
人以類聚,物以群分。復雜網路中的節點往往也呈現出集群特性。例如,社會網路中總是存在熟人圈或朋友圈,其中每個成員都認識其他成員。集群程度的意義是網路集團化的程度;這是一種網路的內聚傾向。連通集團概念反映的是一個大網路中各集聚的小網路分布和相互聯系的狀況。例如,它可以反映這個朋友圈與另一個朋友圈的相互關系。
下圖為網路聚集現象的一種描述:
真實網路所表現出來的小世界特性、無尺度冪律分布或高聚集度等現象促使人們從理論上構造出多樣的網路模型,以解釋這些統計特性,探索形成這些網路的演化機制。本節介紹了幾個經典網路模型的原理和構造方法,包括ER隨機網路模型、BA無尺度網路模型和小世界模型。
ErdOs-Renyi隨機網路模型(簡稱ER隨機網路模型)是匈牙利數學家Erdos和Renyi提出的一種網路模型。1959年,為了描述通信和生命科學中的網路,Erdos和Renyi提出,通過在網路節點間隨機地布置連接,就可以有效地模擬出這類系統。這種方法及相關定理的簡明扼要,導致了圖論研究的復興,數學界也因此出現了研究隨機網路的新領域。ER隨機網路模型在計算機科學、統計物理、生命科學、通信工程等領域都得到了廣泛應用。
ER隨機網路模型是個機會均等的網路模型。在該網路模型中,給定一定數目的個體(節點),它和其他任意一個個體(節點)之間有相互關系(連接)的概率相同,記為戶。因為一個節點連接k個其他節點的概率,會隨著k值的增大而呈指數遞減。這樣,如果定義是為每個個體所連接的其他個體的數目,可以知道連接概率p(k)服從鍾形的泊松(Poisson)分布,有時隨機網路也稱作指數網路。
隨機網路理論有一項重要預測:盡管連接是隨機安置的,但由此形成的網路卻是高度民主的,也就是說,絕大部分節點的連接數目會大致相同。實際上,隨機網路中連接數目比平均數高許多或低許多的節點,都十分罕見。
在過去40多年裡,科學家習慣於將所有復雜網路都看作是隨機網路。在1998年研究描繪萬維網(以網頁為節點、以超級鏈接為邊)的項目時,學者們原以為會發現一個隨機網路:人們會根據自己的興趣,來決定將網路文件鏈接到哪些網站,而個人興趣是多種多樣的,可選擇的網頁數量也極其龐大,因而最終的鏈接模式將呈現出相當隨機的結果。
然而,事實並非如此。因為在萬維網上,並非所有的節點都是平等的。在選擇將網頁鏈接到何處時,人們可以從數十億個網站中進行選擇。然而,我們中的大部分人只熟悉整個萬維網的一小部分,這一小部分中往往包含那些擁有較多鏈接的站點,因為這樣的站點更容易為人所知。只要鏈接到這些站點,就等於造就或加強了對它們的偏好。這種「擇優連接(Preferential Attachment)」的過程,也發生在其他網路中。在Internet上,那些具有較多連接的路由器通常也擁有更大的帶寬,因而新用戶就更傾向於連接到這些路由器上。在美國的生物技術產業內,某些知名公司更容易吸引到同盟者,而這又進一步加強了它在未來合作中的吸引力。類似地,在論文引用網路(論文為節點,引用關系為邊)中,被引用次數較多的科學文獻,會吸引更多的研究者去閱讀並引用它。針對這些網路的「擇優連接」的新特性,學者提出了BA無尺度網路模型。
無尺度網路的發現,使人類對於復雜網路的認識進入了一個新的天地。無尺度網路的最主要特徵是節點的度分布服從冪次定律。BA模型是無尺度網路(Scale-free Network)的第一個抽象模型。由於考慮了系統的成長性(Growth)和擇優連接性,BA模型給我們帶來了很多啟發,並且可以應用於多種實際網路。但是BA模型的兩個基本假定,對於解釋許多現實中的現象來說過於簡單,與現實的網路還有較大的距離。
有學者試圖對BA模型進行擴展,即根據現實中的網路,增添某些假定,以便進一步探索復雜網路系統的規律。對BA模型的擴充可以考慮三個因素:擇優選擇的成本、邊的重新連接、網路的初始狀態。擴充的BA模型可以更好地模擬現實世界中的網路現象。
1999年,丸Barabasi和兄Albert在對互聯網的研究中發現了無尺度網路,使人類對於復雜網路系統有了全新的認識。過去,人們習慣於將所有復雜網路看作是隨機網路,但Barabasi和Albert發現互聯網實際上是由少數高連接性的頁面組織起來的,80%以上頁面的鏈接數不到4個。只佔節點總數不到萬分之一的極少數節點,卻有1000個以上的鏈接。這種網頁的鏈接分布遵循所謂的「冪次定律」:任何一個節點擁有是條連接的概率,與1/k成正比。它不像鍾形曲線那樣具有一個集中度很高的峰值,而是一條連續遞減的曲線。如果取雙對數坐標系來描述冪次定律,得到的是一條直線。
Scale-free網路指的是節點的度分布符合冪律分布的網路,由於其缺乏一個描述問題的特徵尺度而被稱為無尺度網路。其後的幾年中,研究者們在許多不同的領域中都發現了無尺度網路。從生態系統到人際關系,從食物鏈到代謝系統,處處可以看到無尺度網路。
為什麼隨機模型與實際不相符合呢?Barabasi和Albert在深入分析了ER模型之後,發現問題在於ER模型討論的網路是一個既定規模的,不會繼續擴展的網路。正是由於現實當中的網路往往具有不斷成長的特性,早進入的節點(老節點)獲得連接的概率就更大。當網路擴張到一定規模以後,這些老節點很容易成為擁有大量連接的集散節點。這就是網路的「成長性」。
其次,ER模型中每個節點與其他節點連接時,建立連接的概率是相同的。也就是說,網路當中所有的節點都是平等的。這一情況與實際也不相符。例如,新成立的網站選擇與其他網站鏈接時,自然是在人們所熟知的網站中選擇一個進行鏈接,新的個人主頁上的超文本鏈接更有可能指向新浪、雅虎等著名的站點。由此,那些熟知的網站將獲得更多的鏈接,這種特性稱為「擇優連接」。這種現象也稱為「馬太效應(Matthew Effect)」或「富者更富(Rich Get Richer)」。
「成長性」和「擇優連接」這兩種機制解釋了網路當中集散節點的存在。
BA無尺度模型的關鍵在於,它把實際復雜網路的無尺度特性歸結為增長和優先連接這兩個非常簡單的機制。當然,這也不可避免地使得BA無尺度網路模型和真實網路相比存在一些明顯的限制。比如,一些實際網路的局域特性對網路演化結果的影響、外界對網路節點及其連接邊刪除的影響等。
一般自然的或者人造的現實網路與外界之間有節點交換,節點間連接也在不斷變化,網路自身具有一定的自組織能力,會對自身或者外界的變化作出相應的反應。因此,在BA模型基礎上,可以把模型的動力學過程進行推廣,包括對網路中已有節點或者連接的隨機刪除及其相應的連接補償機制。
對每一個時間步長,考慮如下三種假設:
復雜網路研究中一個重要的發現是絕大多數大規模真實網路的平均路徑長度比想像的小得多,稱之為「小世界現象」,或稱「六度分離(Six Degrees of Separation)」。
所謂小世界現象,是來自社會網路(Social Networks)中的基本現象,即每個人只需要很少的中間人(平均6個)就可以和全世界的人建立起聯系。在這一理論中,每個人可看作是網路的一個節點,並有大量路徑連接著他們,相連接的節點表示互相認識的人。
1998年,Watts和Strogatz引入了一個介於規則網路和完全隨機網路之間的單參數小世界網路模型,稱為WS小世界模型,該模型較好地體現了社會網路的小平均路徑長度和大聚類系數兩種現象。
WS小世界模型的構造方法如下:
在WS小世界模型中,p=0對應於規則網路,p=l則對應於完全隨機網路,通過調節聲的值就可以控制從規則網路到完全隨機圖的過渡。因此,WS小世界網路是介於規則網路和隨機網路之間的一種網路。
WS小世界模型構造演算法中的隨機化過程有可能破壞網路的連通性。因此,Newman和Watts稍後提出了NW小世界模型。NW小世界模型的構造方法如下:
NW模型只是將WS小世界模型構造中的「隨機化重連」改為「隨機化加邊」。
NW模型不同於WS模型之處在於它不切斷規則網路中的原始邊,而是以概率p重新連接一對節點。這樣構造出來的網路同時具有大的聚類數和小的平均距離。NW模型的優點在於其簡化了理論分析,因為WS模型可能存在孤立節點,但NW模型不會。當戶足夠小和N足夠大時,NW小世界模型本質上就等同於WS小世界模型。
小世界網路模型反映了實際網路所具有的一些特性,例如朋友關系網,大部分人的朋友都是和他們住在同一個地方,其地理位置不是很遠,或只在同一單位工作或學習的同事和同學。另一方面,也有些人住得較遠的,甚至是遠在異國他鄉的朋友,這種情形好比WS小世界模型中通過重新連線或在NW小世界模型中通過加入連線產生的遠程連接。
小世界網路模型的主要特徵之一是節點之間的平均距離隨遠程連接的個數而指數下降。對於規則網路,平均距離L可估計為L正比於N;而對於小世界網路模型,L正比於ln(N)/1n(K)。例如,對於一個千萬人口的城市,人與人的平均接觸距離是6左右,這使得生活人群之間的距離大大縮短。該模型由一個規則的環組成,通常是一個一維的幾乎具有周期性邊界條件的環(即環中每個節點幾乎都連接到一固定數目的鄰近節點)和少量的隨機選取節點連接成的「捷徑」 (重新連接現存的邊)。小世界網路同時具有「高網路聚集度」和「低平均路徑」的特性。
從小世界網路模型中可以看到,只要改變很少的幾個連接,就可以劇烈的改變網路的性能。這樣的性質也可以應用其他網路,尤其是對已有網路的調整方面。例如,蜂窩電話網,改動很少幾條線路(低成本、低工作量)的連接,就可以顯著提高性能。也可以應用到互聯網的主幹路由器上,以改變流量和提高傳輸速度。同樣的思路也可以應用到電子郵件的快速傳遞、特定Web站點的定位等。
如果學習復雜網路,目前認為最好的視頻教程:
【社交計算與社會網路分析】Network Analysis
1) 復雜網路中聚類演算法總結
2) Network Analysis復雜網路分析總結
3) 復雜網路和社會網路
G. 什麼是復雜網路
什麼是復雜網路?「絕大多數人認識的網路,可能只是日常上網用的萬維網,但網路的概念很大,我們實際就生活在一個極其復雜的網路中。」吳曉群解釋說,每一個人可以看作是網路中的一個節點,而人與人之間的關系,以及人與事物的關系都可以用一條線來表示,這樣就形成了一個龐雜的網路。如今,很多數學家試圖用數學的方式描述這個網路,研究它的幾何性質、形成機制、演化過程、統計規律,以便更好地服務於現實需求,而這也恰恰是吳曉群所要攻克的難題。
除了自己的科研夢想,作為博士生導師,吳曉群對學生的培養也有自己的理解。很多人認為女生學不好數學,但吳曉群卻稱,「女生學不好數學」只是自己給自己找的偷懶借口。「科研之路是循序漸進的,年輕科研人要受得了清貧,耐得住寂寞,潛下心來做自己看中的方向,終將會做出成果,一切都會變得更好。」她說。
每一件事的背後都有一些勤勤懇懇的工作者吧。