1. 神經網路演算法的人工神經網路
人工神經網路(Artificial Neural Networks,ANN)系統是 20 世紀 40 年代後出現的。它是由眾多的神經元可調的連接權值連接而成,具有大規模並行處理、分布式信 息存儲、良好的自組織自學習能力等特點。BP(Back Propagation)演算法又稱為誤差 反向傳播演算法,是人工神經網路中的一種監督式的學習演算法。BP 神經網路演算法在理 論上可以逼近任意函數,基本的結構由非線性變化單元組成,具有很強的非線性映射能力。而且網路的中間層數、各層的處理單元數及網路的學習系數等參數可根據具體情況設定,靈活性很大,在優化、信號處理與模式識別、智能控制、故障診斷等許 多領域都有著廣泛的應用前景。 人工神經元的研究起源於腦神經元學說。19世紀末,在生物、生理學領域,Waldeger等人創建了神經元學說。人們認識到復雜的神經系統是由數目繁多的神經元組合而成。大腦皮層包括有100億個以上的神經元,每立方毫米約有數萬個,它們互相聯結形成神經網路,通過感覺器官和神經接受來自身體內外的各種信息,傳遞至中樞神經系統內,經過對信息的分析和綜合,再通過運動神經發出控制信息,以此來實現機體與內外環境的聯系,協調全身的各種機能活動。
神經元也和其他類型的細胞一樣,包括有細胞膜、細胞質和細胞核。但是神經細胞的形態比較特殊,具有許多突起,因此又分為細胞體、軸突和樹突三部分。細胞體內有細胞核,突起的作用是傳遞信息。樹突是作為引入輸入信號的突起,而軸突是作為輸出端的突起,它只有一個。
樹突是細胞體的延伸部分,它由細胞體發出後逐漸變細,全長各部位都可與其他神經元的軸突末梢相互聯系,形成所謂「突觸」。在突觸處兩神經元並未連通,它只是發生信息傳遞功能的結合部,聯系界面之間間隙約為(15~50)×10米。突觸可分為興奮性與抑制性兩種類型,它相應於神經元之間耦合的極性。每個神經元的突觸數目正常,最高可達10個。各神經元之間的連接強度和極性有所不同,並且都可調整、基於這一特性,人腦具有存儲信息的功能。利用大量神經元相互聯接組成人工神經網路可顯示出人的大腦的某些特徵。
人工神經網路是由大量的簡單基本元件——神經元相互聯接而成的自適應非線性動態系統。每個神經元的結構和功能比較簡單,但大量神經元組合產生的系統行為卻非常復雜。
人工神經網路反映了人腦功能的若干基本特性,但並非生物系統的逼真描述,只是某種模仿、簡化和抽象。
與數字計算機比較,人工神經網路在構成原理和功能特點等方面更加接近人腦,它不是按給定的程序一步一步地執行運算,而是能夠自身適應環境、總結規律、完成某種運算、識別或過程式控制制。
人工神經網路首先要以一定的學習准則進行學習,然後才能工作。現以人工神經網路對於寫「A」、「B」兩個字母的識別為例進行說明,規定當「A」輸入網路時,應該輸出「1」,而當輸入為「B」時,輸出為「0」。
所以網路學習的准則應該是:如果網路作出錯誤的的判決,則通過網路的學習,應使得網路減少下次犯同樣錯誤的可能性。首先,給網路的各連接權值賦予(0,1)區間內的隨機值,將「A」所對應的圖象模式輸入給網路,網路將輸入模式加權求和、與門限比較、再進行非線性運算,得到網路的輸出。在此情況下,網路輸出為「1」和「0」的概率各為50%,也就是說是完全隨機的。這時如果輸出為「1」(結果正確),則使連接權值增大,以便使網路再次遇到「A」模式輸入時,仍然能作出正確的判斷。
如果輸出為「0」(即結果錯誤),則把網路連接權值朝著減小綜合輸入加權值的方向調整,其目的在於使網路下次再遇到「A」模式輸入時,減小犯同樣錯誤的可能性。如此操作調整,當給網路輪番輸入若干個手寫字母「A」、「B」後,經過網路按以上學習方法進行若干次學習後,網路判斷的正確率將大大提高。這說明網路對這兩個模式的學習已經獲得了成功,它已將這兩個模式分布地記憶在網路的各個連接權值上。當網路再次遇到其中任何一個模式時,能夠作出迅速、准確的判斷和識別。一般說來,網路中所含的神經元個數越多,則它能記憶、識別的模式也就越多。 (1)人類大腦有很強的自適應與自組織特性,後天的學習與訓練可以開發許多各具特色的活動功能。如盲人的聽覺和觸覺非常靈敏;聾啞人善於運用手勢;訓練有素的運動員可以表現出非凡的運動技巧等等。
普通計算機的功能取決於程序中給出的知識和能力。顯然,對於智能活動要通過總結編製程序將十分困難。
人工神經網路也具有初步的自適應與自組織能力。在學習或訓練過程中改變突觸權重值,以適應周圍環境的要求。同一網路因學習方式及內容不同可具有不同的功能。人工神經網路是一個具有學習能力的系統,可以發展知識,以致超過設計者原有的知識水平。通常,它的學習訓練方式可分為兩種,一種是有監督或稱有導師的學習,這時利用給定的樣本標准進行分類或模仿;另一種是無監督學習或稱無為導師學習,這時,只規定學習方式或某些規則,則具體的學習內容隨系統所處環境 (即輸入信號情況)而異,系統可以自動發現環境特徵和規律性,具有更近似人腦的功能。
(2)泛化能力
泛化能力指對沒有訓練過的樣本,有很好的預測能力和控制能力。特別是,當存在一些有雜訊的樣本,網路具備很好的預測能力。
(3)非線性映射能力
當對系統對於設計人員來說,很透徹或者很清楚時,則一般利用數值分析,偏微分方程等數學工具建立精確的數學模型,但當對系統很復雜,或者系統未知,系統信息量很少時,建立精確的數學模型很困難時,神經網路的非線性映射能力則表現出優勢,因為它不需要對系統進行透徹的了解,但是同時能達到輸入與輸出的映射關系,這就大大簡化設計的難度。
(4)高度並行性
並行性具有一定的爭議性。承認具有並行性理由:神經網路是根據人的大腦而抽象出來的數學模型,由於人可以同時做一些事,所以從功能的模擬角度上看,神經網路也應具備很強的並行性。
多少年以來,人們從醫學、生物學、生理學、哲學、信息學、計算機科學、認知學、組織協同學等各個角度企圖認識並解答上述問題。在尋找上述問題答案的研究過程中,這些年來逐漸形成了一個新興的多學科交叉技術領域,稱之為「神經網路」。神經網路的研究涉及眾多學科領域,這些領域互相結合、相互滲透並相互推動。不同領域的科學家又從各自學科的興趣與特色出發,提出不同的問題,從不同的角度進行研究。
下面將人工神經網路與通用的計算機工作特點來對比一下:
若從速度的角度出發,人腦神經元之間傳遞信息的速度要遠低於計算機,前者為毫秒量級,而後者的頻率往往可達幾百兆赫。但是,由於人腦是一個大規模並行與串列組合處理系統,因而,在許多問題上可以作出快速判斷、決策和處理,其速度則遠高於串列結構的普通計算機。人工神經網路的基本結構模仿人腦,具有並行處理特徵,可以大大提高工作速度。
人腦存貯信息的特點為利用突觸效能的變化來調整存貯內容,也即信息存貯在神經元之間連接強度的分布上,存貯區與計算機區合為一體。雖然人腦每日有大量神經細胞死亡 (平均每小時約一千個),但不影響大腦的正常思維活動。
普通計算機是具有相互獨立的存貯器和運算器,知識存貯與數據運算互不相關,只有通過人編出的程序使之溝通,這種溝通不能超越程序編制者的預想。元器件的局部損壞及程序中的微小錯誤都可能引起嚴重的失常。 心理學家和認知科學家研究神經網路的目的在於探索人腦加工、儲存和搜索信息的機制,弄清人腦功能的機理,建立人類認知過程的微結構理論。
生物學、醫學、腦科學專家試圖通過神經網路的研究推動腦科學向定量、精確和理論化體系發展,同時也寄希望於臨床醫學的新突破;信息處理和計算機科學家研究這一問題的目的在於尋求新的途徑以解決不能解決或解決起來有極大困難的大量問題,構造更加逼近人腦功能的新一代計算機。
人工神經網路早期的研究工作應追溯至上世紀40年代。下面以時間順序,以著名的人物或某一方面突出的研究成果為線索,簡要介紹人工神經網路的發展歷史。
1943年,心理學家W·Mcculloch和數理邏輯學家W·Pitts在分析、總結神經元基本特性的基礎上首先提出神經元的數學模型。此模型沿用至今,並且直接影響著這一領域研究的進展。因而,他們兩人可稱為人工神經網路研究的先驅。
1945年馮·諾依曼領導的設計小組試製成功存儲程序式電子計算機,標志著電子計算機時代的開始。1948年,他在研究工作中比較了人腦結構與存儲程序式計算機的根本區別,提出了以簡單神經元構成的再生自動機網路結構。但是,由於指令存儲式計算機技術的發展非常迅速,迫使他放棄了神經網路研究的新途徑,繼續投身於指令存儲式計算機技術的研究,並在此領域作出了巨大貢獻。雖然,馮·諾依曼的名字是與普通計算機聯系在一起的,但他也是人工神經網路研究的先驅之一。
50年代末,F·Rosenblatt設計製作了「感知機」,它是一種多層的神經網路。這項工作首次把人工神經網路的研究從理論探討付諸工程實踐。當時,世界上許多實驗室仿效製作感知機,分別應用於文字識別、聲音識別、聲納信號識別以及學習記憶問題的研究。然而,這次人工神經網路的研究高潮未能持續很久,許多人陸續放棄了這方面的研究工作,這是因為當時數字計算機的發展處於全盛時期,許多人誤以為數字計算機可以解決人工智慧、模式識別、專家系統等方面的一切問題,使感知機的工作得不到重視;其次,當時的電子技術工藝水平比較落後,主要的元件是電子管或晶體管,利用它們製作的神經網路體積龐大,價格昂貴,要製作在規模上與真實的神經網路相似是完全不可能的;另外,在1968年一本名為《感知機》的著作中指出線性感知機功能是有限的,它不能解決如異感這樣的基本問題,而且多層網路還不能找到有效的計算方法,這些論點促使大批研究人員對於人工神經網路的前景失去信心。60年代末期,人工神經網路的研究進入了低潮。
另外,在60年代初期,Widrow提出了自適應線性元件網路,這是一種連續取值的線性加權求和閾值網路。後來,在此基礎上發展了非線性多層自適應網路。當時,這些工作雖未標出神經網路的名稱,而實際上就是一種人工神經網路模型。
隨著人們對感知機興趣的衰退,神經網路的研究沉寂了相當長的時間。80年代初期,模擬與數字混合的超大規模集成電路製作技術提高到新的水平,完全付諸實用化,此外,數字計算機的發展在若干應用領域遇到困難。這一背景預示,向人工神經網路尋求出路的時機已經成熟。美國的物理學家Hopfield於1982年和1984年在美國科學院院刊上發表了兩篇關於人工神經網路研究的論文,引起了巨大的反響。人們重新認識到神經網路的威力以及付諸應用的現實性。隨即,一大批學者和研究人員圍繞著 Hopfield提出的方法展開了進一步的工作,形成了80年代中期以來人工神經網路的研究熱潮。
1985年,Ackley、Hinton和Sejnowski將模擬退火演算法應用到神經網路訓練中,提出了Boltzmann機,該演算法具有逃離極值的優點,但是訓練時間需要很長。
1986年,Rumelhart、Hinton和Williams提出了多層前饋神經網路的學習演算法,即BP演算法。它從證明的角度推導演算法的正確性,是學習演算法有理論依據。從學習演算法角度上看,是一個很大的進步。
1988年,Broomhead和Lowe第一次提出了徑向基網路:RBF網路。
總體來說,神經網路經歷了從高潮到低谷,再到高潮的階段,充滿曲折的過程。
2. 神經網路的歷史是什麼
沃倫·麥卡洛克和沃爾特·皮茨(1943)基於數學和一種稱為閾值邏輯的演算法創造了一種神經網路的計算模型。這種模型使得神經網路的研究分裂為兩種不同研究思路。一種主要關注大腦中的生物學過程,另一種主要關注神經網路在人工智慧里的應用。
一、赫布型學習
二十世紀40年代後期,心理學家唐納德·赫布根據神經可塑性的機制創造了一種對學習的假說,現在稱作赫布型學習。赫布型學習被認為是一種典型的非監督式學習規則,它後來的變種是長期增強作用的早期模型。從1948年開始,研究人員將這種計算模型的思想應用到B型圖靈機上。
法利和韋斯利·A·克拉克(1954)首次使用計算機,當時稱作計算器,在MIT模擬了一個赫布網路。納撒尼爾·羅切斯特(1956)等人模擬了一台 IBM 704計算機上的抽象神經網路的行為。
弗蘭克·羅森布拉特創造了感知機。這是一種模式識別演算法,用簡單的加減法實現了兩層的計算機學習網路。羅森布拉特也用數學符號描述了基本感知機里沒有的迴路,例如異或迴路。這種迴路一直無法被神經網路處理,直到保羅·韋伯斯(1975)創造了反向傳播演算法。
在馬文·明斯基和西摩爾·派普特(1969)發表了一項關於機器學習的研究以後,神經網路的研究停滯不前。他們發現了神經網路的兩個關鍵問題。
第一是基本感知機無法處理異或迴路。第二個重要的問題是電腦沒有足夠的能力來處理大型神經網路所需要的很長的計算時間。直到計算機具有更強的計算能力之前,神經網路的研究進展緩慢。
二、反向傳播演算法與復興
後來出現的一個關鍵的進展是保羅·韋伯斯發明的反向傳播演算法(Werbos 1975)。這個演算法有效地解決了異或的問題,還有更普遍的訓練多層神經網路的問題。
在二十世紀80年代中期,分布式並行處理(當時稱作聯結主義)流行起來。戴維·魯姆哈特和詹姆斯·麥克里蘭德的教材對於聯結主義在計算機模擬神經活動中的應用提供了全面的論述。
神經網路傳統上被認為是大腦中的神經活動的簡化模型,雖然這個模型和大腦的生理結構之間的關聯存在爭議。人們不清楚人工神經網路能多大程度地反映大腦的功能。
支持向量機和其他更簡單的方法(例如線性分類器)在機器學習領域的流行度逐漸超過了神經網路,但是在2000年代後期出現的深度學習重新激發了人們對神經網路的興趣。
三、2006年之後的進展
人們用CMOS創造了用於生物物理模擬和神經形態計算的計算設備。最新的研究顯示了用於大型主成分分析和卷積神經網路的納米設備具有良好的前景。
如果成功的話,這會創造出一種新的神經計算設備,因為它依賴於學習而不是編程,並且它從根本上就是模擬的而不是數字化的,雖然它的第一個實例可能是數字化的CMOS設備。
在2009到2012年之間,Jürgen Schmidhuber在Swiss AI Lab IDSIA的研究小組研發的循環神經網路和深前饋神經網路贏得了8項關於模式識別和機器學習的國際比賽。
例如,Alex Graves et al.的雙向、多維的LSTM贏得了2009年ICDAR的3項關於連筆字識別的比賽,而且之前並不知道關於將要學習的3種語言的信息。
IDSIA的Dan Ciresan和同事根據這個方法編寫的基於GPU的實現贏得了多項模式識別的比賽,包括IJCNN 2011交通標志識別比賽等等。
他們的神經網路也是第一個在重要的基準測試中(例如IJCNN 2012交通標志識別和NYU的揚·勒丘恩(Yann LeCun)的MNIST手寫數字問題)能達到或超過人類水平的人工模式識別器。
類似1980年Kunihiko Fukushima發明的neocognitron和視覺標准結構(由David H. Hubel和Torsten Wiesel在初級視皮層中發現的那些簡單而又復雜的細胞啟發)那樣有深度的、高度非線性的神經結構可以被多倫多大學傑弗里·辛頓實驗室的非監督式學習方法所訓練。
2012年,神經網路出現了快速的發展,主要原因在於計算技術的提高,使得很多復雜的運算變得成本低廉。以AlexNet為標志,大量的深度網路開始出現。
2014年出現了殘差神經網路,該網路極大解放了神經網路的深度限制,出現了深度學習的概念。
構成
典型的人工神經網路具有以下三個部分:
1、結構(Architecture)結構指定了網路中的變數和它們的拓撲關系。例如,神經網路中的變數可以是神經元連接的權重(weights)和神經元的激勵值(activities of the neurons)。
2、激勵函數(Activation Rule)大部分神經網路模型具有一個短時間尺度的動力學規則,來定義神經元如何根據其他神經元的活動來改變自己的激勵值。一般激勵函數依賴於網路中的權重(即該網路的參數)。
3、學習規則(Learning Rule)學習規則指定了網路中的權重如何隨著時間推進而調整。這一般被看做是一種長時間尺度的動力學規則。一般情況下,學習規則依賴於神經元的激勵值。它也可能依賴於監督者提供的目標值和當前權重的值。
例如,用於手寫識別的一個神經網路,有一組輸入神經元。輸入神經元會被輸入圖像的數據所激發。在激勵值被加權並通過一個函數(由網路的設計者確定)後,這些神經元的激勵值被傳遞到其他神經元。
這個過程不斷重復,直到輸出神經元被激發。最後,輸出神經元的激勵值決定了識別出來的是哪個字母。
3. 人工智慧領域開始得到應用是從第幾代計算機開始
人工智慧產生於 20 世紀 50 年代,是計算機研究和應用到一定階段的產物,是社會生產發展的要求和必然結果,也是人類認識自身的重要標志。人工智慧也稱機器智能,它是計算機科學、控制論、資訊理論、神經生理學、心理學、語言學等多種學科互相滲透而發展起來的一門綜合性學科。從計算機應用系統的角度出發,人工智慧是研究如何製造出智能機器或智能系統來模擬人類智能活動的能力,以延伸人們智能的科學。
人工智慧的發展經歷了哪幾個階段
第一階段
50年代人工智慧的興起和冷落棗如。人工智慧概念首次提出後,相繼出現了一批顯著的成果,如機器定理證明、跳棋程序、通用問題、求解程序、LISTP 表處理語言等。但由於消解法推理能力的有限以及機器翻譯等的失敗,使人工智慧走入了低谷。這一階段的特點是:重視問題求解的方法,忽視知識重要性。
第二階段
60 年代末到 70 年代,專家系統出現,使人工智慧研究出現新高潮。DENDRAL化學質譜分析系統、MYCIN疾病診斷和治療系統、PROSPECTIOR探礦系統、Hearsay-Ⅱ語音處理系統等專家系統的研究和開發,將人工智慧引向了實用化。並且,1969 年成立了國際人工智慧聯合會議。
第三階段
80年代,隨著第五代計算機的研製,人工智慧得到了很大發展。日本1982年開始了」第五代計算機研製計劃」,即「知識信息處理計算機系統KIPS」,其目的是使邏輯推理達到數值運算那麼快。雖然此計劃最終失敗,但它的開展形成了一股研究人工智慧的熱潮。
第四階段
80年代末,神經網路飛速發展。1987年,美國召開第一次神經舉判網路國際會議,宣告了這一新學科的誕生。此後,各國在神經網路方面的投資逐漸增加,神經網路迅速發展起來。
第五階段
90年凳答啟代,人工智慧出現新的研究高潮。由於網路技術特別是國際互連網的技術發展,人工智慧開始由單個智能主體研究轉向基於網路環境下的分布式人工智慧研究。不僅研究基於同一目標的分布式問題求解,而且研究多個智能主體的多目標問題求解,使人工智慧更面向實用。另外,由於Hopfield多層神經網路模型的提出,使人工神經網路研究與應用出現了欣欣向榮的景象。人工智慧已深人到社會生活的各個領域。
4. 使用神經網路讓人工智慧能夠識別出動物是在哪一年實現的
神鉛正雀經網路的概念在20世紀40年代就已經出現了,但是直到20世紀80年代才有了實際應用。至於使用神經網路讓人工智慧能夠識別出動物是在哪一年實現的,這個問題不太清楚。因為人工智慧的應用范圍非常廣泛,其中有些應用可能是在很早槐早之前就已經出現了,而有些則可能是在最近幾年清如才得到廣泛應用。可以具體針對某個具體的應用場景進行研究。
5. BP神經網路的發展歷史
人工神經網路早期的研究工作應追溯至上世紀40年代。下面以時間順序,以著名的人物或某一方面突出的研究成果為線索,簡要介紹人工神經網路的發展歷史。
1943年,心理學家W·Mcculloch和數理邏輯學家W·Pitts在分析、總結神經元基本特性的基礎上首先提出神經元的數學模型。此模型沿用至今,並且直接影響著這一領域研究的進展。因而,他們兩人可稱為人工神經網路研究的先驅。
1945年馮·諾依曼領導的設計小組試製成功存儲程序式電子計算機,標志著電子計算機時代的開始。1948年,他在研究工作中比較了人腦結構與存儲程序式計算機的根本區別,提出了以簡單神經元構成的再生自動機網路結構。但是,由於指令存儲式計算機技術的發展非常迅速,迫使他放棄了神經網路研究的新途徑,繼續投身於指令存儲式計算機技術的研究,並在此領域作出了巨大貢獻。雖然,馮·諾依曼的名字是與普通計算機聯系在一起的,但他也是人工神經網路研究的先驅之一。
50年代末,F·Rosenblatt設計製作了「感知機」,它是一種多層的神經網路。這項工作首次把人工神經網路的研究從理論探討付諸工程實踐。當時,世界上許多實驗室仿效製作感知機,分別應用於文字識別、聲音識別、聲納信號識別以及純激學習記憶問題的研究。然而,這次人工神經網路的研究高潮未能持續很久,許多人陸續放棄了這方面的研究工作,這是因為當時數字計算機的發展處於全盛時期,許多人誤以為數字計算機可以解決人工智慧、模式識別、專家系統等方面的一切問題,使感知機的工作得不到重視;其次,當時的電子技術工藝水平比較落後,主要的元件是電子管或晶體管,利用它們製作的神經網路體積龐大,價格昂貴,要製作在規模上與真實的神經網路相似是完全不可能的;另外,在1968年一本名為《感知機》的著作中指出線性感知機功能是有限的,它不能解決如異或這樣的基本問題,而且多層網路還不能找到有效的計算方法,這些論點促使大批研究人員對於人工神經網路的前景失去信心。60年代末期,人工神經網路的研究進入了低潮。
另外,在60年代初期,Widrow提出了自適應線性元件網路,這是一種連續取值的線性加權求和閾值網路。後來,在此基礎上發展了非線性多層自適應網路。當時,這些工作雖未標出神經網路的名稱,而實際上就是一種人工神經網路模型。
隨著人們對感知機興趣的衰退,神經網路的研究沉寂了相當長的時間。80年代初期,模擬與數字混合的超大規模集成電路製作技術提高到新的水平,完全付諸實用化,此外,數字計算機的發展在若干應用領域遇到困難。這一背景預示,向人工神經網路尋求出路的時機已經成熟。美國的物理學家Hopfield於1982年和1984年在美國科學院院刊上發表了兩肆胡篇關於人工神做雹襪經網路研究的論文,引起了巨大的反響。人們重新認識到神經網路的威力以及付諸應用的現實性。隨即,一大批學者和研究人員圍繞著 Hopfield提出的方法展開了進一步的工作,形成了80年代中期以來人工神經網路的研究熱潮。
6. 神經網路簡述
機器學習中談論的神經網路是指「神經網路學習」,或者說,是機器學習和神經網路這兩個學科領域的交叉部分[1]。
在這里,神經網路更多的是指計算機科學家模擬人類大腦結構和智能行為,發明的一類演算法的統稱。
神經網路是眾多優秀仿生演算法中的一種,讀書時曾接觸過蟻群優化演算法,曾驚訝於其強大之處,但神經網路的強大,顯然蟻群優化還不能望其項背。
A、起源與第一次高潮。有人認為,神經網路的最早討論,源於現代計算機科學的先驅——阿蘭.圖靈在1948年的論文中描述的「B型組織機器」[2]。二十世紀50年代出現了以感知機、Adaling為代表的一系列成功,這是神經網路發展的第一個高潮[1]。
B、第一次低谷。1969年,馬文.明斯基出版《感知機》一書,書中論斷直接將神經網路打入冷宮,導致神經網路十多年的「冰河期」。值得一提的是,在這期間的1974年,哈佛大學Paul Webos發明BP演算法,但當時未受到應有的重視[1]。
C、第二次高潮。1983年,加州理工學院的物理學家John Hopfield利用神經網路,在旅行商問題上獲得當時最好結果,引起轟動;Rumelhart等人重新發明了BP演算法,BP演算法迅速走紅,掀起神經網路第二次高潮[1]。
D、第二次低谷。二十世紀90年代中期,統計學習理論和支持向量機興起,較之於這些演算法,神經網路的理論基礎不清晰等缺點更加凸顯,神經網路研究進入第二次低谷[1]。
E、深度學習的崛起。2010年前後,隨著計算能力的提升和大數據的涌現,以神經網路為基礎的「深度學習」崛起,科技巨頭公司谷歌、Facebook、網路投入巨資研發,神經網路迎來第三次高潮[1]。2016年3月9日至15日,Google人工智慧程序AlphaGo對陣韓國圍棋世界冠軍李世乭,以4:1大比分獲勝,比眾多專家預言早了十年。這次比賽,迅速在全世界經濟、科研、計算機產業各領域掀起人工智慧和深度學習的熱烈討論。
F、展望。從幾個方面討論一下。
1)、近期在Google AlphaGo掀起的熱潮中,民眾的熱情與期待最大,甚至有少許恐慌情緒;計算機產業和互聯網產業熱情也非常巨大,對未來充滿期待,各大巨頭公司對其投入大量資源;學術界的反應倒是比較冷靜的。學術界的冷靜,是因為神經網路和深度神經網路的理論基礎還沒有出現長足的進步,其缺點還沒有根本改善。這也從另一個角度說明了深度神經網路理論進步的空間很大。
2)、"當代神經網路是基於我們上世紀六十年代掌握的腦知識。"關於人類大腦的科學與知識正在爆炸式增長。[3]世界上很多學術團隊正在基於大腦機制新的認知建立新的模型[3]。我個人對此報樂觀態度,從以往的仿生演算法來看,經過億萬年進化的自然界對科技發展的促進從來沒有停止過。
3)、還說AlphaGo,它並不是理論和演算法的突破,而是基於已有演算法的工程精品。AlhphaGo的工作,為深度學習的應用提供了非常廣闊的想像空間。分布式技術提供了巨大而廉價的計算能力,巨量數據的積累提供了豐富的訓練樣本,深度學習開始騰飛,這才剛剛開始。
一直沿用至今的,是McChlloch和Pitts在1943年依據腦神經信號傳輸結構抽象出的簡單模型,所以也被稱作」M-P神經元模型「。
其中,
f函數像一般形如下圖的函數,既考慮階躍性,又考慮光滑可導性。
實際常用如下公式,因形如S,故被稱作sigmoid函數。
把很多個這樣的神經元按一定層次連接起來,就得到了神經網路。
兩層神經元組成,輸入層接收外界輸入信號,輸出層是M-P神經元(只有輸出層是)。
感知機的數學模型和單個M-P神經元的數學模型是一樣的,如因為輸入層只需接收輸入信號,不是M-P神經元。
感知機只有輸出層神經元是B-P神經元,學習能力非常有限。對於現行可分問題,可以證明學習過程一定會收斂。而對於非線性問題,感知機是無能為力的。
BP神經網路全稱叫作誤差逆傳播(Error Propagation)神經網路,一般是指基於誤差逆傳播演算法的多層前饋神經網路。這里為了不佔篇幅,BP神經網路將起篇另述。
BP演算法是迄今最為成功的神經網路學習演算法,也是最有代表性的神經網路學習演算法。BP演算法不僅用於多層前饋神經網路,還用於其他類型神經網路的訓練。
RBF網路全程徑向基函數(Radial Basis Function)網路,是一種單隱層前饋神經網路,其與BP網路最大的不同是採用徑向基函數作為隱層神經元激活函數。
卷積神經網路(Convolutional neural networks,簡稱CNNs)是一種深度學習的前饋神經網路,在大型圖片處理中取得巨大成功。卷積神經網路將起篇另述。
循環神經網路(Recurrent Neural Networks,RNNs)與傳統的FNNs不同,RNNs引入定向循環,能夠處理那些輸入之間前後關聯的問題。RNNs已經在眾多自然語言處理(Natural Language Processing, NLP)中取得了巨大成功以及廣泛應用[5]。RNNs將起篇另述。[5]
[1]、《機器學習》,周志華著
[2]、《模式識別(第二版)》,Richard O.Duda等著,李宏東等譯
[3]、《揭秘IARPA項目:解碼大腦演算法或將徹底改變機器學習》,Emily Singerz著,機器之心編譯出品
[4]、圖片來源於互聯網
[5]、 循環神經網路(RNN, Recurrent Neural Networks)介紹
7. 人工智慧學科誕生於什麼時期
人工智慧學科
學科起源
從學科起源的時間原點來看,人工智慧學科以1956年美國達特茅斯學院夏季討論班為緣起。
人工智慧學科,是一個以計算機科學為基礎,由計算機、心理學、哲學等多學科交叉融合的交叉學科、新興學科,研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,企圖了解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。
發展規劃
《新一代人工智慧發展規劃》明確,啟動實施人工智慧重大項目、推動人工智慧學科建設、布局人工智慧創新發展實驗區等一系列"中國方案",強化了人工智慧基礎理論和關鍵技術研究,促進人工智慧與經濟社會的高度融合。
學科專業
浙江大學計算機科學與技術學院作為新增的人工智慧專業的主管學院,擁有五個一級學科,其中人工智慧學科為2018年新設立。
專業學院
2019年4月22日,中國人民大學高瓴人工智慧學院成立,高瓴人工智慧學院是中國人民大學二級學院,承擔人工智慧學科的規劃與建設,未來將開展本學科和相關交叉學科領域的本、碩、博人才培養和科學研究工作。
「人工智慧」一詞最初是在1956 年Dartmouth學會上提出的。從那以後,研究者們發展了眾多理論和原理,人工智慧的概念也隨之擴展。人工智慧(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智慧是計算機科學的一個分支,它企圖了解智能的實質,並生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智慧從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,可以設想,未來人工智慧帶來的科技產品,將會是人類智慧的「容器」。
人工智慧是對人的意識、思維的信息過程的模擬。人工智慧不是人的智能,但能像人那樣思考、也可能超過人的智能。
8. 神經網路的發展趨勢如何
神經網路的雲集成模式還不是很成熟,應該有發展潛力,但神經網路有自己的硬傷,不知道能夠達到怎樣的效果,所以決策支持系統中並不是很熱門,但是神經網路無視過程的優點也是無可替代的,雲網路如果能夠對神經網路提供一個互補的輔助決策以控制誤差的話,也許就能使神經網路成熟起來
1 人工神經網路產生的背景
自古以來,關於人類智能本源的奧秘,一直吸引著無數哲學家和自然科學家的研究熱情。生物學家、神經學家經過長期不懈的努力,通過對人腦的觀察和認識,認為人腦的智能活動離不開腦的物質基礎,包括它的實體結構和其中所發生的各種生物、化學、電學作用,並因此建立了神經元網路理論和神經系統結構理論,而神經元理論又是此後神經傳導理論和大腦功能學說的基礎。在這些理論基礎之上,科學家們認為,可以從仿製人腦神經系統的結構和功能出發,研究人類智能活動和認識現象。另一方面,19世紀之前,無論是以歐氏幾何和微積分為代表的經典數學,還是以牛頓力學為代表的經典物理學,從總體上說,這些經典科學都是線性科學。然而,客觀世界是如此的紛繁復雜,非線性情況隨處可見,人腦神經系統更是如此。復雜性和非線性是連接在一起的,因此,對非線性科學的研究也是我們認識復雜系統的關鍵。為了更好地認識客觀世界,我們必須對非線性科學進行研究。人工神經網路作為一種非線性的、與大腦智能相似的網路模型,就這樣應運而生了。所以,人工神經網路的創立不是偶然的,而是20世紀初科學技術充分發展的產物。
2 人工神經網路的發展
人工神經網路的研究始於40年代初。半個世紀以來,經歷了興起、高潮與蕭條、高潮及穩步發展的遠為曲折的道路。
1943年,心理學家W.S.Mcculloch和數理邏輯學家W.Pitts 提出了M—P模型,這是第一個用數理語言描述腦的信息處理過程的模型, 雖然神經元的功能比較弱,但它為以後的研究工作提供了依據。1949年,心理學家D.O.Hebb提出突觸聯系可變的假設,根據這一假設提出的學習規律為神經網路的學習演算法奠定了基礎。 1957 年, 計算機科學家Rosenblatt提出了著名的感知機模型,它的模型包含了現代計算機的一些原理,是第一個完整的人工神經網路,第一次把神經網路研究付諸工程實現。由於可應用於模式識別,聯想記憶等方面,當時有上百家實驗室投入此項研究,美國軍方甚至認為神經網路工程應當比「原子彈工程」更重要而給予巨額資助,並在聲納信號識別等領域取得一定成績。1960年,B.Windrow和E.Hoff提出了自適應線性單元, 它可用於自適應濾波、預測和模式識別。至此,人工神經網路的研究工作進入了第一個高潮。
1969年,美國著名人工智慧學者M.Minsky和S.Papert編寫了影響很大的Perceptron一書,從理論上證明單層感知機的能力有限,諸如不能解決異或問題,而且他們推測多層網路的感知機能力也不過如此,他們的分析恰似一瓢冷水,很多學者感到前途渺茫而紛紛改行,原先參與研究的實驗室紛紛退出,在這之後近10年,神經網路研究進入了一個緩慢發展的蕭條期。這期間,芬蘭學者T.Kohonen 提出了自組織映射理論,反映了大腦神經細胞的自組織特性、記憶方式以及神經細胞興奮刺激的規律;美國學者S.A.Grossberg的自適應共振理論(ART );日本學者K.Fukushima提出了認知機模型;ShunIchimari則致力於神經網路有關數學理論的研究等,這些研究成果對以後的神經網路的發展產生了重要影響。
美國生物物理學家J.J.Hopfield於1982年、1984年在美國科學院院刊發表的兩篇文章,有力地推動了神經網路的研究,引起了研究神經網路的又一次熱潮。 1982 年, 他提出了一個新的神經網路模型——hopfield網路模型。他在這種網路模型的研究中,首次引入了網路能量函數的概念,並給出了網路穩定性的判定依據。1984年,他又提出了網路模型實現的電子電路,為神經網路的工程實現指明了方向,他的研究成果開拓了神經網路用於聯想記憶的優化計算的新途徑,並為神經計算機研究奠定了基礎。1984年Hinton等人將模擬退火演算法引入到神經網路中,提出了Boltzmann機網路模型,BM 網路演算法為神經網路優化計算提供了一個有效的方法。1986年,D.E.Rumelhart和J.LMcclelland提出了誤差反向傳播演算法,成為至今為止影響很大的一種網路學習方法。1987年美國神經計算機專家R.Hecht—Nielsen提出了對向傳播神經網路,該網路具有分類靈活,演算法簡練的優點,可用於模式分類、函數逼近、統計分析和數據壓縮等領域。1988年L.Ochua 等人提出了細胞神經網路模型,它在視覺初級加工上得到了廣泛應用。
為適應人工神經網路的發展,1987年成立了國際神經網路學會,並決定定期召開國際神經網路學術會議。1988年1月Neural Network 創刊。1990年3月IEEE Transaction on Neural Network問世。 我國於1990年12月在北京召開了首屆神經網路學術大會,並決定以後每年召開一次。1991 年在南京成立了中國神經網路學會。 IEEE 與INNS 聯合召開的IJCNN92已在北京召開。 這些為神經網路的研究和發展起了推波助瀾的作用,人工神經網路步入了穩步發展的時期。
90年代初,諾貝爾獎獲得者Edelman提出了Darwinism模型,建立了神經網路系統理論。同年,Aihara等在前人推導和實驗的基礎上,給出了一個混沌神經元模型,該模型已成為一種經典的混沌神經網路模型,該模型可用於聯想記憶。 Wunsch 在90OSA 年會上提出了一種AnnualMeeting,用光電執行ART,學習過程有自適應濾波和推理功能,具有快速和穩定的學習特點。1991年,Hertz探討了神經計算理論, 對神經網路的計算復雜性分析具有重要意義;Inoue 等提出用耦合的混沌振盪子作為某個神經元,構造混沌神經網路模型,為它的廣泛應用前景指明了道路。1992年,Holland用模擬生物進化的方式提出了遺傳演算法, 用來求解復雜優化問題。1993年方建安等採用遺傳演算法學習,研究神經網路控制器獲得了一些結果。1994年Angeline等在前人進化策略理論的基礎上,提出一種進化演算法來建立反饋神經網路,成功地應用到模式識別,自動控制等方面;廖曉昕對細胞神經網路建立了新的數學理論和方法,得到了一系列結果。HayashlY根據動物大腦中出現的振盪現象,提出了振盪神經網路。1995年Mitra把人工神經網路與模糊邏輯理論、 生物細胞學說以及概率論相結合提出了模糊神經網路,使得神經網路的研究取得了突破性進展。Jenkins等人研究光學神經網路, 建立了光學二維並行互連與電子學混合的光學神經網路,它能避免網路陷入局部最小值,並最後可達到或接近最理想的解;SoleRV等提出流體神經網路,用來研究昆蟲社會,機器人集體免疫系統,啟發人們用混沌理論分析社會大系統。1996年,ShuaiJW』等模擬人腦的自發展行為, 在討論混沌神經網路的基礎上提出了自發展神經網路。1997、1998年董聰等創立和完善了廣義遺傳演算法,解決了多層前向網路的最簡拓樸構造問題和全局最優逼近問題。
隨著理論工作的發展,神經網路的應用研究也取得了突破性進展,涉及面非常廣泛,就應用的技術領域而言有計算機視覺,語言的識別、理解與合成,優化計算,智能控制及復雜系統分析,模式識別,神經計算機研製,知識推理專家系統與人工智慧。涉及的學科有神經生理學、認識科學、數理科學、心理學、信息科學、計算機科學、微電子學、光學、動力學、生物電子學等。美國、日本等國在神經網路計算機軟硬體實現的開發方面也取得了顯著的成績,並逐步形成產品。在美國,神經計算機產業已獲得軍方的強有力支持,國防部高級研究計劃局認為「神經網路是解決機器智能的唯一希望」,僅一項8 年神經計算機計劃就投資4億美元。在歐洲共同體的ESPRIT計劃中, 就有一項特別項目:「神經網路在歐洲工業中的應用」,單是生產神經網路專用晶元這一項就投資2200萬美元。據美國資料聲稱,日本在神經網路研究上的投資大約是美國的4倍。我國也不甘落後,自從1990 年批准了南開大學的光學神經計算機等3項課題以來, 國家自然科學基金與國防預研基金也都為神經網路的研究提供資助。另外,許多國際著名公司也紛紛捲入對神經網路的研究,如Intel、IBM、Siemens、HNC。神經計算機產品開始走向商用階段,被國防、企業和科研部門選用。在舉世矚目的海灣戰爭中,美國空軍採用了神經網路來進行決策與控制。在這種刺激和需求下,人工神經網路定會取得新的突破,迎來又一個高潮。自1958年第一個神經網路誕生以來,其理論與應用成果不勝枚舉。人工神經網路是一個快速發展著的一門新興學科,新的模型、新的理論、新的應用成果正在層出不窮地涌現出來。
3 人工神經網路的發展前景
針對神經網路存在的問題和社會需求,今後發展的主要方向可分為理論研究和應用研究兩個方面。
(1)利用神經生理與認識科學研究大腦思維及智能的機理、 計算理論,帶著問題研究理論。
人工神經網路提供了一種揭示智能和了解人腦工作方式的合理途徑,但是由於人類起初對神經系統了解非常有限,對於自身腦結構及其活動機理的認識還十分膚淺,並且帶有某種「先驗」。例如, Boltzmann機引入隨機擾動來避免局部極小,有其卓越之處,然而缺乏必要的腦生理學基礎,毫無疑問,人工神經網路的完善與發展要結合神經科學的研究。而且,神經科學,心理學和認識科學等方面提出的一些重大問題,是向神經網路理論研究提出的新挑戰,這些問題的解決有助於完善和發展神經網路理論。因此利用神經生理和認識科學研究大腦思維及智能的機理,如有新的突破,將會改變智能和機器關系的認識。
利用神經科學基礎理論的研究成果,用數理方法探索智能水平更高的人工神經網路模型,深入研究網路的演算法和性能,如神經計算、進化計算、穩定性、收斂性、計算復雜性、容錯性、魯棒性等,開發新的網路數理理論。由於神經網路的非線性,因此非線性問題的研究是神經網路理論發展的一個最大動力。特別是人們發現,腦中存在著混沌現象以來,用混沌動力學啟發神經網路的研究或用神經網路產生混沌成為擺在人們面前的一個新課題,因為從生理本質角度出發是研究神經網路的根本手段。
(2)神經網路軟體模擬, 硬體實現的研究以及神經網路在各個科學技術領域應用的研究。
由於人工神經網路可以用傳統計算機模擬,也可以用集成電路晶元組成神經計算機,甚至還可以用光學的、生物晶元的方式實現,因此研製純軟體模擬,虛擬模擬和全硬體實現的電子神經網路計算機潛力巨大。如何使神經網路計算機與傳統的計算機和人工智慧技術相結合也是前沿課題;如何使神經網路計算機的功能向智能化發展,研製與人腦功能相似的智能計算機,如光學神經計算機,分子神經計算機,將具有十分誘人的前景。
4 哲理
(1)人工神經網路打開了認識論的新領域
認識與腦的問題,長期以來一直受到人們的關注,因為它不僅是有關人的心理、意識的心理學問題,也是有關人的思維活動機制的腦科學與思維科學問題,而且直接關繫到對物質與意識的哲學基本問題的回答。人工神經網路的發展使我們能夠更進一步地既唯物又辯證地理解認識與腦的關系,打開認識論的新領域。人腦是一個復雜的並行系統,它具有「認知、意識、情感」等高級腦功能,用人工進行模擬,有利於加深對思維及智能的認識,已對認知和智力的本質的研究產生了極大的推動作用。在研究大腦的整體功能和復雜性方面,人工神經網路給人們帶來了新的啟迪。由於人腦中存在混沌現象,混沌可用來理解腦中某些不規則的活動,從而混沌動力學模型能用作人對外部世界建模的工具,可用來描述人腦的信息處理過程。混沌和智能是有關的,神經網路中引入混沌學思想有助於提示人類形象思維等方面的奧秘。人工神經網路之所以再度興起,關鍵在於它反映了事物的非線性,抓住了客觀世界的本質,而且它在一定程度上正面回答了智能系統如何從環境中自主學習這一最關鍵的問題,從認知的角度講,所謂學習,就是對未知現象或規律的發現和歸納。由於神經網路具有高度的並行性,高度的非線性全局作用,良好的容錯性與聯想記憶功能以及十分強的自適應、自學習功能,而使得它成為揭示智能和了解人腦工作方式的合理途徑。但是,由於認知問題的復雜性,目前,我們對於腦神經網的運行和神經細胞的內部處理機制,如信息在人腦是如何傳輸、存貯、加工的?記憶、聯想、判斷是如何形成的?大腦是否存在一個操作系統?還沒有太多的認識,因此要製造人工神經網路來模仿人腦各方面的功能,還有待於人們對大腦信息處理機理認識的深化。
(2)人工神經網路發展的推動力來源於實踐、 理論和問題的相互作用
隨著人們社會實踐范圍的不斷擴大,社會實踐層次的不斷深入,人們所接觸到的自然現象也越來越豐富多彩、紛繁復雜,這就促使人們用不同的原因加以解釋不同種類的自然現象,當不同種類的自然現象可以用同樣的原因加以解釋,這樣就出現了不同學科的相互交叉、綜合,人工神經網路就這樣產生了。在開始階段,由於這些理論化的網路模型比較簡單,還存在許多問題,而且這些模型幾乎沒有得到實踐的檢驗,因而神經網路的發展比較緩慢。隨著理論研究的深入,問題逐漸地解決特別是工程上得到實現以後,如聲納識別成功,才迎來了神經網路的第一個發展高潮。可Minisky認為感知器不能解決異或問題, 多層感知器也不過如此,神經網路的研究進入了低谷,這主要是因為非線性問題沒得到解決。隨著理論的不斷豐富,實踐的不斷深入, 現在已證明Minisky的悲觀論調是錯誤的。今天,高度發達的科學技術逐漸揭示了非線性問題是客觀世界的本質。問題、理論、實踐的相互作用又迎來了人工神經網路的第二次高潮。目前人工神經網路的問題是智能水平不高,還有其它理論和實現方面的問題,這就迫使人們不斷地進行理論研究,不斷實踐,促使神經網路不斷向前發展。總之,先前的原因遇到了解釋不同的新現象,促使人們提出更加普遍和精確的原因來解釋。理論是基礎,實踐是動力,但單純的理論和實踐的作用還不能推動人工神經網路的發展,還必須有問題提出,才能吸引科學家進入研究的特定范圍,引導科學家從事相關研究,從而逼近科學發現,而後實踐又提出新問題,新問題又引發新的思考,促使科學家不斷思考,不斷完善理論。人工神經網路的發展無不體現著問題、理論和實踐的辯證統一關系。
(3 )人工神經網路發展的另一推動力來源於相關學科的貢獻及不同學科專家的競爭與協同
人工神經網路本身就是一門邊緣學科,它的發展有更廣闊的科學背景,亦即是眾多科研成果的綜合產物,控制論創始人Wiener在其巨著《控制論》中就進行了人腦神經元的研究;計算機科學家Turing就提出過B網路的設想;Prigogine提出非平衡系統的自組織理論,獲得諾貝爾獎;Haken研究大量元件聯合行動而產生宏觀效果, 非線性系統「混沌」態的提出及其研究等,都是研究如何通過元件間的相互作用建立復雜系統,類似於生物系統的自組織行為。腦科學與神經科學的進展迅速反映到人工神經網路的研究中,例如生物神經網路理論,視覺中發現的側抑制原理,感受野概念等,為神經網路的發展起了重要的推動作用。從已提出的上百種人工神經網路模型中,涉及學科之多,令人目不暇接,其應用領域之廣,令人嘆為觀止。不同學科專家為了在這一領域取得領先水平,存在著不同程度的競爭,所有這些有力地推動了人工神經網路的發展。人腦是一個功能十分強大、結構異常復雜的信息系統,隨著資訊理論、控制論、生命科學,計算機科學的發展,人們越來越驚異於大腦的奇妙,至少到目前為止,人類大腦信號處理機制對人類自身來說,仍是一個黑盒子,要揭示人腦的奧秘需要神經學家、心理學家、計算機科學家、微電子學家、數學家等專家的共同努力,對人類智能行為不斷深入研究,為人工神經網路發展提供豐富的理論源泉。另外,還要有哲學家的參與,通過哲學思想和自然科學多種學科的深層結合,逐步孕育出探索人類思維本質和規律的新方法,使思維科學從朦朧走向理性。而且,不同領域專家的競爭與協調同有利於問題清晰化和尋求最好的解決途徑。縱觀神經網路的發展歷史,沒有相關學科的貢獻,不同學科專家的競爭與協同,神經網路就不會有今天。當然,人工神經網路在各個學科領域應用的研究反過來又推動其它學科的發展,推動自身的完善和發展。
9. 人工智慧學科誕生於什麼時Ɯ
、人工智慧之父——圖靈(Alan Turing)提出:機器會思考嗎?**如果一台機器能夠首掘與人類對話而不被辨別出其機器的身份,那麼這台機器具有智能的特徵。**同時,圖靈還預言創造具有真正智能的機器的可能性。
AI誕生
在1956年達特茅斯學院舉行的一次會議上,正式確立了汪空人工智慧為研究學科。
2006年達特茅斯會議當事人重聚,左起:Trenchard More、John McCarthy、Marvin Minsky、Oliver Selfridge、Ray Solomonoff
第一次發展高潮(1955年—1974年)
達特茅斯會議之後是大發現的時代。對很多人來講,這一階段開發出來的程序堪稱神奇:計算機可以解決代數應用題、證明幾何定理、學習和使用英語。在眾多研究當中,搜索式推理、自然語言、微世界在當時最具影響力。
當時成就
1.人工神經網路在30-50年代被提出,1951年Marvin Minsky製造出第一台神經網路機
2.貝爾曼公式(增強學習雛形)被提出
3.感知器(深度學習雛形)被提出
4.搜索式推理被提出
5.自然語言被提出
6.首次提出人工智慧擁有模仿智能的特徵,懂得使用語言,懂得形成抽象概念並解決人類現存問題
7.Arthur Samuel在五十年代中期和六十年代初開發的國際象棋程序,棋力已經可以挑戰具有相當水平的業余愛好者
8.機器人SHAKEY項目受到了大力宣傳,它能夠對自己的行為進行「推理」;人們將其視作世界上第一台通用機器人
9.微世界的提出
存在的問題——第一次寒冬
研究學者認為具有完全智能的機器將在二十年內出現並給出了很多預言,如機器將能完成人能做到的一切工作、將製造出一台具有人類平均智能的機器。但很快就打臉了,AI遭遇到瓶頸。由於此前的過於樂觀使人們期待過高,當AI研究人員的承諾無法兌現時,公眾開始激烈批評AI研究人員,許多機構不斷減少對人工智慧研究的資助,直至停止撥款。
1.計算機運算能力遭遇瓶頸,無法解決指數型爆炸的復雜計算問題
2.常識和推理需要大量對世界的認識信息,計算機達不到「看懂」和「聽懂」的地步
3.無法解決莫拉維克悖論
4.無法解決部分涉及自動規劃的邏輯問題
5.神經網路研究學者遭遇冷落
說明:莫拉維克悖論:如果機器像數學天才一樣下象棋,那麼它能模仿嬰兒學習又有多難呢?然而,事實證明這是相當難的。
第二次發展高潮(1980年—1987年)困芹瞎
**「專家系統」**的AI程序開始為全世界的公司所採納,人工智慧研究迎來了新一輪高潮。由於專家系統僅限於一個很小的領域,從而避免了常識問題。「知識處理」隨之也成為了主流 AI 研究的焦點。
10. 人工神經網路的發展歷史
1943年,心理學家W.S.McCulloch和數理邏輯學家W.Pitts建立了神經網路和數學模型,稱為MP模型。他們通帶滾過MP模型提出了神經元的形式化數學描述和網路結構方法,證明了單個神經元能執行邏輯功能,從而開創了人工神經網路研究的時代。1949年,心理學家提出了突觸聯系強度可變的設想。60年代,人工神經網路得到了進一步發展,更完善的神經網路模型被提出,其中包括感知器和自適應線性元件等。M.Minsky等仔細分析了以感肆行虧知器為代表的神經網路系統的功能及局限後,於1969年出版了《Perceptron》一書,指出感知器不能解決高階謂詞問題。他們的論點極大地影響了神經網路的研究,加之當時串列計算機和人工智慧所取得的成就,掩蓋了發展新型計算機和人工智慧新途徑的必要性和迫切性,使人工神經網路的研究處於低潮。在此期間,一些人工神經網路的研究者仍然致力於這一研究,提出了適應諧振理論(ART網)、自組織映射、認知機網路,同時進行了神經網路數學理論的研究。以上研究為神經網路的研究和發展奠定了基礎。1982年,美國加州工學院物理學家J.J.Hopfield提出了Hopfield神經網格模型,引入了「計算能量」概念,給出了網路穩定性判斷。 1984年,他又提出了連續時間Hopfield神經網路模型,為神經計算機的研究做了開拓性的工作,開創了神經網路用於聯想記憶和優化計算的新途徑,有力地推動了神經網路的研究,1985年,又有學者提出了波耳茲曼模型,在學習中採用統計熱力學模擬退火技術,保證整個系統趨於全局穩定點。1986年進行認知微觀結構地研究,提出了並行分布處理的理論。1986年,Rumelhart, Hinton, Williams發展了BP演算法。Rumelhart和McClelland出版了《Parallel distribution processing: explorations in the microstructures of cognition》。迄今,BP演算法已被用於解決大量實際問題。1988年,Linsker對感知機網路提出了新的自組織理論,並在Shanon資訊理論的裂神基礎上形成了最大互信息理論,從而點燃了基於NN的信息應用理論的光芒。1988年,Broomhead和Lowe用徑向基函數(Radial basis function, RBF)提出分層網路的設計方法,從而將NN的設計與數值分析和線性適應濾波相掛鉤。90年代初,Vapnik等提出了支持向量機(Support vector machines, SVM)和VC(Vapnik-Chervonenkis)維數的概念。人工神經網路的研究受到了各個發達國家的重視,美國國會通過決議將1990年1月5日開始的十年定為「腦的十年」,國際研究組織號召它的成員國將「腦的十年」變為全球行為。在日本的「真實世界計算(RWC)」項目中,人工智慧的研究成了一個重要的組成部分。