㈠ 深度學習學什麼
深度學習主要學的有:神經網路、BP反向傳播演算法、TensorFlow深度學習工具等。
深度學習英文全稱為:deep learning,是機器學習的分支,主要是把人工神經網路當作構架,進而對數據進行表徵學習的演算法。
至今已有數種深度學習框架,如深度神經網路、卷積神經網路和深度置信網路和遞歸神經網路已被應用在計算機視覺、語音識別、自然語言處理、音頻識別與生物信息學等領域並獲取了極好的效果。另外,「深度學習」已成為類似術語,或者說是神經網路的品牌重塑。
通過多層處理,逐漸將初始的「低層」特徵表示轉化為「高層」特徵表示後,用「簡單模型」即可完成復雜的分類等學習任務。由此可將深度學習理解為進行「特徵學習」或「表示學習」。
以往在機器學慣用於現實任務時,描述樣本的特徵通常需由人類專家來設計,這成為「特徵工程」(feature engineering)。眾所周知,特徵的好壞對泛化性能有至關重要的影響,人類專家設計出好特徵也並非易事;特徵學習(表徵學習)則通過機器學習技術自身來產生好特徵,這使機器學習向「全自動數據分析」又前進了一步。
而深度學習的主要應用場景為:
語音識別
微軟研究人員通過與hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,並且在大詞彙量語音識別系統中獲得巨大成功,使得語音識別的錯誤率相對減低30%。但是,DNN還沒有有效的並行快速演算法,很多研究機構都是在利用大規模數據語料通過GPU平台提高DNN聲學模型的訓練效率。
在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,並且速度飛快。
國內方面,阿里巴巴,科大訊飛、網路、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。
自然語言處理等其他領域
很多機構在開展研究,2013年Tomas Mikolov,Kai Chen,Greg Corrado,Jeffrey Dean發表論文Efficient Estimation of Word Representations in Vector Space建立word2vector模型,與傳統的詞袋模型(bag of words)相比,word2vector能夠更好地表達語法信息。深度學習在自然語言處理等領域主要應用於機器翻譯以及語義挖掘等方面。