導航:首頁 > 網路問題 > 自動編碼機用什麼網路抽取特徵

自動編碼機用什麼網路抽取特徵

發布時間:2022-08-08 10:01:27

A. 學習python的話大概要學習哪些內容

想要學習Python,需要掌握的內容還是比較多的,對於自學的同學來說會有一些難度,不推薦自學能力差的人。我們將學習的過程劃分為4個階段,每個階段學習對應的內容,具體的學習順序如下:

Python學習順序:

①Python軟體開發基礎

想要系統學習,你可以考察對比一下開設有IT專業的熱門學校,好的學校擁有根據當下企業需求自主研發課程的能,南京北大青鳥、中博軟體學院、南京課工場等都是不錯的選擇,建議實地考察對比一下。

祝你學有所成,望採納。

B. 為什麼深度學習可以自動學習特徵

現在深度學習在機器學習領域是一個很熱的概念,不過經過各種媒體的轉載播報,這個概念也逐漸變得有些神話的感覺:例如,人們可能認為,深度學習是一種能夠模擬出人腦的神經結構的機器學習方式,從而能夠讓計算機具有人一樣的智慧;而這樣一種技術在將來無疑是前景無限的。那麼深度學習本質上又是一種什麼樣的技術呢?
深度學習是什麼
深度學習是機器學習領域中對模式(聲音、圖像等等)進行建模的一種方法,它也是一種基於統計的概率模型。在對各種模式進行建模之後,便可以對各種模式進行識別了,例如待建模的模式是聲音的話,那麼這種識別便可以理解為語音識別。而類比來理解,如果說將機器學習演算法類比為排序演算法,那麼深度學習演算法便是眾多排序演算法當中的一種(例如冒泡排序),這種演算法在某些應用場景中,會具有一定的優勢。
深度學習的「深度」體現在哪裡
論及深度學習中的「深度」一詞,人們從感性上可能會認為,深度學習相對於傳統的機器學習演算法,能夠做更多的事情,是一種更為「高深」的演算法。而事實可能並非我們想像的那樣,因為從演算法輸入輸出的角度考慮,深度學習演算法與傳統的有監督機器學習演算法的輸入輸出都是類似的,無論是最簡單的Logistic Regression,還是到後來的SVM、boosting等演算法,它們能夠做的事情都是類似的。正如無論使用什麼樣的排序演算法,它們的輸入和預期的輸出都是類似的,區別在於各種演算法在不同環境下的性能不同。
那麼深度學習的「深度」本質上又指的是什麼呢?深度學習的學名又叫深層神經網路(Deep Neural Networks ),是從很久以前的人工神經網路(Artificial Neural Networks)模型發展而來。這種模型一般採用計算機科學中的圖模型來直觀的表達,而深度學習的「深度」便指的是圖模型的層數以及每一層的節點數量,相對於之前的神經網路而言,有了很大程度的提升。
深度學習也有許多種不同的實現形式,根據解決問題、應用領域甚至論文作者取名創意的不同,它也有不同的名字:例如卷積神經網路(Convolutional Neural Networks)、深度置信網路(Deep Belief Networks)、受限玻爾茲曼機(Restricted Boltzmann Machines)、深度玻爾茲曼機(Deep Boltzmann Machines)、遞歸自動編碼器(Recursive Autoencoders)、深度表達(Deep Representation)等等。不過究其本質來講,都是類似的深度神經網路模型。
既然深度學習這樣一種神經網路模型在以前就出現過了,為什麼在經歷過一次沒落之後,到現在又重新進入人們的視線當中了呢?這是因為在十幾年前的硬體條件下,對高層次多節點神經網路的建模,時間復雜度(可能以年為單位)幾乎是無法接受的。在很多應用當中,實際用到的是一些深度較淺的網路,雖然這種模型在這些應用當中,取得了非常好的效果(甚至是the state of art),但由於這種時間上的不可接受性,限制了其在實際應用的推廣。而到了現在,計算機硬體的水平與之前已經不能同日而語,因此神經網路這樣一種模型便又進入了人們的視線當中。
「 2012年6月,《紐約時報》披露了Google Brain項目,吸引了公眾的廣泛關注。這個項目是由著名的斯坦福大學機器學習教授Andrew Ng和在大規模計算機系統方面的世界頂尖專家Jeff Dean共同主導,用16000個CPU Core的並行計算平台訓練一種稱為「深層神經網路」(DNN,Deep Neural Networks) 」
從Google Brain這個項目中我們可以看到,神經網路這種模型對於計算量的要求是極其巨大的,為了保證演算法實時性,需要使用大量的CPU來進行並行計算。
當然,深度學習現在備受關注的另外一個原因,當然是因為在某些場景下,這種演算法模式識別的精度,超過了絕大多數目前已有的演算法。而在最近,深度學習的提出者修改了其實現代碼的Bug之後,這種模型識別精度又有了很大的提升。這些因素共同引起了深層神經網路模型,或者說深度學習這樣一個概念的新的熱潮。
深度學習的優點
為了進行某種模式的識別,通常的做法首先是以某種方式,提取這個模式中的特徵。這個特徵的提取方式有時候是人工設計或指定的,有時候是在給定相對較多數據的前提下,由計算機自己總結出來的。深度學習提出了一種讓計算機自動學習出模式特徵的方法,並將特徵學習融入到了建立模型的過程中,從而減少了人為設計特徵造成的不完備性。而目前以深度學習為核心的某些機器學習應用,在滿足特定條件的應用場景下,已經達到了超越現有演算法的識別或分類性能。
深度學習的缺點
深度學習雖然能夠自動的學習模式的特徵,並可以達到很好的識別精度,但這種演算法工作的前提是,使用者能夠提供「相當大」量級的數據。也就是說在只能提供有限數據量的應用場景下,深度學習演算法便不能夠對數據的規律進行無偏差的估計了,因此在識別效果上可能不如一些已有的簡單演算法。另外,由於深度學習中,圖模型的復雜化導致了這個演算法的時間復雜度急劇提升,為了保證演算法的實時性,需要更高的並行編程技巧以及更好更多的硬體支持。所以,目前也只有一些經濟實力比較強大的科研機構或企業,才能夠用深度學習演算法,來做一些比較前沿而又實用的應用。

C. 從零開始如何學習人工智慧

人工智慧並不適合零基礎的朋友學習。
首先也是最重要的,是這一行有學歷門檻。建議至少應該是計算機/數學/統計學在讀或已經入行。否則,就算你學會了,就業市場也不會承認你的行業資質。從事人工智慧行業,例如成為數據科學家,至少需要碩士學位,而且博士更吃香。
其次是技術上的難度,人工智慧需要高等數學(如偏微分)、線性代數及統計學知識,以及熟練掌握python等編程語言。對於行內人這些並不困難,但對零基礎者可能會有難度。

D. 路過者請進謝謝

郵件亂碼
一般來說,亂碼郵件的原因有下面三種:
(1)由於發件人所在的國家或地區的編碼和中國大陸不一樣,比如我國台灣或香港地區一般的E-mail編碼是BIG5碼,如果在免費郵箱直接查看可能就會顯示為亂碼。

(2)發件人使用的郵件軟體工具和你使用的郵件軟體工具不一致造成的。

(3)由於發件人郵件伺服器郵件傳輸機制和免費郵箱郵件傳輸機制不一樣造成的。

一般說來對於絕大多數亂碼的郵件解決方法可以採用下面的方法:

首先用Outlook Express將亂碼的郵件收取下來,然後打開這封郵件,查一下View(查看)→Encoding(編碼),然後調整其下的編碼設置試試看,比如可以選擇Chinese Simple(簡體中文)、Chinese Traditional(繁體中文)、中文HZ或Unicode試試看。一般來說,絕大多數亂碼的郵件都可以修正過來。如果覺得這樣很麻煩,可以將GB2312設置為默認的字體,方法如下(以Outlook Express 5為例):通過「工具→選項→閱讀→字體」,在「編碼」處選好GB2312,然後選「設為默認值」。
...............................................

郵件亂碼巧破譯 來源:《新潮電子》
----
相信許多網友都遇到過亂碼郵件,一些奇奇怪怪的字元,不知道是什麼意思。產生亂碼郵件的最
主要原因在於傳輸機制不同或郵件的編碼不同,如果能夠識別這些編碼,就可以找到破解的辦法。
郵件亂碼巧破譯
一、E-mail編碼標准
>>>>由於一個漢字是用兩個擴展ASCII碼表示,對DOS、Windows及Unix系統來說,所有英文字母及符號
都是用ASCII碼來代表,ASCII碼只用到每個位元組的前7位。而一些電腦系統在通信時不使用8-bit
clean傳輸方式,無法處理8位的數據或硬把8位數據當作7位來處理,數據就會被破壞。對電子郵件來
說,有時候一個郵件在送達收信人的過程中,會經過很多台主機的轉接傳輸服務,這中間的主機假如
有一台不具備8-bit clean的傳輸條件,中文郵件可能就會被破壞。因此,不論是發送中文文本文件,
還是發送EXE可執行文件、圖形文件或壓縮文件等二進制文件,都應該先進行編碼。
E-mail編碼主要有:
1.UU編碼
>>>>在早期傳送非 ASCII碼的文件時,最常用的便是這種UU(Unix-to-Unix encoding)編碼方式。
Uuencode和Uudecode分別是Unix系統中使用的UU編碼和解碼程序,後來被改寫成為在DOS中亦可執行的
程序。
2.MIME編碼
>>>>UU編碼解決了E-mail傳送非ASCII文件的問題,但這種方式並不方便。因而又發展出一種新的編碼
標准MIME(Multipurpose Internet Mail Extentions),一般譯作「多媒體郵件傳送模式」。顧名思
義,它可以傳送多媒體文件,在一封電子郵件中附加各種格式文件一起送出。
>>>>MIME定義兩種編碼方式:Base64與QP(Quote-Printable)。QP的規則是對於資料中的7位無須重復編
碼,僅將8位的數據轉成7位。 QP編碼適用於非ASCII碼的文字內容,例如我們的中文文件。而Base64
的編碼規則,是將整個文件重新編碼成7位,通常用於傳送二進制文件。編碼的方式不同會影響編碼之
後的文件大?gt;>6�哂?nbsp;MIME功能的E-mail軟體大都能自動判別你的郵件是採用何種編碼,然後自動選
擇用QP或Base64來解碼。
>>>>MIME標准現已成為Internet電子郵件的主流。現在最常使用的電子郵件軟體Eudora、FoxMail、
Netscape Mail、Outlook Express和Internet Mail等都支持MIME編碼標准。
3.Binhex編碼
>>>>Binhex的編碼方式常用於Mac機器。一般PC上的電子郵件軟體,亦多數支持MIME的規格,很少有支
持Binhex格式的。在常用的電子郵件軟體中,只有Eudora具有這種功能,可直接解讀Binhex的編碼。
二、郵件亂碼的原因及解決方法
>>>>漢字郵件出現亂碼的原因很多,主要的原因是Internet上的某些郵件主機不支持8位(非ASCII碼
格式)傳輸,以及不同的郵件編碼,不同設置的電子郵件接收軟體,不同語種的操作系統等。
>>>>當你收到一封亂碼的郵件時,應根據郵件內容中的關鍵字元,判別其編碼方法。不同的亂碼,在
不同的平台上有不同的解決方法,因此解碼前必須先看一下文件的內容,根據特徵對文件可能的編碼
方式(Uuencode、Base64 encode、QP-encode或其它編碼方式)進行判斷。
1.Uuencode「亂碼」
>>>>Uuencode編碼主要來自Unix環境的使用者,目前使用者已經很少。這種軟體內部所用的演算法為
base64。其格式與Base64 encode格式非常相似,它們的差別僅僅在於「信頭」部分的不同。Uuencode
「亂碼」大體格式為:
begin 0600 index.gb
MH;ZQOL2_PKS#O]3"N/S0PM*[M,ZAOPJCJ,G/U,+2U,"TM<30PM3VN_*XQ+:O
……
end
>>>>在亂碼前面含有「begin xxx」,後面緊接著編碼之前原始文件的名稱。接著是已經Uuencode編碼
的郵件的內容。在亂碼內容後面,即最後一行為「end」。
>>>>如果你的電子郵件接收程序不支持UU解碼,那麼你看到的就是這些Uuencode「亂碼」。
>>>>解決Uuencode「亂碼」的辦法:
方玌uencode「亂碼」郵件轉寄到自己的郵箱中,再使用能夠支持UU解碼的電子郵件接收程序(如
Eudora、OutLook Express等)來接收該郵件。
吠ü�艏�褰?Uuencode「亂碼」存入文本文件,改文件名後綴為 UUE,然後使用Winzip 解碼。
方?Uuencode「亂碼」存入一個文件,然後在DOS下用uudecode.exe程序將文件解碼。
方?Uuencode「亂碼」存入一個文件,然後在Windows下用Wincode解碼。
Wincode除支持UU編碼外也支持MIME、Binhex等編碼格式,應用范圍頗為廣泛。
2.Base64 encode「亂碼」
>>>>Base64是MIME標准編碼之一。Base64 encode編碼方式是將3個位元組(8位)用4個位元組(6位)表
示,由於編碼後的內容是6位的,因此可以避免第8位被截掉。Base64 encode「亂碼」大體格式為:
MIME-Version:1.0
Content-Type:text/plain; charset="us-ascii〃
Content-Transfer-Encoding:base64
Status:R
yrE68shis+o/IMTcsrvE3Ljmy9/L47YEzajRtrX-Y1re6zbYnu7Chow0LDQo=3d
>>>>在Base64編碼郵件的亂碼前一般有如下幾部分「信頭」:Content-Type(內容類型)、charset(字元
集)及Content-Transfer-Encoding(內容傳輸編碼方式)。
>>>>如果你的電子郵件接收程序不支持Base64解碼,那麼你看到的就是這些Base64 encode「亂碼」。
>>>>解決Base64 encode「亂碼」的辦法:
方獴ase64 encode「亂碼」郵件存成一個文本文件,改文件名後綴為.UUE,然後使用 Winzip 解碼。
方獴ase64 encode「亂碼」郵件存成一個文件,將文件後綴改為.EML,由OutLook Express 打開,就
可以自動解碼。
3.QP-encode「亂碼」
>>>>QP-encode是MIME標准編碼之一。QP-encode編碼全名為「Quoted-Printable
Content-Transfer-Encoding」。由於用這種格式表示的信息,其內容主要都是 ASCII字元集中可以打
印的字元,因此名稱中含有 printable。QP編碼的方式,是將一個位元組用兩個16進制數值表示,然後
在前面加「=」。QP-encode「亂碼」大體格式為:
=d2=bc=b3=b8=d5=db=c4=c4=bc=d2=b5=f6=b1=e5=c9=e7=b6=f8=b0
>>>>採用QP(Quoted-Printable)編碼方式的郵件很容易進行判別,因為它的內容通常有很多等號「
=」,因此不需要看「信頭」也可以判斷是否為QP編碼。
>>>>如果你的電子郵件接收程序不支持QP解碼,那麼你看到的就是這些QP-encode「亂碼」。
>>>>解決QP-encode「亂碼」的辦法:
方妙P-encode「亂碼」郵件轉寄到自己的郵箱中,然後用支持QP解碼的電子郵件接收程序(如
Netscape mail、Eudora、OutLook Express、Becky等)來接收該郵件。
肥褂?Winzip 對 Quoted-Printable 解碼。必須注意:(1)在郵件信頭中檢查、添加這樣兩
行:Mime-Version: 1.0Content-Transfer-Encoding: quoted-printable;(2) 信頭中間不要空行,信
頭和信體之間要有一個空行。這樣形成的文件,改後綴名為UUE,即可雙擊啟動 Winzip 得到解碼。
4.HZ中文亂碼
>>>>由於網友們可能使用不同的電子郵件收發軟體,因此,來自各個網友的郵件內容可能包含著看不
懂的亂碼,例如,如果看到下面這串亂碼,你一定看不懂它的意思:
HZ- 學軟�艋�}躪艋用軟�艋�}躪艋買軟�艋�暮冒槁?
>>>>實際上這是一串「簡體中文HZ」編碼,如果使用Outlook Express發送郵件時,選用HZ編碼,而郵
件的接收者使用Eudora來閱讀郵件,看到的就是這些亂碼。正確的方法是,在撰寫郵件窗口中,選擇
「格式」菜單下的「語言」命令,並選中「簡體中文(GB2312)」項,然後發送郵件。
>>>>這時,如果你使用Outlook Express,可以打開「查看」菜單點擊「語言」選項中的「簡體中文
(GB2312)」項,或者點擊工具欄上「語言」後面的向下箭頭,選擇「簡體中文(GB2312)」功能項,屏
幕出現一個對話框,單擊「是」按鈕,所有郵件主題中含有指定字元集的郵件應用新的字元集。
>>>>如果你使用Eudora之類的軟體,可以使用「南極星」之類的軟體,自動轉換不同的漢字編碼。如
果還看不到的話,可將這些編碼文本,拷貝到一個文本編輯器中。對於上面那串編碼,你將看到下面
的內容:
「學軟體、用軟體、買軟體的好伴侶」
5.「半個漢字」亂碼
>>>>漢字的另一個問題是所謂的「半個漢字」亂碼。如果看到下面這串亂碼,你一定看不懂它的意思:
>>>>「把砑�⒂萌砑�⒙蛉砑�暮冒槁隆薄* 」
>>>>由於很多英文編輯軟體以字元為單位來處理文本,漢字被刪除一半後,剩餘的部分會和相鄰的漢
字重新組合,使得文本面目全非。因此,除了在輸入、刪除的時候注意這種問題外,還要注意不要在
英文字處理軟體中輕易使用「字元替換」功能,這往往會把一個漢字的後一個字元和相鄰漢字的前一
個字元當成一個漢字被替換掉。
>>>>對於「半個漢字」亂碼,只要將「亂碼」郵件存成一個文本文件,然後使用以字元為單位的編輯
軟體,將「亂碼」行的首字元刪除,後面的部分就會和相鄰的「亂碼」重新組合成可識別的漢字。
>>>>如果上述方法不能奏效,那麼只好告訴對方正確的發送方式,請對方重新發一份郵件給你。如果
你看到的不是上述編碼,那麼請到 [url]http://123.chn.net[/url]查看「亂碼大全」一文。
三、避免亂碼的措施
>>>>現在你已經知道亂碼產生的原因和解決辦法,希望你在發送郵件時也多為他人著想,別讓美好的
心願變成一堆亂碼。
1.選用大眾化的電子郵件收發程序
>>>>由於不同的電子郵件收發程序支持的編碼有所不同,收件人和發件人自己定製的一些選項也會各
不相同,所以在收到編碼的信件後,系統不一定能識別出郵件所用的編碼方法。識別不出編碼方法,
系統自然無法自動解碼,這樣當你查看信件內容時,就會出現所謂的亂碼,使收信人無法閱讀該文
件。選用大眾化的電子郵件收發程序則可以在一定程度上避免不同的編碼方法。
2.使用「附件」功能發送文件
>>>>一般電子郵件收發程序的「附件」功能可以自動對郵件先進行編碼,然後再發送。如果收信人的
電子郵件收發程序(如Netscape mail、Outlook Express、Eudora、Pegasus等)能夠區別郵件的編碼
方式,則可以自動將郵件解碼。
3.發送重要信息時先發測試信
>>>>發送重要信息時,為了確認是否無須編碼即可發送正文,應該先發送測試信。而且還應確定收件
人能否對附件文件進行解碼。如果發送已經編碼的郵件,則最好添加足夠的「信頭」信息,以便收件
人知道所需的解碼方法。
4.不使用電子郵件收發程序特別的編輯功能
>>>>如Outlook Express郵件編輯器是個功能很強的HTML編輯器,你可以編輯五顏六色、各種字體的電
子郵件。不過,如果接收方不是也使用Outlook Express來接收郵件,可能只看到很難看清楚的HTML源
碼。解決的方法是,在撰寫郵件時,選擇「格式」菜單下的「純文本」選項。如果要將發送格式的缺
省值設置為「純文本」,那麼,在Outlook Express主窗口中,打開「工具」菜單,選擇「選項」,出
現選項設置對話框。單擊「發送」選項卡,將郵件發送格式設置為「純文本」。

E. 人工智慧的模式識別 特徵抽取等是關鍵!

人工智慧涉及到很多的技術,大家都知道人工智慧離不開機器學習,不過比較少人知道人工智慧也是離不開模式識別的。什麼是模式識別呢?簡單點說,模式識別就是對各種情況的識別。而在人工智慧中,模式識別是一個重要的部分,有了模式識別人工智慧才能夠讓設備更加智能,下面就好好給大家介紹一下模式識別的具體內容。
1.什麼是模式識別?
模式識別是人類的一項基本智能,在日常生活中,人們經常在進行模式識別。隨著人工智慧的興起,人們當然也希望能用計算機來代替或擴展人類的部分腦力勞動。模式識別在20世紀60年代初迅速發展並成為一門新學科。模式識別是指對表徵事物或現象的各種形式的信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是信息科學和人工智慧的重要組成部分。
2.模式識別的分類
模式不光可以被分為監督的分類以及無監督的分類,模式還可分成抽象的和具體的兩種形式。比如說意識、思想、議論等,屬於概念識別研究的范疇,是人工智慧的另一研究分支。我們所指的模式識別主要是對語音波形、地震波、圖片、照片、文字、符號、生物感測器等對象的具體模式進行辨識和分類。模式識別研究主要集中在兩方面,一是研究生物體是如何感知對象的,屬於認識科學的范疇,二是在給定的任務下,如何用計算機實現模式識別的理論和方法。這兩方面都取得了突破性的進展。
3.模式識別和其他學科的聯系
模式識別與統計學、心理學、語言學、計算機科學、生物學、控制論等都有關系。模式識別和人工智慧、圖像處理的研究有交叉關系。其中自適應或自組織的模式識別系統包含了人工智慧的學習機制。並且人工智慧研究的景物理解、自然語言理解也包含模式識別問題。又如模式識別中的預處理和特徵抽取環節應用圖像處理的技術;圖像處理中的圖像分析也應用模式識別的技術。這就是模式和其他學科的聯系。
從中我們不難發現,人工智慧如果沒有了識別模式,那麼就很難從外界獲得信息,從而無法轉化成數據進行具體全面分析,因此人工智慧還是非常注重模式識別的。希望這篇文章能夠幫助大家更好地認識和了解人工智慧。

F. 除了換臉外,AI還有什麼前沿的應用

使用特徵數據,訓練一個自動編碼器。自動編碼器是一種神經網路學習工具(深度學習背後的計算系統)。

G. tensorflow中有自動編碼器網路么

自編碼器是利用神經網路提取出圖像中的高階特徵,同時可以利用高階特徵重構自己
如果向原圖中添加雜訊,則可以通過高階特徵的提取,對原始圖像進行去噪!

H. 自動編碼器的作用

自編碼器的一個典型應用是特徵降維,和PCA的作用一樣,但是比PCA的性能更強。可以想這樣一個場景:我們要訓練一個CNN模型,這個模型最終可以識別貓、狗、船等,那麼我們需要給它喂入大量的貓狗等圖像,假如這些圖像都是高清的,即數據維度很大,那麼CNN訓練的時間就會變長。這時候需要將圖片壓縮一下,我們當然可以考慮使用圖像壓縮演算法,這里只是舉一個例子,如果某些數據集不是圖片,如何壓縮呢?答案可以使用自編碼器,自編碼器可以將高維的數據特徵用一個低維的特徵來表示,自編碼器的作用是通過編碼器只學習其典型特徵(維度降低了),該特徵通過解碼器可以大致復原原來的數據即可。這樣再將這個學習到的低維特徵輸入到相應的神經網路中,可以大大減少訓練的時間。

在實際應用中,我們訓練好自動編碼器後,一般只使用其編碼器部分,從而獲得低維的數據。再將這個數據輸入到其它分類模型中進行訓練。

I. 目前美國手寫郵政編碼的識別用的誰家的演算法

轉載1 引言

手寫體數字識別是文字識別中的一個研究課題,是多年來的研究熱點,也是模式識別領域中最成功的應用之一。由於識別類型較少,在實際生活中有深遠的應用需求,一直得到廣泛的重視。近年來隨著計算機技術和數字圖像處理技術的飛速發展,數字識別在電子商務、機器自動輸入等場合已經獲得成功的實際應用。盡管人們對手寫數字的研究己從事了很長時間的研究,並己取得了很多成果,但到目前為止,機器的識別本領還無法與人的認知能力相比,這仍是一個有難度的開放問題,所以對手寫數字識別的進一步研究,尋求如何更高效更准確更節能地實現手寫數字的自動錄入和識別的解決方案對提高經濟效益、推動社會發展都有深遠的意義。

近年來, 人工神經網技術發展十分迅速, 它具有模擬人類部分形象思維的能力, 為模式識別開辟了新的途徑, 成了模擬人工智慧的一種重要方法,特別是它的信息並行分布式處理能力和自學習功能等顯著優點, 更是激起了人們對它的極大的興趣。BP(Back Propagation)網路是神經網路中一種,是1986年由Rumelhart和McCelland為首的科學家小組提出,是一種按誤差逆傳播演算法訓練的多層前饋網路,可以很好地解決非線性問題,在函數逼近、模式識別和數據壓縮等方面都有很廣泛的應用。我們在認真地研究了神經網路的基本原理和機制的基礎上, 結合手寫體數字識別這一具體課題, 提出了用BP神經網路方法來實現手寫體數字識別的方案。

2 手寫體數字識別概述

2.1 手寫數字識別簡述

模式識別是六十年代初迅速發展起來的一門學科。由於它研究的是如何用機器來實現人及某些動物對事物的學習、識別和判斷能力,因而受到了很多科技領域研究人員的注意,成為人工智慧研究的一個重要方面。

字元識別是模式識別的一個傳統研究領域。從50年代開始,許多的研究者就在這一研究領域開展了廣泛的探索,並為模式識別的發展產生了積極的影響。

手寫體數字識別是多年來的研究熱點也是字元識別中的一個特別問題。手寫體數字識別在特定的環境下,如郵政編碼自動識別系統,稅表和銀行支票自動處理系統等一般情況。當涉及到數字識別時,人們往往要求識別器有很高的識別可靠性,特別是有關金額的數字識別時,如支票中填寫的金額部分,更是如此。因此針對這類問題的處理系統設計的關鍵環節之一就是設計出高可靠性和高識別率的手寫體數字識別方法。這個領域取得了飛速的發展,部分是由於更好的學習演算法,部分是由於更優良的訓練集。美國國家科學學會(NIST)建立了

一個包含60000個經過標注的數字的資料庫,它已經成為對新的學習演算法進行比較的性能測試標准。然而可以說還沒有哪個手寫體數字識別器達到完美的識別效果。

在過去的數十年中,研究者們提出了許許多多的識別方法,按使用的特徵不同,這些方法可以分為兩類:基於結構特徵的方法和基於統計特徵的方法。統計特徵通常包括點密度的測量、矩、特徵區域等。結構特徵通常包括園、端點、交叉點、筆劃、輪廓等,一般來說,兩類特徵各有優勢。例如,使用統計特徵的分類器易於訓練,而且對於使用統計特徵的分類器,在給定的訓練集上能夠得到相對較高的識別率;而結構特徵的主要優點之一是能描述字元的結構,在識別過程中能有效地結合幾何和結構的知識,因此能夠得到可靠性較高的識別結果。本文針對手寫數字識別選用BP神經網路這種基於傳統統計學基礎上的分類方法,用於分割和識別,並取得了較好的識別效果。

2.2 手寫數字識別的一般過程

手寫體數字識別的過程如圖2-1所示,一般分為預處理、特徵提取、數字串的分割、分類器、等模塊。原始圖像是通過光電掃描儀,CCD器件或電子傳真機等獲得的二維圖像信號。預處理包括對原始圖像的去噪、傾斜校正或各種濾波處理。手寫體數字具有隨意性,其字元大小、字間距、字內距變化很大,分割難度較大。手寫數字串的分割是其中最重要的環節,是制約識別率的瓶頸所在。去噪是預處理中極重要的環節。系統面對的是從實際環境中切分出的字元圖像,可能有粘連的邊框、隨機的墨點、切分不正確引入的其他字元筆劃等使前景點增加的雜訊,還可能有斷線等使背景增加的雜訊,目前適應各種環境的通用去噪演算法還不成熟。預處理中的規格化也不僅僅是同比例的放縮,它不僅要保持拓撲不變,更要最大限度地突出所取特徵。在眾多應用環境中,特徵提取、分類器、多分類器集成是整個識別系統的核心。大體上來說特徵可以分為結構特徵和統計特徵兩類。由於分類器的選擇取決於所提取的特徵,因此相應的識別方法便有結構方法和統計方法。

總之,從手寫體數字識別原理可見,手寫體數字識別技術主要包括以下幾點:

1)圖像預處理,包括彩色圖像轉成灰度圖像、二值化,歸一化,濾除干擾雜訊等;

2)基於數字圖像的特徵選擇和提取;

3)數字串的分割;

4)模式分類識別。

其中,第二和第四部分是手寫數字識別的重點,直接關繫到識別的准確率和效率,也是本論文研究的重點所在。

結果圖2-1 識別流程

2.3 手寫數字識別的一般方法及比較

手寫數字識別在學科上屬於模式識別和人工智慧的范疇。在過去的四十年中,人們提出了很多辦法獲取手寫字元的關鍵特徵,提出了許多識別方法和識別技術。這些手段分兩大類:

全局分析和結構分析。

多年的研究實踐表明,對於完全沒有限制的手寫數字,幾乎可以肯定:沒有一種簡單的方案能達到很高的識別率和識別精度,因此,最近這方面的努力向著更為成熟、復雜、綜合的方向發展。研究工作者努力把新的知識運用到預處理,特徵提取,分類當中。近年來,人工智慧中專家系統方法、人工神經網路方法已應用於手寫數字識別。在手寫數字識別的研究中,神經網路技術和多種方法的綜合是值得重視的方向。

針對模式特徵的不同選擇及其判別決策方法的不同,可將模式識別方法大致分為5大類這5種識別方法均可實現手寫數字識別,但它們特點不同,必須根據條件進行選擇。

(1)統計模式法

這是以同類模式具有相同屬性為基礎的識別方法。用來描述事物屬性的參量叫做待征,它可以通過模式的多個樣本的測量值統計分析後按一定準則來提取。例如:在手寫數字識別系統中,我們可以把每個數字的圖形分為若干個小方塊(圖),然後統計每一小方塊中的黑像素構成一個多維特徵矢量,作為該數字的特徵。必須注意的是:在選擇特徵時,用於各類模式的特徵應該把同類模式的各個樣本聚集在一起,而使不同類模式的樣本盡量分開,以保證識別系統能具有足夠高的識別率。

(2)句法結構方法

在形式語言和自動機的基礎上產生了句法結構這一方法。其基本原理是:對每一個模式都用一個句法來表示,而對一個待識別的未知樣本,通過抽取該樣本的基元來構造該樣本的句子,然後分析此句子滿足什麼樣的句法,從而推斷出他該屬於哪個模式類。這種方法的優點是它能反映模式的結構特徵,而且對模式的結構特徵變換不敏感,因此比較適合聯機識別。但是由於抽取字元的基元比較困難,因而不是特別適合用於離線識別,同時這一方法的理論基礎還不可靠,抗干擾能力比較弱。

(3)邏輯特徵法

就是其特徵的選擇對一類模式識別問題來說是獨一無二的,即在一類問題中只有1個模式具有某1種(或某1組合的)邏輯特徵,此方法律立了關於知識表示及組織,目標搜索及匹配的完整體系;對需通過眾多規則的推理達到識別目標的問題,有很好的效果,但當樣品有缺損,背景不清晰,規則不明確甚至有歧義時,效果不好。

(4)模糊模式方法

就是在模式識別過程中引入了模糊集的概念,由於隸屬度函數作為樣品與模板相似程度的量度,故能反映整體的、主要的特性,模糊模式有相當不勻稱的抗干擾與畸變,從而允許樣品有相當程度的干擾與畸變,但准確合理的隸屬度函數往往難以建立。目前有學者在研究,並將其引入神經網路方法形成模糊神經網路識別系統。

(5)神經網路方法

就是使用人工神經網路方法實現模式識別。可處理某些環境信息十分復雜,背景知識不清楚,推理規則不明確的問題,允許樣品有較大的缺損、畸變。神經網路方法的缺點是其模型在不斷豐富完善中,目前能識別的模式類不夠多,神經網路方法允許樣品有較大的缺損和畸變,其運行速度快,自適應性能好,具有較高的解析度。

上述幾種識別方法各有特點。結構法比較直觀,能較好反映事物的結構特性:問題是基元的提取很不容易,各基元的關系也比較復雜,抗干擾性能也較差。統計法用計算機來抽取特徵,比較方便,抗干擾性能強;缺點是沒有充分利用模式的結構特性。神經網路方法由於處理的並行性,可以快速同時處理大容量的數據,工作時具有高速度和潛在超高速,並且,網路的最終輸出是由所有神經元共同作用的結果,一個神經元的錯誤對整體的影響很小,所以其容錯性也非常的好。基於以上的考慮,本文的手寫數字識別採用了神經網路的方法。

3 圖像預處理與特徵提取

手寫體圖像數據在沒有進行一定的圖像預處理和特徵提取之前,不能立即應用到程序中進行神經網路訓練和字元識別工作。從圖像處理角度來說,手寫體的字元識別對字元是不是有顏色是不關心的,而對此圖像的清晰度是很關心的。所以在圖像進行一系列的圖像處理工作是很有必要的。圖像的預處理是正確、有效提取圖像特徵的基礎,有效的圖像特徵作為網路的輸入值才能進行正確的神經網路訓練和最終得到正確、有效的網路權重。

3.1 數字圖像預處理

3.1.1 灰度化處理

彩色圖像包含了大量的顏色信息,不但在存儲上開銷很大,在處理上也會降低系統的執行速度,因此在對圖像進行識別等處理中經常將彩色圖像轉變為灰度圖像,以加快處理速度。由彩色轉換為灰度的過程稱為灰度化處理。灰度圖像就是只有強度信息而沒有顏色信息的圖像,存儲灰度圖像只需要一個數據矩陣,矩陣每個元素表示對應位置像素的灰度值。彩色圖像的像素色為RGB(R,G,B),灰度圖像的像素色為RGB(r,r,r) ,R,G,B可由彩色圖像的顏色分解獲得。而R,G,B的取值范圍是0-255,所以灰度的級別只有256級。灰度化的處理方法主要有如下三種:最大值法、平均值法和加權平均值法。本文用到的加權平均值法來處理,即更換每個像素的顏色索引(即按照灰度映射表換成灰度值)。 權重選擇參數為:

紅:0.299

綠:0.587

藍:0.114

例如某像素點顏色對應的灰度值計算公式為:

NewPixColor?(BYTE)(0299*Red?0.587*Green?0.114*Blue) 系統輸入的源圖像支持3通道或者4通道圖像,支持Format24bppRgb, format32bppRgb, Format32bppArgb和Format8bppIndex這4種像素格式。

3.1.2 二值化處理

二值圖像是指整幅圖像畫面內僅黑、白二值的圖像。在數字圖像處理中,二值圖像佔有非常重要的地位。在實際的識別系統中,進行圖像二值變換的關鍵是要確定合適的閾值,使得字元與背景能夠分割開來,二值變換的結果圖像必須要具備良好的保形性,不丟掉有用的形狀信息,不會產生額外的空缺等等。採用二值圖像進行處理,能大大地提高處理效率。 二值化的關鍵在於閾值的選取,閾值的選取方法主要有三類:全局閾值法、局部閾值法、動態閾值法。全局閥值二值化方法是根據圖像的直方圖或灰度的空間分布確定一個閥值,並根據該閥值實現灰度圖像到二值化圖像的轉化。全局閥值方法的優點在於演算法簡單,對於目標和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對輸入圖像量化雜訊或不均勻光照等情況抵抗能力差,應用受到極大限制。局部閥值法則是由像素灰度值和像素周圍點局部

灰度特性來確定像素的閥值的。Bernsen演算法是典型的局部閥值方法,非均勻光照條件等情況雖然影響整體圖像的灰度分布卻不影響局部的圖像性質,局部閥值法也存在缺點和問題,如實現速度慢、不能保證字元筆劃連通性、以及容易出現偽影現象等。動態閥值法的閥值選擇不僅取決於該像素灰度值以及它周圍像素的灰度值,而且還和該像素的坐標位置有關,由於充分考慮了每個像素鄰域的特徵,能更好的突出背景和目標的邊界,使相距很近的兩條線不會產生粘連現象。在圖像分割二值化中,自動閩值選取問題是圖像分割的關鍵所在。事實證明,閩值的選擇的恰當與否對分割的效果起著決定性的作用。

本文採用全局閾值的方法,實現將圖像二值化的功能。如果某個像素的值大於等於閾值,該像素置為白色;否則置為黑色。系統程序目前僅支持8bpp灰度圖像的轉換,閾值介於0~255之間,程序中取220。

3.1.3 去離散雜訊

原始圖像可能夾帶了雜訊,去雜訊是圖像處理中常用的手法。通常去噪用濾波的方法,比如中值濾波、均值濾波,本文中去除離散雜訊點採用中值濾波的方法。中值濾波法是一種非線性平滑技術,它將每一象素點的灰度值設置為該點某鄰域窗口內的所有象素點灰度值的中值,讓周圍的像素值接近的真實值,從而消除孤立的雜訊點。

3.1.4 字元分割

在識別時系統只能根據每個字元的特徵來進行判斷,為了最終能准確識別手寫體數字,必須將單個字元從處理後的圖像中逐個提取分離出來。具體做法是將圖像中待識別的字元逐個分離出來並返回存放各個字元的位置信息的鏈表。當把圖像分割完成後,從一定意義上來說便是形成了不同的小圖,每一張小圖就是一個數字,才能對這些小圖進行尺寸大小一致的調整。

3.1.5 細化

3.2 圖像特徵提取

特徵提取是字元識別中的一個重要組成部分,是模式識別的核心之一。經過預處理後,根據識別方法的要求抽取圖像特徵,作為識別的依據。一般而言,選擇的特徵一方面要求能夠足夠代表這個圖像模式,另一方面要求它們的數量盡可能少,這樣能有效地進行分類和較小的計算量。特徵提取的好壞會直接影響其識別的分類效果,進而影響識別率,因此特徵選擇是模式識別的關鍵。但是,目前還沒有一個有效的、一般的抽取、選擇特徵的方法。抽取、選擇特徵的方法都是面對問題的,因此針對不同的識別問題往往有不止一種的抽取、選擇特徵的方法。

閱讀全文

與自動編碼機用什麼網路抽取特徵相關的資料

熱點內容
悅盒連接無線網路 瀏覽:163
中國電信改移動網路 瀏覽:286
如果網線沒接好網路會出什麼問題 瀏覽:589
疫情期間網路異常活躍 瀏覽:843
網路打車平台投訴找哪個部門 瀏覽:680
搶單軟體顯示網路異常是咋回事 瀏覽:786
網路分析儀測量相位校準設置 瀏覽:254
mp3電腦傳歌需要網路嗎 瀏覽:28
不能拉黑的網路電話哪個好 瀏覽:264
周口下樓無線網路管理中心 瀏覽:694
網路欺詐金額多少錢才能立案 瀏覽:746
如何做一張網路虛擬電話卡 瀏覽:44
如何打開共享網路搜索 瀏覽:28
如何看待網路的普及和危害 瀏覽:536
蘋果xr玩游戲網路卡頓 瀏覽:366
邢台淘寶網路運營電話多少 瀏覽:539
手機的網路經常斷開 瀏覽:573
黑鯊手機wifi網路連接受限 瀏覽:361
怎麼查看同一網路下的其他電腦 瀏覽:71
網路核相儀公司有哪些 瀏覽:177

友情鏈接