導航:首頁 > 網路共享 > 驗證碼識別選用哪個神經網路

驗證碼識別選用哪個神經網路

發布時間：2022-06-21 05:38:20

1. 如何破解驗證碼的軟體如何寫，原理是什麼,要學什麼

最簡單的方法就是利用現有的BP神經網路代碼對驗證碼區圖像進行識別，matlab的比較簡單，然後用vb或c#你用的順手的開發軟體不停的打開含有驗證碼的網頁，因為網頁在一定時間內驗證碼的位置相同，即可先用vb或c#編程將驗證碼區域截圖，分割，裁剪，二值化，送入神經網路不停訓練即可。一般來說不需要太多樣本庫就可以對一個網站的驗證碼進行良好的識別了。
matlab自帶的一個5*7點陣字母識別的例子你可以參考一下。
對於圖像處理可以看一看VC++圖像處理軟體的圖片輸入輸出裁剪二值化等相關內容。很多書後的常式可以直接拿來使用。
手頭上也有一些程序，我們可以繼續探討:P

2. 如何准確快速的識別驗證碼..

這個還是蠻難的！通常都是用神經網路，SVM等，將圖片數字的識別當成是分類問題。

3. 如何利用Python做簡單的驗證碼識別

1摘要

驗證碼是目前互聯網上非常常見也是非常重要的一個事物，充當著很多系統的防火牆功能，但是隨時OCR技術的發展，驗證碼暴露出來的安全問題也越來越嚴峻。本文介紹了一套字元驗證碼識別的完整流程，對於驗證碼安全和OCR識別技術都有一定的借鑒意義。

然後經過了一年的時間，筆者又研究和get到了一種更強大的基於CNN卷積神經網路的直接端到端的驗證識別技術（文章不是我的，然後我把源碼整理了下，介紹和源碼在這裡面）：

基於python語言的tensorflow的『端到端』的字元型驗證碼識別源碼整理(github源碼分享)

2關鍵詞

關鍵詞：安全,字元圖片,驗證碼識別,OCR,Python,SVM,PIL

3免責聲明

本文研究所用素材來自於某舊Web框架的網站完全對外公開的公共圖片資源。

本文只做了該網站對外公開的公共圖片資源進行了爬取，並未越權做任何多餘操作。

本文在書寫相關報告的時候已經隱去漏洞網站的身份信息。

本文作者已經通知網站相關人員此系統漏洞，並積極向新系統轉移。

本報告的主要目的也僅是用於OCR交流學習和引起大家對驗證安全的警覺。

4引言

關於驗證碼的非技術部分的介紹，可以參考以前寫的一篇科普類的文章：

互聯網安全防火牆（1）--網路驗證碼的科普

裡面對驗證碼的種類，使用場景，作用，主要的識別技術等等進行了講解，然而並沒有涉及到任何技術內容。本章內容則作為它的技術補充來給出相應的識別的解決方案，讓讀者對驗證碼的功能及安全性問題有更深刻的認識。

5基本工具

要達到本文的目的，只需要簡單的編程知識即可，因為現在的機器學習領域的蓬勃發展，已經有很多封裝好的開源解決方案來進行機器學習。普通程序員已經不需要了解復雜的數學原理，即可以實現對這些工具的應用了。

主要開發環境：

python3.5
python SDK版本
PIL
圖片處理庫
libsvm
開源的svm機器學習庫

關於環境的安裝，不是本文的重點，故略去。

6基本流程

一般情況下，對於字元型驗證碼的識別流程如下：

准備原始圖片素材
圖片預處理
圖片字元切割
圖片尺寸歸一化
圖片字元標記
字元圖片特徵提取
生成特徵和標記對應的訓練數據集
訓練特徵標記數據生成識別模型
使用識別模型預測新的未知圖片集
達到根據「圖片」就能返回識別正確的字元集的目標

7素材准備

7.1素材選擇

由於本文是以初級的學習研究目的為主，要求「有代表性，但又不會太難」，所以就直接在網上找個比較有代表性的簡單的字元型驗證碼（感覺像在找漏洞一樣）。

最後在一個比較舊的網站（估計是幾十年前的網站框架）找到了這個驗證碼圖片。

原始圖：

def get_feature(img): """

獲取指定圖片的特徵值,

1. 按照每排的像素點,高度為10,則有10個維度,然後為6列,總共16個維度

:param img_path:

:return:一個維度為10（高度）的列表 """

width, height = img.size

pixel_cnt_list = []

height = 10 for y in range(height):

pix_cnt_x = 0 for x in range(width): if img.getpixel((x, y)) == 0: # 黑色點

pix_cnt_x += 1

pixel_cnt_list.append(pix_cnt_x) for x in range(width):

pix_cnt_y = 0 for y in range(height): if img.getpixel((x, y)) == 0: # 黑色點

pix_cnt_y += 1

pixel_cnt_list.append(pix_cnt_y) return pixel_cnt_list

然後就將圖片素材特徵化，按照libSVM指定的格式生成一組帶特徵值和標記值的向量文

4. 求驗證碼識別技術方面的高手,圖像分割,細化,去噪點,形態學分析,神經網路分類,SVM演算法,KNN演算法

樓上的列標題，所以它的關系是什麼？
如果你要查找的信息，這是最好的CNKI看到上面的文章，許多中國車牌識別。
但是，這需要購買外部網路的許可權，這所學校是非常困難的。

5. python驗證碼識別

orc文字識別，現在比較流行的是通過人工智慧訓練CNN神經網路來識別。

大體流程

准備訓練數據。訓練數據可以自己寫個程序生成驗證碼，和標准答案。
構建CNN模型。這個比較簡單，使用keras框架，5分鍾的事情。
訓練。不停地把數據feed給程序，直到准確率達到你的期望，推薦使用GPU加速
預測。載入模型，把驗證碼圖片feed給模型，得出結果

希望對你有幫助。

6. 如何快速學習神經網路演算法識別驗證碼

驗證碼都是伺服器生成的圖片，如果是動態的，就是調用servlet生成的，怎麼提取我還不太清楚，不過我想網路上應該會有很多資料。

我現在看的是識別驗證碼的東西，在截取到驗證碼圖片之後，針對這個黑白背景，只有干擾線的驗證碼。

機器學習之識別簡單驗證碼
時間 2016-10-15 22:46:31 隨風'S Blog

主題數據挖掘
關於驗證碼識別的文章網上很多圖像識別的大神教程也比較多，不過大多數專業性太強了，對非專業人士讀起來簡直是天書，不過隨著機器學習的普及，一大批機器學習的開源工具出現了，這也算對大多數像我一樣的學渣的福音，由於最近項目中牽扯到了一些機器學習相關的東西，所以自己最近也一直在學習機器相關的東西，這篇驗證碼的識別也算是練手了，本文也算是學習中的筆記，所以文章中難免有一些錯誤，歡迎各路大神指點。
由於本人不是相關專業的，對於文中相關演算法就不會具體去討論了，主要以實戰為目的。
准備工作
主要是用到了一些機器學習開源的框架以及一些輔助工具。
Scikit-Learn 比較有名的Python機器學習模塊,主要是操作簡單。
Pybrain Python機器學習模塊，主要以神經網路為核心，所有的訓練方法都以神經網路為一個實例。
pytesseract 圖像識別小工具，本文主要是用來預處理訓練樣本的。
PIL Python圖像處理庫。
問題分析
首先在進行具體工作之前，我們得看看我們需要解決的是什麼問題，那麼對於驗證碼識別來說，可以看作一個分類問題，對於數字的圖片驗證碼來說的話，其實就是0-9數字分類的問題，驗證碼識別最難的部分在於怎麼去將驗證碼進行切割成單個字元圖片，當然對於圖片裁剪也就是特徵提取有很多辦法，例如垂直投影法，等距切割法等等，其中等距切割也是比較簡單的，但是對於稍微復雜一點的驗證碼識別時准確率非常低，因為等距切割時將驗證碼按照相同的寬度進行裁剪，對於那些字元寬度大小不一的，就算裁剪出來也不能很好的表示字元的特徵，所以有時候需要先對圖片進行一系列的預處理，例如字元矯正等等，然後再用垂直投影法在x軸和y軸上按照投影的大小進行裁剪。
對於垂直投影法來說的話，最後我們還得考慮訓練集在維度上都同意，由於是非等級切割，所以每個圖片的像素肯定不一樣，所以為了維度統一還得進行填充，總之稍微麻煩一點。
這里主要是以等距切割為例子，因為在操作起來比較簡單，那麼掩碼也是選用0-9的純數字驗證碼來進行識別，驗證碼如下

這樣的圖片看起來的話間距基本上都差不多大，所以在分割時也比較容易，將圖片切成四塊後，就可以拿每一塊去進行訓練識別了。
使用機器學習來進行訓練和識別的話，我們就得考慮特徵選取了，一般驗證碼識別有一套標準的流程，圖片

對於驗證碼識別來說我們關注的不是驗證碼的顏色，而是字元代表的含義，所以在圖片處理時進行灰度化和二值化以及去噪，比如說去掉干擾線，那麼去噪也有相應的演算法來實現，這里不做具體討論，二值化其實就是將圖片呈現出兩種顏色，即非黑即白，這樣的好處是在特徵處理時可以使用0和1來代表黑色和白色，0和1代表什麼顏色取決於個人喜好。
這樣的話將二值化和其它步驟處理後的圖片進行特徵提取，將黑色像素點標記成1，白色像素點標記成0，這樣就可以得到圖片的數值表示，那麼特徵維度就等於圖片像素的大小，最終將圖片按照X軸或者Y軸表示，即將像素的所標記的值合並到一行，例如
1111100000000000010
1110000000000000000
表示成，這樣每張圖片就可以使用一行0和1的數值來表示。
進行特徵提取之後，我們得到了圖片在數學上的表示，那麼下一步就需要進行模型訓練了，由於如上文所述，圖片識別是一個分類問題，所以在機器學習中，我主要採用了兩種模型來進行訓練， SVM支持向量機和 BP神經網路來進行模型訓練，SVM使用scikit-learn機器學習包裡面的實現來做，神經網路使用Pybrain來進行實現。
有關SVM和BP神經網路的演算法部分，大家最好還是去網上搜下相關的Paper，這樣你才能知道什麼演算法能解決什麼問題，以及它大概的原理是什麼樣子的，有能力的同學可以去對推導下這兩個演算法。
實踐
在問題分析部分我們已經對驗證碼識別的大概思路有了一個了解，那麼這部分則主要正對上面所述部分進行具體實現。
首先，我們應該明白SVM和神經網路模型演算法是屬於有監督學習，即需要對樣本進行標注，也就是標記每張圖片表示的是那個數字，但是實際遇到的問題是，如果數據量小的話，我們可以進行人工標注，那麼在數據量比較大的情況下，人工標注可能就不太現實了，所以對於圖片來說的話也一樣，你進行切割完成之後你必須得標注這個數字是幾，所以我們需要對切割的圖片進行預處理，也就是打標記，我比較懶，所以我也不會一個個去打標簽，所以這里使用ocr來對切割的圖片進行預分類，ocr在單文字識別上的效果正確率還是可以的，在ocr進行預分類之後，我們只需要去糾正那些分類錯誤的圖片即可，這樣就能大大的減少工作量。
這里實現主要有以下幾個步驟：
圖片採集
圖片預處理（包括圖片切割，二值化以及圖像增強）
圖片的預分類標注以及手動糾錯標注
特徵提取
模型訓練以及預測
圖片採集
圖片採集就比較簡單，不過多的闡述，如下圖代碼所示

將下載到了圖片按照時間戳存到指定位置

圖片預處理以及圖片裁剪
對圖片進行預處理後採用等距切割法對圖片進行切割

裁剪後的圖片如下

圖片預分類
圖片預分類採用pytesseract來對分割的圖片進行預分類，減輕工作量。
具體代碼如下

ocr的分類效果正確率應該在50%以上，剩下的就是對預分類的圖片進行人工糾錯了。
ocr的分類效果圖

人工糾錯和標記後的結果

每個目錄表示一個類別標簽。
特徵提取
特徵提取的具體內容請參考問題分析中，裡面有詳細的說明。
關鍵代碼如下

最終圖片的數學上表示會以記錄在 /Users/iswin/Downloads/yzm/traindata/train_data.txt 中，數據的格式如下圖所示

紅色線框表示一張圖片數值上的表示，最後一個數字0表示該圖片的類型，我是為了方便把標簽追加到最後一行。
SVM模型分類
這里svm的實現使用了scikit-learn來實現，關於scikit-learn的使用去官網看Tutorial就好了，這里需要說一下SVM關於參數選擇的問題，我們都知道SVM支持多個核函數，例如高斯核、線性核、poly以及sgmoid核函數，但是選擇那麼核函數一開始對於不太熟悉的同學怎麼選擇的確是個問題，所以這里使用了scikit-learn的GridSearchCV來對參數進行最優化選擇，經過參數尋優，這里高斯核的最終效果還是不錯的，所以訓練的時候直接使用高斯核來進行訓練。
為了方便預測時的使用，這里對訓練結果使用了joblib模塊來進行持久化。為了簡單對評價模型進行，這里使用了5折交叉驗證來對結果進行檢驗。
最終結果的准確率在：Accuracy: 0.96 (+/- 0.09)
具體代碼如下：

舉個預測的例子，看看效果

BP神經網路模型分類
BP神經網路也稱負反饋神經網路，即按誤差逆傳播演算法訓練的多層前饋網路，是目前應用最廣泛的神經網路模型之一，在BP神經網路之後，又出現了在深度學習中應用最廣泛的CNN即卷積神經網路，這幾天也正在學習。
本文使用了三層BP神經網路來對訓練集進行訓練，即輸入層+2層隱含層+輸出層，關於BP神經網路本身這里需要注意的是激活函數的選擇以及對於多分類問題輸出層函數選擇的問題，激活函數主要有sigmod、tanh以及relu，關於怎麼選取激活函數，這塊沒有進行深入了解，一般都是每個激活函數都跑一次，看最終效果。
這里的神經網路模型分類主要是對Pybrain用法的學習以及BP神經網路的基本認識，輸入層使用了LinearLayer即線性輸入層，隱含層使用了SigmoidLayer即激活函數為sigmod的隱含層，輸出層由於是多分類問題，所以使用了SoftmaxLayer，最終在神經網路計算的結果中選取數值最大的那個索引位置就是預測的驗證碼類別，也就是0-9之間的數值。
關於Pybrain的資料除了官方文檔不是特別多，關於構建神經網路的方式提供了兩種方式，一種是 buildNetwork 函數來進行構建，另外一種就是使用 FeedForwardNetwork 函數來進行構建，這里需要注意的是如果使用 FeedForwardNetwork 來進行構建的話，注意要手動給各層加上Bias偏置項，否則結果可能可能非常差，當時我實驗時沒加，半天計算結果不對，最後看了下buildNetwork函數的源代碼才發現沒加Bias項，還有就是需要注意迭代至收斂的步數即函數中的 *maxEpochs=500 ，這個根據情況調整，Pybrain有自己的數據集格式，所以在使用時必須按照它的格式來進行數據的初始化。
這里除了輸入層的維度（即驗證碼的訓練集維度）和輸出是固定的之外，其中隱含層的神經元個數也是可以調整的，具體的感興趣的同學自己去調然後再看下結果。
對模型使用10折交叉驗證進行了簡單評估，錯誤率在Total error: 0.062左右，效果比SVM的差一點，應該通參數調優應該可以提高准確率，不過重在學習。
訓練集樣本： /Users/iswin/Downloads/yzm/traindata/train_data_uniq.txt
主要代碼如下：

舉個例子，來看看預測效果

總結
通過這個小實驗，至少讓我對機器學習和相關演算法大致有了一個了解，同時作為安全人員來說至少知道了如何使用開源的機器學習框架來構架自己的模型，筆記中難免會有錯誤之處，歡迎大家提出意見。

7. 這種驗證碼怎麼識別或者怎麼提取驗證碼識別，有沒有能給個驗證碼識別思路的

驗證碼都是伺服器生成的圖片，如果是動態的，就是調用servlet生成的，怎麼提取我還不太清楚，不過我想網路上應該會有很多資料。
我現在看的是識別驗證碼的東西，在截取到驗證碼圖片之後，針對這個黑白背景，只有干擾線的驗證碼，應該分割之後，再利用機器學習或神經網路等方法進行字元識別就好了應該。

8. android識別驗證碼圖片的原理與思路

假設已經把驗證碼圖片保存到本地了
我說一下驗證碼識別的大致步驟吧
1，讀取圖片到bitmap
2，進行灰度操作
3，進行才二值操作
4，如果有干擾點一般用濾波器或八鄰域去干擾點
5，如果有干擾線如果是簡單的直線可以用掃描法，八後法等，復雜的應該根據特點調整演算法
6，如果有干擾色塊也應該想法去除
7，如果有較大的傾斜需要進行適當校正
8，此時得到的應該是比較干凈的字元了，如果是非粘連的可以直接用投影法分割成單個字元
如果有粘連，需要根據圖形特點從演算法上做相應的處理，保證大致分割正確
9，分割成單個字元以後，如果字元比較正常變形扭曲程序不大，可以直接用模式識別
如果變形扭曲較厲害，一般建議使用神經網路進行訓練後再識別

如果是比較簡單的驗證碼可以使用網上的一些組件，我常用的一個是OcrKingApi

不是太復雜的識別效果還可以，關鍵是免費的。使用文檔可以看一下文庫的鏈接

http://wenku..com/view/b5b6721555270722192ef7b3.html

9. 如何分類驗證碼

驗證碼是一種主要用於區分人類和計算機，達到阻止自動腳本反復提交垃圾數據的目的的技術。
驗證碼主要可以歸類為如下三種：
圖片驗證碼
語音驗證碼
智力測試答題驗證碼
圖片驗證碼，網站方面隨機生成一張圖片，上面寫著數字、字母或者漢字的組合，然後要求用戶輸入圖片上的內容，並隨表單一起提交。
攻破圖片驗證碼的主要手段是OCR技術，在20年前，OCR技術尚是一大難題，但是現在已經有了成熟的解決方案，OCR技術主要是基於神經網路人工智慧的相關研究成果實現。為了對付OCR技術，圖片驗證碼有所升級，出現了雜點背景、扭曲文字等干擾機器識別的手段。對抗雜點背景的主要方法是通過顏色過濾雜點，還有就是縮OCR目標范圍，比如限制在26個英文字母而不對特殊符號加以識別等；對付扭曲文字干擾的方法主要是對文字紋路矢量化，然後計算他們的基線並還原文字扭曲
語音驗證碼 ,常常作為圖片驗證碼的補充，提供給有視覺障礙的人士使用。攻擊的方法和圖片驗證碼類似，音識別技術是對付它的法寶。當然不少語音驗證碼也使用了背景噪音等干擾，如何對付這種干擾又是另一個課題了。
智力測試驗證碼, 是驗證碼的另一種設計思路，這種驗證碼比較有趣，也比較難攻擊。它的工作原理是由伺服器隨機抽取一個簡單的常識性智力題給最終用戶，然後讓最終用戶作答。比如在四張圖片有三張風景，一張建築物，然後讓用戶選出建築物；再比如要求用戶計算5+25等於多少，填寫答案；還有的讓用戶回答電視機、電冰箱、電吹風、電影票哪個不是家用電器。
智力測試驗證碼方式繁多，五花八門，出題的方式可以文字亦可以圖片。想攻破這種驗證碼具有相當難度，需要計算機具備高級智慧還要兼用圖像識別技術。不過至少針對文字測試題目可以利用自然語言分析技術和搜索引擎的幫助加以攻擊。將驗證碼的提問用自然語言分詞，找出主謂賓定狀補，並構造出關鍵詞用Google搜索，再把結果計算權重投票，可以得到一個「最可能正確的答案」。
隨著網路的普及，網民的不斷增加,驗證碼識別需求也凸顯出來,面對越來越復雜的驗證碼,遠程人工付費識別驗證碼也大量出現, 這種方式可以說是曲線解決了所有驗證碼識別問題!

10. 機器自動識別驗證碼的原理是怎麼樣的

1.分難度等級的 2.一般人覺得好認的就好識別， 3.粘連的一塌糊塗，噪點很多，干擾多的就不好識別回答裡面有問動態圖的，動態圖也是一幀一幀的圖片連起來的，重新拆成一張一張的就好識別了。。。而且這種驗證碼信息會更多一些，反而好識別些然後來講一下識別過程吧，其實跟人眼的識別時差不多，想把每一個字元分割出來，一個一個認。首先是分割，字元粘連的厲害的，或者噪點太多都會造成分割不成功，比較簡單的辦法是二值化之後尋找連通域（就是沒有分開的部件，單個字母和數字都是，但是左右結構的中文字就有兩個連通域），前提是每個字元都是一個連通域，這個辦法對中文字不合適，字元比較均勻還可以找垂直投影的間隔。然後是字元的校正，包括各種旋轉，仿射變換，這兒的演算法又海了去了，titl之類的牛逼演算法，有驗證碼扭曲的太厲害的估計這兒也校正不回來了。然後是字元的二值化，簡單理解就是整成字是白的底是黑的，二值化的演算法也很多，樓上有採用定閾值的，也有自適應的演算法。以上每一步裡面都得穿插一些去噪去干擾的步驟。最後對每個字元進行識別，這兒又有很多演算法了，svm算是近年來比較熱門的分類器，還有神經網路，或者最簡單的模板匹配。訓練分類器又要涉及到訓練樣本的選擇，牛逼的話還能加入在線學習的演算法，可以選擇的策略又多了去了。最後想說的是，驗證碼的識別演算法如果具有普適性的話，搞出這演算法的娃估計能發好多篇牛逼的paper賺好多好多錢了，這本來就是公認的人工智慧中很難的事情，現在搶票軟體因為只需要識別一個網站的驗證碼，所以相對正確率會高一點，一個網站的驗證碼一般都是一個類型的，相對來說會容易識別一些。不過現在有些驗證碼是為了做廣告和識別一些掃描書籍的內容（就是機器識別不了的），內容多樣性多了去了。

閱讀全文

與驗證碼識別選用哪個神經網路相關的資料

熱點內容

流量公用網路和家庭網路選哪個發布：2025-07-16 03:30:56 瀏覽：55

網路中交換機與分離器有什麼不同發布：2025-07-16 03:25:30 瀏覽：33

電信蘋果5怎麼用4g網路發布：2025-07-16 03:15:47 瀏覽：574

怎樣把網路設置為nat模式發布：2025-07-16 03:11:16 瀏覽：979

網路機頂盒的攝像頭在哪裡發布：2025-07-16 03:08:12 瀏覽：205

網路新媒體看哪個品牌發布：2025-07-16 02:34:25 瀏覽：778

呂梁網路技術哪個好發布：2025-07-16 02:33:48 瀏覽：422

武漢服裝網路營銷發布：2025-07-16 02:33:41 瀏覽：904

打開網路與共享沒反應發布：2025-07-16 02:15:08 瀏覽：646

電視連上無線wifi但是沒網路發布：2025-07-16 02:06:08 瀏覽：875

閃擊怎麼用藍牙共享網路給手機發布：2025-07-16 01:54:13 瀏覽：699

連接共享網路花錢嗎發布：2025-07-16 01:42:08 瀏覽：967

win10設置網路位置WiFi 發布：2025-07-16 01:24:20 瀏覽：431

網路語章程什麼意思發布：2025-07-16 01:13:51 瀏覽：457

外來人如何阻止無線網路發布：2025-07-16 01:13:03 瀏覽：687

華為盒子網路信號增強發布：2025-07-16 01:08:44 瀏覽：43

電視網路電視怎麼改密碼發布：2025-07-16 01:04:22 瀏覽：208

第一屆全國網路安全學院發布：2025-07-16 00:58:22 瀏覽：631

恢復網路信號什麼意思發布：2025-07-16 00:45:20 瀏覽：598

移動網路通訊箱安裝生產發布：2025-07-16 00:45:05 瀏覽：68

導航:首頁 > 網路共享 > 驗證碼識別選用哪個神經網路

驗證碼識別選用哪個神經網路

與驗證碼識別選用哪個神經網路相關的資料

友情鏈接