深度學習是一種在表達能力上靈活多變,同時又允許計算機不斷嘗試,直到最終逼近目標的一種機器學習方法。從數學本質上說,深度學習與傳統機器學習方法并沒有實質性差別,都是希望在高維空間中,根據對象特征,將不同類別的對象區分開來。但深度學習的表達能力,與傳統機器學習相比,卻有著天壤之別。
簡單地說,深度學習就是把計算機要學習的東西看成一大堆數據,把這些數據丟進一個復雜的、包含多個層級的數據處理網絡(深度神經網絡),然后檢查經過這個網絡處理得到的結果數據是不是符合要求——如果符合,就保留這個網絡作為目標模型,如果不符合,就一次次地、鍥而不舍地調整網絡的參數設置,直到輸出滿足要求為止。
由圖可以明顯看出DL在從06年崛起之前經歷了兩個低谷,這兩個低谷也將神經網絡的發展分為了三個不同的階段。
我們換一種更直觀的講法
假設深度學習要處理的數據是信息的“水流”,而處理數據的深度學習網絡是一個由管道和閥門組成的巨大的水管網絡。網絡的入口是若干管道開口,網絡的出口也是若干管道開口。這個水管網絡有許多層,每一層有許多個可以控制水流流向與流量的調節閥。根據不同任務的需要,水管網絡的層數、每層的調節閥數量可以有不同的變化組合。對復雜任務來說,調節閥的總數可以成千上萬甚至更多。水管網絡中,每一層的每個調節閥都通過水管與下一層的所有調節閥連接起來,組成一個從前到后,逐層完全連通的水流系統(這里說的是一種比較基本的情況,不同的深度學習模型,在水管的安裝和連接方式上,是有差別的)。
那么,計算機該如何使用這個龐大的水管網絡,來學習識字呢?
比如,當計算機看到一張寫有“田”字的圖片時,就簡單將組成這張圖片的所有數字(在計算機里,圖片的每個顏色點都是用“0”和“1”組成的數字來表示的)全都變成信息的水流,從入口灌進水管網絡。
我們預先在水管網絡的每個出口都插一塊字牌,對應于每一個我們想讓計算機認識的漢字。這時,因為輸入的是“田”這個漢字,等水流流過整個水管網絡,計算機就會跑到管道出口位置去看一看,是不是標記有“田”字的管道出口流出來的水流最多。如果是這樣,就說明這個管道網絡符合要求。如果不是這樣,我們就給計算機下達命令:調節水管網絡里的每一個流量調節閥,讓“田”字出口“流出”的數字水流最多。
這下,計算機可要忙一陣子了,要調節那么多閥門呢!好在計算機計算速度快,暴力計算外加算法優化(其實,主要是精妙的數學方法了,不過我們這里不講數學公式,大家只要想象計算機拼命計算的樣子就可以了),總是可以很快給出一個解決方案,調好所有閥門,讓出口處的流量符合要求。
下一步,學習“申”字時,我們就用類似的方法,把每一張寫有“申”字的圖片變成一大堆數字組成的水流,灌進水管網絡,看一看,是不是寫有“申”字的那個管道出口流出來的水最多,如果不是,我們還得再次調整所有的調節閥。這一次,要既保證剛才學過的“田”字不受影響,也要保證新的“申”字可以被正確處理。
如此反復進行,直到所有漢字對應的水流都可以按照期望的方式流過整個水管網絡。這時,我們就說,這個水管網絡已經是一個訓練好的深度學習模型了。
瑕疵品檢測
在工業生產過程中,瑕疵檢測是很多產品質量檢測環節及其重要的步驟。瑕疵檢測裝置將工業相機采集到的產品表面圖像經過圖像處理軟件進行瑕疵識別處理,找出瑕疵,同時對瑕疵進行有效的分類及后續處理。傳統的圖像處理軟件存在幾個方面問題:
一、圖像處理軟件開放參數多,需投入大量精力調試才能到達較好檢測性能。
二、圖像處理軟件底層算法通用性及功能拓展性弱,對于新產品及其客戶新需求,需要人員來重新開發。
我司案例
磁片檢測
我司研發的磁片合格檢測系統通過搭建深度神經網絡對訓練圖片中的合格及NG圖進行學習,并利用學習收斂后的模型對新的磁片圖進行分類。
磁片的合格鑒定是一個比較復雜的視覺檢測任務,這是因為磁片表面的紋理,污漬,水滴及光線導致的陰影都可能對識別產生影響。難以用有限且明確的特征描述磁片的合格與否。利用傳統匹配及輪廓提取等算法很容易導致將大量合格品鑒定為不合格,使得誤檢率極高,而假設算法放松對合格品的標準,則會導致判定的合格品中包含不合格品,引起更為致命的漏檢。
我司在傳統視覺算法的基礎上引入深度學習技術,搭建深度神經網絡對大量人工標注的圖片進行學習訓練,自動提取特征并進行不斷的迭代計算直至模型收斂。經過驗證,基于深度學習的檢測系統可以實現對磁片圖片更為精準、穩定的檢測。
下圖為合格磁片
下圖為NG磁片
注:Ans為真實值
Pr為神經網絡計算結果
輪轂凸臺檢測
我司研發的輪轂凸臺定位系統通過搭建深度神經網絡對訓練圖片中的輪轂凸臺位置進行學習,并利用學習收斂后的模型對新的輪轂圖進行定位檢測。
如下圖所示,自動化車間的生產環境很難保證圖片特征一致且良好,因此利用傳統視覺匹配算法抗干擾性較差,會出現模板匹配不上導致的凸臺識別失敗。而利用深度學習中的卷積神經網絡對大量圖片特征及標注進行自主學習和模型迭代,會使檢測系統具有更高的魯棒性和抗干擾能力。我司研發的深度學習系統能夠對特征不明顯或有損壞的凸臺進行精準定位,如第二張圖所示。
注:圖中黑色圓為神經網絡對新輪轂圖片進行凸臺定位的結果
2025-04-10 05:16
2025-04-10 05:15
2025-04-10 05:13
2025-04-10 05:11
2025-04-10 05:11
2025-04-10 05:10
2025-04-10 05:09
2025-04-10 05:08
2025-04-09 12:44
2025-04-09 12:44