什么是卷積神經(jīng)網(wǎng)絡(luò)(CNN)?定義、工作原理和主要應(yīng)用 – AI百科知識(shí)
什么是卷積神經(jīng)網(wǎng)絡(luò)?
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一類主要用于計(jì)算機(jī)視覺領(lǐng)域的深度學(xué)習(xí)算法,它們?cè)诟鱾€(gè)領(lǐng)域都有應(yīng)用,包括圖像和視頻識(shí)別、自然語言處理,甚至是玩游戲。CNN已經(jīng)徹底改變了計(jì)算機(jī)視覺領(lǐng)域,在物體檢測(cè)、圖像分割和面部識(shí)別等任務(wù)中提供最先進(jìn)的性能。在這篇文章中,我們將簡(jiǎn)單介紹CNN的內(nèi)部工作原理、其架構(gòu)以及在現(xiàn)實(shí)世界中的應(yīng)用。

卷積神經(jīng)網(wǎng)絡(luò)的原理
要理解CNN,必須熟悉神經(jīng)網(wǎng)絡(luò)的基本概念。神經(jīng)網(wǎng)絡(luò)是一個(gè)受人腦結(jié)構(gòu)和功能啟發(fā)的計(jì)算模型,它由相互連接的人工神經(jīng)元組成。這些神經(jīng)元被組織成層,每個(gè)神經(jīng)元接收來自前幾層的輸入,并將輸出發(fā)送到后續(xù)層。
CNN是一種專門的神經(jīng)網(wǎng)絡(luò)類型,專注于處理具有網(wǎng)格狀結(jié)構(gòu)的數(shù)據(jù),如圖像。CNN的主要構(gòu)成是卷積層,其目的是自動(dòng)和自適應(yīng)地從輸入數(shù)據(jù)中學(xué)習(xí)空間層次的特征。
卷積層
卷積層(Convolutional Layers)是CNN的核心部分。它執(zhí)行卷積運(yùn)算,這是一種數(shù)學(xué)運(yùn)算,將兩個(gè)函數(shù)作為輸入并產(chǎn)生第三個(gè)函數(shù)作為輸出。在CNN的背景下,輸入函數(shù)通常是一個(gè)圖像和一個(gè)過濾器(也被稱為內(nèi)核)。卷積操作用于分析輸入圖像中的局部模式,方法是在圖像上滑動(dòng)濾波器,計(jì)算濾波器和它所覆蓋的圖像區(qū)域之間的點(diǎn)積。
這個(gè)過程產(chǎn)生了一個(gè)特征圖,它是輸入圖像的一個(gè)表示,突出了過濾器檢測(cè)到的特定特征存在的區(qū)域。通過在卷積層中使用多個(gè)過濾器,CNN可以學(xué)會(huì)識(shí)別輸入圖像中的不同特征。
典型的CNN結(jié)構(gòu) By Aphex34 – Own work, CC BY-SA 4.0