日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好( 二 )



圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好


通過存儲從模型預(yù)測中獲取的真陽性、假陽性、真陰性和假陰性的每個標(biāo)簽的個數(shù),我們可以使用查全率和精確性來估計每個標(biāo)簽的性能 。精度的定義是:

圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好


查全率在比率中定義為:

圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好


查全率/精確性會暴露出分類不平衡的問題,但并不能解決它 。但是,有一些方法可以緩解分類不平衡的問題:
通過給每個標(biāo)簽分配不同的系數(shù);
通過對原始數(shù)據(jù)集進(jìn)行重新采樣,或者對少數(shù)類進(jìn)行過采樣或?qū)Χ鄶?shù)類進(jìn)行過采樣 。也就是說,由于分類邊界的更”嚴(yán)格”,數(shù)據(jù)集太小容易帶來誤差,讓過采樣更容易導(dǎo)致過度擬合 。
【圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好】通過應(yīng)用SMOTE方法(對少數(shù)過采樣進(jìn)行合成的技術(shù))來解決頻繁對分類數(shù)據(jù)進(jìn)行復(fù)制的問題 。該方法在數(shù)據(jù)增強的背后應(yīng)用了相同的思想,并通過在少數(shù)類的相鄰實例之間插值來創(chuàng)建新的合成樣本 。
過度擬合
正如我們所知,我們的模型通過反向傳播和最小化成本函數(shù)來學(xué)習(xí)/概括數(shù)據(jù)集中的關(guān)鍵特性 。每一個來回的步驟都被稱為一個輪次,并且隨著每一個輪次的調(diào)整進(jìn)行模型的訓(xùn)練和權(quán)值的更改,以最小化錯誤的代價 。為了測試模型的準(zhǔn)確性,一個常見的規(guī)則是將數(shù)據(jù)集分為訓(xùn)練集和驗證集 。
訓(xùn)練集用于調(diào)整和創(chuàng)建模型,讓模型更加符合訓(xùn)練前的目的 。驗證集測試基于不可見樣本模型的有效性 。

圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好


盡管對實際情況的錯誤驗證會讓曲線圖有更大的起伏 。

圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好


在每一個輪次結(jié)束時,我們用驗證集測試模型,在某個點上,模型開始記憶訓(xùn)練集中的特征 。當(dāng)我們到達(dá)某個階段時,發(fā)現(xiàn)驗證集上頻繁的發(fā)生錯誤并且精度變差,這說明模型是過度擬合的 。
選擇網(wǎng)絡(luò)的大小和復(fù)雜程度將是過度擬合的決定性原因 。復(fù)雜的體系結(jié)構(gòu)可能更容易過度擬合,但是,有一些策略可以防止過度擬合:
增加訓(xùn)練集上的樣本數(shù)量;如果對網(wǎng)絡(luò)進(jìn)行更多實際案例的訓(xùn)練,它將具有更好的普遍性;
當(dāng)過擬合發(fā)生時,停止反向傳播是另一種選擇,這樣可以保證成本函數(shù)和驗證集的準(zhǔn)確性;
采用正則化的方法是另一個流行的選擇 。
L2正則化
L2正則化是一種通過向較大的個體權(quán)重進(jìn)行分配約束來降低模型復(fù)雜度的方法 。通過設(shè)置懲罰約束,減少模型對訓(xùn)練數(shù)據(jù)的依賴 。
Dropout
對于正則化來說,Dropout也是一種常見的選擇,它被用于較高層的隱藏單元上,然后我們?yōu)槊總€輪次建立了不同的架構(gòu) ?;旧?,該系統(tǒng)隨機選擇要在訓(xùn)練中去除的神經(jīng)元,通過不斷地重新調(diào)整權(quán)重,網(wǎng)絡(luò)被迫從數(shù)據(jù)中學(xué)習(xí)更普遍的模式 。
結(jié)語
正如我們所看到的,有各種不同的方法和技術(shù)來解決圖像識別中最常見的分類問題,每種方法和技術(shù)都有各自的優(yōu)點和潛在的缺點 。存在的一些問題是數(shù)據(jù)不平衡,過度擬合,其中最通常的問題是不會有足夠的數(shù)據(jù)可用,但是,正如我們已經(jīng)解釋過的,它們可以通過遷移學(xué)習(xí)、抽樣方法和正則化技術(shù)來解決 。

推薦閱讀