一级毛片高清国产一区二区,国产日产久久高清欧美一区ww

通過存儲從模型預(yù)測中獲取的真陽性、假陽性、真陰性和假陰性的每個標(biāo)簽的個數(shù)，我們可以使用查全率和精確性來估計每個標(biāo)簽的性能。精度的定義是：

查全率在比率中定義為：

查全率/精確性會暴露出分類不平衡的問題，但并不能解決它。但是，有一些方法可以緩解分類不平衡的問題：
通過給每個標(biāo)簽分配不同的系數(shù)；
通過對原始數(shù)據(jù)集進(jìn)行重新采樣，或者對少數(shù)類進(jìn)行過采樣或?qū)Χ鄶?shù)類進(jìn)行過采樣。也就是說，由于分類邊界的更”嚴(yán)格”，數(shù)據(jù)集太小容易帶來誤差，讓過采樣更容易導(dǎo)致過度擬合。
【圖像識別方法標(biāo)準(zhǔn) 識別圖像軟件哪個好】通過應(yīng)用SMOTE方法(對少數(shù)過采樣進(jìn)行合成的技術(shù))來解決頻繁對分類數(shù)據(jù)進(jìn)行復(fù)制的問題。該方法在數(shù)據(jù)增強的背后應(yīng)用了相同的思想，并通過在少數(shù)類的相鄰實例之間插值來創(chuàng)建新的合成樣本。
過度擬合
正如我們所知，我們的模型通過反向傳播和最小化成本函數(shù)來學(xué)習(xí)/概括數(shù)據(jù)集中的關(guān)鍵特性。每一個來回的步驟都被稱為一個輪次，并且隨著每一個輪次的調(diào)整進(jìn)行模型的訓(xùn)練和權(quán)值的更改，以最小化錯誤的代價。為了測試模型的準(zhǔn)確性，一個常見的規(guī)則是將數(shù)據(jù)集分為訓(xùn)練集和驗證集。
訓(xùn)練集用于調(diào)整和創(chuàng)建模型，讓模型更加符合訓(xùn)練前的目的。驗證集測試基于不可見樣本模型的有效性。

盡管對實際情況的錯誤驗證會讓曲線圖有更大的起伏。

在每一個輪次結(jié)束時，我們用驗證集測試模型，在某個點上，模型開始記憶訓(xùn)練集中的特征。當(dāng)我們到達(dá)某個階段時，發(fā)現(xiàn)驗證集上頻繁的發(fā)生錯誤并且精度變差，這說明模型是過度擬合的。
選擇網(wǎng)絡(luò)的大小和復(fù)雜程度將是過度擬合的決定性原因。復(fù)雜的體系結(jié)構(gòu)可能更容易過度擬合，但是，有一些策略可以防止過度擬合:
增加訓(xùn)練集上的樣本數(shù)量；如果對網(wǎng)絡(luò)進(jìn)行更多實際案例的訓(xùn)練，它將具有更好的普遍性；
當(dāng)過擬合發(fā)生時，停止反向傳播是另一種選擇，這樣可以保證成本函數(shù)和驗證集的準(zhǔn)確性；
采用正則化的方法是另一個流行的選擇。
L2正則化
L2正則化是一種通過向較大的個體權(quán)重進(jìn)行分配約束來降低模型復(fù)雜度的方法。通過設(shè)置懲罰約束，減少模型對訓(xùn)練數(shù)據(jù)的依賴。
Dropout
對于正則化來說，Dropout也是一種常見的選擇，它被用于較高層的隱藏單元上，然后我們?yōu)槊總€輪次建立了不同的架構(gòu) ?；旧?，該系統(tǒng)隨機選擇要在訓(xùn)練中去除的神經(jīng)元，通過不斷地重新調(diào)整權(quán)重，網(wǎng)絡(luò)被迫從數(shù)據(jù)中學(xué)習(xí)更普遍的模式。
結(jié)語
正如我們所看到的，有各種不同的方法和技術(shù)來解決圖像識別中最常見的分類問題，每種方法和技術(shù)都有各自的優(yōu)點和潛在的缺點。存在的一些問題是數(shù)據(jù)不平衡，過度擬合，其中最通常的問題是不會有足夠的數(shù)據(jù)可用，但是，正如我們已經(jīng)解釋過的，它們可以通過遷移學(xué)習(xí)、抽樣方法和正則化技術(shù)來解決。