国产精品无卡免费视频,欧美亚洲韩国日本国产天天看片

導(dǎo)言
大多數(shù)與圖像識(shí)別相關(guān)的分類問題都存在著眾所周知的/既定的問題。例如，通常情況下，沒有足夠的數(shù)據(jù)來對(duì)分類系統(tǒng)進(jìn)行適當(dāng)?shù)挠?xùn)練，這些數(shù)據(jù)涵蓋的類可能會(huì)有所不足，而且最常見的情況是，使用未經(jīng)仔細(xì)檢查的數(shù)據(jù)將意味著我們對(duì)數(shù)據(jù)的標(biāo)簽缺乏合理的分類。

圖像識(shí)別方法標(biāo)準(zhǔn) 識(shí)別圖像軟件哪個(gè)好

數(shù)據(jù)是決定你的努力是失敗還是成功的關(guān)鍵。這些系統(tǒng)不僅僅需要比人類更多的數(shù)據(jù)來學(xué)習(xí)和區(qū)分不同的類，它們還需要成千上萬(wàn)倍的數(shù)據(jù)才能相對(duì)較好的完成這項(xiàng)工作。
深度學(xué)習(xí)依靠大量高質(zhì)量的數(shù)據(jù)來預(yù)測(cè)未來的趨勢(shì)和行為模式。并且數(shù)據(jù)集需要代表我們打算預(yù)測(cè)的類，否則，系統(tǒng)會(huì)”曲解”不同類的分布，讓你的模型產(chǎn)生偏差。
這些問題通常有一個(gè)共同的原因：即查找、提取和存儲(chǔ)大量數(shù)據(jù)的能力不夠強(qiáng)大，以及在第二層上對(duì)數(shù)據(jù)的清除、管理和處理能力不足。
雖然我們可以提高計(jì)算能力和數(shù)據(jù)存儲(chǔ)能力，但這種情況只有當(dāng)這是一個(gè)復(fù)雜的、大的卷積神經(jīng)網(wǎng)絡(luò)針對(duì)一個(gè)大的數(shù)據(jù)集運(yùn)行時(shí)才會(huì)考慮，只有一臺(tái)機(jī)器是不可能的。因?yàn)樗赡軟]有足夠的空間/內(nèi)存，而且很可能沒有足夠的計(jì)算能力來運(yùn)行分類系統(tǒng) 。它還需要通過云資源”訪問”并行或分布式計(jì)算，了解如何運(yùn)行、組織和設(shè)置復(fù)雜的集群。
然而，擁有足夠的數(shù)據(jù)和處理能力并不足以防止這些問題的發(fā)生。
在這篇文章中，我們將探索和討論一些不同的技術(shù)，這些技術(shù)可以解決在處理小數(shù)據(jù)集時(shí)出現(xiàn)的問題，如緩解分類的不平衡，以及如何防止過度擬合。
遷移學(xué)習(xí)
“數(shù)據(jù)可能是新的煤炭”，引用自NeilLawrence的話。我們知道深度學(xué)習(xí)算法需要通過大量的標(biāo)記數(shù)據(jù)從零開始訓(xùn)練一個(gè)成熟的網(wǎng)絡(luò)，但是我們常常無(wú)法完全理解大量這個(gè)詞意味著多少數(shù)據(jù) 。簡(jiǎn)單來說，僅僅是找到滿足你訓(xùn)練需求的數(shù)據(jù)量可能都會(huì)給你帶來挫折感，但是有一些技術(shù)，例如數(shù)據(jù)增強(qiáng)或遷移學(xué)習(xí)，將為你的模型節(jié)省大量的精力和時(shí)間。
遷移學(xué)習(xí)是一種流行的、非常強(qiáng)大的方法，簡(jiǎn)而言之，它可以概括為是把已訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練。這意味著利用現(xiàn)有的模型并改變它以適應(yīng)你自己的目標(biāo) 。這種方法包括”切斷”前訓(xùn)練模型的最后幾個(gè)層，并使用你的數(shù)據(jù)集對(duì)它們進(jìn)行再訓(xùn)練。這樣做有以下優(yōu)點(diǎn)：
它在較老的模型上建立了一個(gè)新的模型，并對(duì)圖像分類任務(wù)進(jìn)行了驗(yàn)證。例如，一個(gè)建立在CNN體系架構(gòu)上的模型（比如由Google開發(fā)的CNN模型Inception-v3），然后經(jīng)過ImageNet的預(yù)訓(xùn)練；
它減少了訓(xùn)練時(shí)間，因?yàn)樗试S重復(fù)使用參數(shù)以實(shí)現(xiàn)可能需要數(shù)周才能達(dá)到的性能。
不平衡數(shù)據(jù)
通常，數(shù)據(jù)集中的一組標(biāo)簽相對(duì)于其他數(shù)據(jù)集中的標(biāo)簽的比例可能是不平衡的，而這個(gè)時(shí)候，所占比例較低標(biāo)的標(biāo)簽組往往是我們感興趣的一組，因?yàn)樗鄬?duì)稀有。例如，假設(shè)我們有一個(gè)二進(jìn)制分類問題，X類代表95%的數(shù)據(jù)，Y類代表其他5%的數(shù)據(jù) 。因此，該模型對(duì)X類更”敏感”，對(duì)Y類不太”敏感” 。當(dāng)分類器的準(zhǔn)確率達(dá)到95%時(shí)，我們只能說對(duì)X類的預(yù)測(cè)基本都是正確的。
顯然，這里的準(zhǔn)確性不是一個(gè)適當(dāng)?shù)?#8221;評(píng)分” 。在這種情況下，我們更應(yīng)該考慮的是預(yù)測(cè)錯(cuò)誤的代價(jià)、預(yù)測(cè)精確度和查全率。一個(gè)合理的起點(diǎn)是對(duì)不同類型錯(cuò)誤的二維表示，換句話說，是一個(gè)混淆矩陣。在本文中，可以將其描述為說明實(shí)際標(biāo)簽與預(yù)測(cè)標(biāo)簽的方法，如下圖所示。

圖像識(shí)別方法標(biāo)準(zhǔn) 識(shí)別圖像軟件哪個(gè)好

推薦閱讀

蘇打水含糖嗎

供車一般多少年，供車一般供多少年多?

甌北哪里好玩

HD12是什么意思 hdm12是什么意思

二氧化碳與碳酸鈉反應(yīng)方程式二氧化碳與碳酸鈉反應(yīng)方程式是什么

圣誕禮物送給媽媽什么寓意好圣誕禮物送給媽媽什么寓意

逆水寒補(bǔ)丁如何下載

成都去峨眉山一日游攻略

自己去鳳凰旅游攻略

廚房門小適合裝什么門

麗水廢紙打包站浙江廢紙打包站怎么聯(lián)系紙廠

秦時(shí)麗人明月心天明第幾集出現(xiàn)

冰箱制冷調(diào)到多少比較合適呢？

T1用了兩年了

如何關(guān)閉開機(jī)自動(dòng)啟動(dòng)的軟件程序

英語(yǔ)四六級(jí)成績(jī)查詢?nèi)肟诠倬W(wǎng) 學(xué)信網(wǎng)四六級(jí)查詢