日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

圖像識(shí)別方法標(biāo)準(zhǔn) 識(shí)別圖像軟件哪個(gè)好

導(dǎo)言
大多數(shù)與圖像識(shí)別相關(guān)的分類問題都存在著眾所周知的/既定的問題 。例如,通常情況下,沒有足夠的數(shù)據(jù)來對(duì)分類系統(tǒng)進(jìn)行適當(dāng)?shù)挠?xùn)練,這些數(shù)據(jù)涵蓋的類可能會(huì)有所不足,而且最常見的情況是,使用未經(jīng)仔細(xì)檢查的數(shù)據(jù)將意味著我們對(duì)數(shù)據(jù)的標(biāo)簽缺乏合理的分類 。

圖像識(shí)別方法標(biāo)準(zhǔn) 識(shí)別圖像軟件哪個(gè)好


數(shù)據(jù)是決定你的努力是失敗還是成功的關(guān)鍵 。這些系統(tǒng)不僅僅需要比人類更多的數(shù)據(jù)來學(xué)習(xí)和區(qū)分不同的類,它們還需要成千上萬(wàn)倍的數(shù)據(jù)才能相對(duì)較好的完成這項(xiàng)工作 。
深度學(xué)習(xí)依靠大量高質(zhì)量的數(shù)據(jù)來預(yù)測(cè)未來的趨勢(shì)和行為模式 。并且數(shù)據(jù)集需要代表我們打算預(yù)測(cè)的類,否則,系統(tǒng)會(huì)”曲解”不同類的分布,讓你的模型產(chǎn)生偏差 。
這些問題通常有一個(gè)共同的原因:即查找、提取和存儲(chǔ)大量數(shù)據(jù)的能力不夠強(qiáng)大,以及在第二層上對(duì)數(shù)據(jù)的清除、管理和處理能力不足 。
雖然我們可以提高計(jì)算能力和數(shù)據(jù)存儲(chǔ)能力,但這種情況只有當(dāng)這是一個(gè)復(fù)雜的、大的卷積神經(jīng)網(wǎng)絡(luò)針對(duì)一個(gè)大的數(shù)據(jù)集運(yùn)行時(shí)才會(huì)考慮,只有一臺(tái)機(jī)器是不可能的 。因?yàn)樗赡軟]有足夠的空間/內(nèi)存,而且很可能沒有足夠的計(jì)算能力來運(yùn)行分類系統(tǒng) 。它還需要通過云資源”訪問”并行或分布式計(jì)算,了解如何運(yùn)行、組織和設(shè)置復(fù)雜的集群 。
然而,擁有足夠的數(shù)據(jù)和處理能力并不足以防止這些問題的發(fā)生 。
在這篇文章中,我們將探索和討論一些不同的技術(shù),這些技術(shù)可以解決在處理小數(shù)據(jù)集時(shí)出現(xiàn)的問題,如緩解分類的不平衡,以及如何防止過度擬合 。
遷移學(xué)習(xí)
“數(shù)據(jù)可能是新的煤炭”,引用自NeilLawrence的話 。我們知道深度學(xué)習(xí)算法需要通過大量的標(biāo)記數(shù)據(jù)從零開始訓(xùn)練一個(gè)成熟的網(wǎng)絡(luò),但是我們常常無(wú)法完全理解大量這個(gè)詞意味著多少數(shù)據(jù) 。簡(jiǎn)單來說,僅僅是找到滿足你訓(xùn)練需求的數(shù)據(jù)量可能都會(huì)給你帶來挫折感,但是有一些技術(shù),例如數(shù)據(jù)增強(qiáng)或遷移學(xué)習(xí),將為你的模型節(jié)省大量的精力和時(shí)間 。
遷移學(xué)習(xí)是一種流行的、非常強(qiáng)大的方法,簡(jiǎn)而言之,它可以概括為是把已訓(xùn)練好的模型參數(shù)遷移到新的模型來幫助新模型訓(xùn)練 。這意味著利用現(xiàn)有的模型并改變它以適應(yīng)你自己的目標(biāo) 。這種方法包括”切斷”前訓(xùn)練模型的最后幾個(gè)層,并使用你的數(shù)據(jù)集對(duì)它們進(jìn)行再訓(xùn)練 。這樣做有以下優(yōu)點(diǎn):
它在較老的模型上建立了一個(gè)新的模型,并對(duì)圖像分類任務(wù)進(jìn)行了驗(yàn)證 。例如,一個(gè)建立在CNN體系架構(gòu)上的模型(比如由Google開發(fā)的CNN模型Inception-v3),然后經(jīng)過ImageNet的預(yù)訓(xùn)練;
它減少了訓(xùn)練時(shí)間,因?yàn)樗试S重復(fù)使用參數(shù)以實(shí)現(xiàn)可能需要數(shù)周才能達(dá)到的性能 。
不平衡數(shù)據(jù)
通常,數(shù)據(jù)集中的一組標(biāo)簽相對(duì)于其他數(shù)據(jù)集中的標(biāo)簽的比例可能是不平衡的,而這個(gè)時(shí)候,所占比例較低標(biāo)的標(biāo)簽組往往是我們感興趣的一組,因?yàn)樗鄬?duì)稀有 。例如,假設(shè)我們有一個(gè)二進(jìn)制分類問題,X類代表95%的數(shù)據(jù),Y類代表其他5%的數(shù)據(jù) 。因此,該模型對(duì)X類更”敏感”,對(duì)Y類不太”敏感” 。當(dāng)分類器的準(zhǔn)確率達(dá)到95%時(shí),我們只能說對(duì)X類的預(yù)測(cè)基本都是正確的 。
顯然,這里的準(zhǔn)確性不是一個(gè)適當(dāng)?shù)?#8221;評(píng)分” 。在這種情況下,我們更應(yīng)該考慮的是預(yù)測(cè)錯(cuò)誤的代價(jià)、預(yù)測(cè)精確度和查全率 。一個(gè)合理的起點(diǎn)是對(duì)不同類型錯(cuò)誤的二維表示,換句話說,是一個(gè)混淆矩陣 。在本文中,可以將其描述為說明實(shí)際標(biāo)簽與預(yù)測(cè)標(biāo)簽的方法,如下圖所示 。

推薦閱讀