日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

Deeplab,deeplab( 三 )


搜索非常高效,在一個 P100 GPU 上僅需 3 天 。作者在多個語義分割基準數據集上進行了實驗,包括 Cityscapes、PASCAL VOC 2012 和 ADE20K 。在未經 ImageNet 預訓練的情況下,最佳 Auto-DeepLab 模型在 Cityscapes 測試集上的結果超過 FRRN-B 8.6%,超過 GridNet 10.9% 。
在利用 Cityscapes 粗糙標注數據的實驗中,Auto-DeepLab 與一些經過 ImageNet 預訓練的當前最優(yōu)模型的性能相近 。值得注意的是,本研究的最佳模型(未經過預訓練)與 DeepLab v3 (有預訓練)的表現相近,但在 MultiAdds 中前者的速度是后者的 2.23 倍 。另外,Auto-DeepLab 的輕量級模型性能僅比 DeepLab v3低 1.2%,而參數量需求卻少了 76.7%,在 MultiAdds 中的速度是 DeepLab v3的 4.65 倍 。
在 PASCAL VOC 2012 和 ADE29K 上,Auto-DeepLab 最優(yōu)模型在使用極少數據進行預訓練的情況下,性能優(yōu)于很多當前最優(yōu)模型 。本論文主要貢獻如下:這是首次將 NAS 從圖像分類任務擴展到密集圖像預測任務的嘗試之一 。該研究提出了一個網絡級架構搜索空間,它增強和補充了已經得到深入研究的單元級架構搜索,并對網絡級和單元級架構進行更具挑戰(zhàn)性的聯合搜索 。
本研究提出了一種可微的連續(xù)方式,保證高效運行兩級分層架構搜索,在一個 GPU 上僅需 3 天 。在未經 ImageNet 預訓練的情況下,Auto-DeepLab 模型在 Cityscapes 數據集上的性能顯著優(yōu)于 FRRN-B 和 GridNet,同時也和 ImageNet 預訓練當前最佳模型性能相當 。
在 PASCAL VOC 2012 和 ADE20K 數據集上,最好的 Auto-DeepLab 模型優(yōu)于多個當前最優(yōu)模型 。論文:Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation論文地址:https://arxiv.org/pdf/1901.02985v1.pdf摘要:近期,在圖像分類問題上神經架構搜索(NAS)確定的神經網絡架構能力超越人類設計的網絡 。
本論文將研究用于語義圖像分割的 NAS,語義圖像分割是將語義標簽分配給圖像中每個像素的重要計算機視覺任務 ?,F有的研究通常關注搜索可重復的單元結構,對控制空間分辨率變化的外部網絡結構進行人工設計 。這種做法簡化了搜索空間,但對于具備大量網絡級架構變體的密集圖像預測而言,該方法帶來的問題很多 。因此,該研究提出在搜索單元結構之外還要搜索網絡級架構,從而形成一個分層架構搜索空間 。
本研究提出一種包含多種流行網絡設計的網絡級搜索空間,并提出一個公式來進行基于梯度的高效架構搜索(在 Cityscapes 圖像上使用 1 個 P100 GPU 僅需 3 天) 。本研究展示了該方法在較難的 Cityscapes、PASCAL VOC 2012 和 ADE20K 數據集上的效果 。在不經任何 ImageNet 預訓練的情況下,本研究提出的專用于語義圖像分割的架構獲得了當前最優(yōu)性能 。
4 方法這部分首先介紹了精確匹配上述分層架構搜索的離散架構的連續(xù)松弛,然后討論了如何通過優(yōu)化執(zhí)行架構搜索,以及如何在搜索終止后解碼離散架構 。4.2 優(yōu)化連續(xù)松弛的作用在于控制不同隱藏狀態(tài)之間連接強度的標量現在也是可微計算圖的一部分 。因此可以使用梯度下降對其進行高效優(yōu)化 。作者采用了 [49] 中的一階近似,將訓練數據分割成兩個單獨的數據集 trainA 和 trainB 。
優(yōu)化在以下二者之間交替進行:1. 用 ?_w L_trainA(w, α, β) 更新網絡權重 w;2. 用 ?_(α,β) L_trainB(w, α, β) 更新架構 α, β 。其中損失函數 L 是在語義分割小批量上計算的交叉熵 。4.3 解碼離散架構單元架構和 [49] 一樣,本研究首先保留每個構造塊的兩個最強前任者(predecessor),然后使用 argmax 函數選擇最可能的 operator,從而解碼離散單元架構 。
網絡架構公式 7 本質上表明圖 1 中每個藍色節(jié)點處的「outgoing 概率」的總和為 1 。事實上,β 可被理解為不同「時間步」(層數)中不同「狀態(tài)」(空間分辨率)之間的「transition 概率」 。本研究的目標是從頭開始找到具備「最大概率」的的路徑 。在實現中,作者可以使用經典維特比算法高效解碼該路徑 。

推薦閱讀