日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

計(jì)算機(jī)組成原理講解:功耗與性能 臺(tái)式機(jī)功率計(jì)算公式( 二 )


優(yōu)化后的執(zhí)行時(shí)間 = 受優(yōu)化影響的執(zhí)行時(shí)間 / 加速倍數(shù) + 不受影響的執(zhí)行時(shí)間
3. 總結(jié)延伸我們可以看到 , 無(wú)論是簡(jiǎn)單地通過(guò)提升主頻 , 還是增加更多的 CPU 核心數(shù)量 , 通過(guò)并行來(lái)提升性能 , 都會(huì)遇到相應(yīng)的瓶頸 。僅僅簡(jiǎn)單地通過(guò)“堆硬件”的方式 , 在今天已經(jīng)不能很好地滿足我們對(duì)于程序性能的期望了 。于是 , 工程師們需要從其他方面開(kāi)始下功夫了 。
【計(jì)算機(jī)組成原理講解:功耗與性能 臺(tái)式機(jī)功率計(jì)算公式】在“摩爾定律”和“并行計(jì)算”之外 , 在整個(gè)計(jì)算機(jī)組成層面 , 還有這樣幾個(gè)原則性的性能提升方法 。
  1. 加速大概率事件 。最典型的就是 , 過(guò)去幾年流行的深度學(xué)習(xí) , 整個(gè)計(jì)算過(guò)程中 , 99% 都是向量和矩陣計(jì)算 , 于是 , 工程師們通過(guò)用 GPU 替代 CPU , 大幅度提升了深度學(xué)習(xí)的模型訓(xùn)練過(guò)程 。本來(lái)一個(gè) CPU 需要跑幾小時(shí)甚至幾天的程序 , GPU 只需要幾分鐘就好了 。Google 更是不滿足于 GPU 的性能 , 進(jìn)一步地推出了 TPU 。后面的文章 , 我也會(huì)為你講解 GPU 和 TPU 的基本構(gòu)造和原理 。
  2. 通過(guò)流水線提高性能 ?,F(xiàn)代的工廠里的生產(chǎn)線叫“流水線” 。我們可以把裝配 iPhone 這樣的任務(wù)拆分成一個(gè)個(gè)細(xì)分的任務(wù) , 讓每個(gè)人都只需要處理一道工序 , 最大化整個(gè)工廠的生產(chǎn)效率 。類(lèi)似的 , 我們的 CPU 其實(shí)就是一個(gè)“運(yùn)算工廠” 。我們把 CPU 指令執(zhí)行的過(guò)程進(jìn)行拆分 , 細(xì)化運(yùn)行 , 也是現(xiàn)代 CPU 在主頻沒(méi)有辦法提升那么多的情況下 , 性能仍然可以得到提升的重要原因之一 。我們?cè)诤竺嬉矔?huì)講到 , 現(xiàn)代 CPU 里面是如何通過(guò)流水線來(lái)提升性能的 , 以及反面的 , 過(guò)長(zhǎng)的流水線會(huì)帶來(lái)什么新的功耗和效率上的負(fù)面影響 。
  3. 通過(guò)預(yù)測(cè)提高性能 。通過(guò)預(yù)先猜測(cè)下一步該干什么 , 而不是等上一步運(yùn)行的結(jié)果 , 提前進(jìn)行運(yùn)算 , 也是讓程序跑得更快一點(diǎn)的辦法 。典型的例子就是在一個(gè)循環(huán)訪問(wèn)數(shù)組的時(shí)候 , 憑經(jīng)驗(yàn) , 你也會(huì)猜到下一步我們會(huì)訪問(wèn)數(shù)組的下一項(xiàng) 。后面要講得“分支和冒險(xiǎn)”、“局部性原理”這些 CPU 和存儲(chǔ)系統(tǒng)的設(shè)計(jì)方法 , 其實(shí)都是在利用我們對(duì)于未來(lái)的“預(yù)測(cè)” , 提前進(jìn)行相應(yīng)的操作 , 來(lái)提升我們的程序性能 。

推薦閱讀