日本午夜精品一区二区,欧美大屁股xxxx高跟欧美黑人

優(yōu)化后的執(zhí)行時(shí)間 = 受優(yōu)化影響的執(zhí)行時(shí)間 / 加速倍數(shù) + 不受影響的執(zhí)行時(shí)間

3. 總結(jié)延伸我們可以看到，無(wú)論是簡(jiǎn)單地通過(guò)提升主頻，還是增加更多的 CPU 核心數(shù)量，通過(guò)并行來(lái)提升性能，都會(huì)遇到相應(yīng)的瓶頸。僅僅簡(jiǎn)單地通過(guò)“堆硬件”的方式，在今天已經(jīng)不能很好地滿足我們對(duì)于程序性能的期望了。于是，工程師們需要從其他方面開(kāi)始下功夫了。
【計(jì)算機(jī)組成原理講解：功耗與性能臺(tái)式機(jī)功率計(jì)算公式】在“摩爾定律”和“并行計(jì)算”之外，在整個(gè)計(jì)算機(jī)組成層面，還有這樣幾個(gè)原則性的性能提升方法。

加速大概率事件。最典型的就是，過(guò)去幾年流行的深度學(xué)習(xí) ，整個(gè)計(jì)算過(guò)程中， 99% 都是向量和矩陣計(jì)算，于是，工程師們通過(guò)用 GPU 替代 CPU ，大幅度提升了深度學(xué)習(xí)的模型訓(xùn)練過(guò)程。本來(lái)一個(gè) CPU 需要跑幾小時(shí)甚至幾天的程序， GPU 只需要幾分鐘就好了。Google 更是不滿足于 GPU 的性能，進(jìn)一步地推出了 TPU 。后面的文章，我也會(huì)為你講解 GPU 和 TPU 的基本構(gòu)造和原理。
通過(guò)流水線提高性能 ?，F(xiàn)代的工廠里的生產(chǎn)線叫“流水線” 。我們可以把裝配 iPhone 這樣的任務(wù)拆分成一個(gè)個(gè)細(xì)分的任務(wù) ，讓每個(gè)人都只需要處理一道工序，最大化整個(gè)工廠的生產(chǎn)效率。類(lèi)似的，我們的 CPU 其實(shí)就是一個(gè)“運(yùn)算工廠” 。我們把 CPU 指令執(zhí)行的過(guò)程進(jìn)行拆分，細(xì)化運(yùn)行，也是現(xiàn)代 CPU 在主頻沒(méi)有辦法提升那么多的情況下，性能仍然可以得到提升的重要原因之一。我們?cè)诤竺嬉矔?huì)講到，現(xiàn)代 CPU 里面是如何通過(guò)流水線來(lái)提升性能的，以及反面的，過(guò)長(zhǎng)的流水線會(huì)帶來(lái)什么新的功耗和效率上的負(fù)面影響。
通過(guò)預(yù)測(cè)提高性能。通過(guò)預(yù)先猜測(cè)下一步該干什么，而不是等上一步運(yùn)行的結(jié)果，提前進(jìn)行運(yùn)算，也是讓程序跑得更快一點(diǎn)的辦法。典型的例子就是在一個(gè)循環(huán)訪問(wèn)數(shù)組的時(shí)候，憑經(jīng)驗(yàn) ，你也會(huì)猜到下一步我們會(huì)訪問(wèn)數(shù)組的下一項(xiàng) 。后面要講得“分支和冒險(xiǎn)”、“局部性原理”這些 CPU 和存儲(chǔ)系統(tǒng)的設(shè)計(jì)方法，其實(shí)都是在利用我們對(duì)于未來(lái)的“預(yù)測(cè)” ，提前進(jìn)行相應(yīng)的操作，來(lái)提升我們的程序性能。