日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

x79平臺(tái)cpu cpu對(duì)比平臺(tái)( 二 )



x79平臺(tái)cpu cpu對(duì)比平臺(tái)


△MLPerf網(wǎng)站展示的玄鐵C906的四項(xiàng)測(cè)試
從Tiny v0.7推理性能數(shù)據(jù)對(duì)比來(lái)看,玄鐵C906的四項(xiàng)測(cè)試得分分別達(dá)到了其他機(jī)構(gòu)最優(yōu)性能的12.6倍、20.8倍、16.2倍和10.9倍以上 。足見玄鐵C906在AIoT領(lǐng)域的性能優(yōu)勢(shì) 。

x79平臺(tái)cpu cpu對(duì)比平臺(tái)


△權(quán)威AI榜單MLPerf Tiny V0.7性能數(shù)據(jù)對(duì)比
據(jù)了解,在AI Benchmark領(lǐng)域,過(guò)去大家看重的都是芯片的AI性能,在這塊MLPerf已經(jīng)做到了國(guó)際公認(rèn)的權(quán)威 。經(jīng)過(guò)近幾年的發(fā)展,特別是在IoT領(lǐng)域,芯片的AI能效表現(xiàn)越來(lái)越受到重視,MLPerf也對(duì)應(yīng)的推出了針對(duì)IoT領(lǐng)域的AI能效的基準(zhǔn)測(cè)試Tiny 。
孟建熠告訴芯智訊:“由于此前阿里在AI能效方面一直有較多的布局和積累,當(dāng)Tiny這個(gè)測(cè)試推出之后,我們自然就想來(lái)反映一下自身的能力,于是就去參與了測(cè)試,結(jié)果四個(gè)指標(biāo)都拿到了第一,證明了我們的技術(shù)路線是正確的 。”
需要特別指出的是,該測(cè)試成績(jī)是在不使用加速器的情況下取得的,也就是說(shuō),這個(gè)測(cè)試的成績(jī)完全反映的是平頭哥C906的AI處理能力 。
“從平頭哥的角度來(lái)說(shuō),我們的定位就是提供RISC-V原生的AI支持,而不是去做AI加速器,所以我們?nèi)慷际怯肅PU來(lái)跑的,通過(guò)軟硬件的協(xié)同創(chuàng)新證明我們的整體能力 ??蛻艨梢曰诖?,再去研發(fā)更定制化的AI加速器 。”孟建熠強(qiáng)調(diào):“我們覺得這件事真正的價(jià)值在于對(duì)RISC-V產(chǎn)業(yè)發(fā)展的推動(dòng),它不僅證明了RISC-V在AI的高能效處理上是可行的,而且相比其它架構(gòu)還更具領(lǐng)先優(yōu)勢(shì),大家可以持續(xù)地往這個(gè)方向做得更好 ?!?br /> RISC-V國(guó)際基金會(huì)CEO Calista Redmond也表示: “物聯(lián)網(wǎng)領(lǐng)域的AI技術(shù)競(jìng)爭(zhēng)激烈,不同層面的定向優(yōu)化對(duì)于以極低功耗取得新突破至關(guān)重要 。阿里此次的工作證明了其在RISC-V產(chǎn)業(yè)的領(lǐng)導(dǎo)者地位,也給全球RISC-V社區(qū)和生態(tài)的發(fā)展提供了信心 ?!?br /> 軟硬協(xié)同優(yōu)化是關(guān)鍵
那么,平頭哥玄鐵C906此次成功拿下四項(xiàng)AI測(cè)試的全球第一,并且相比友商的最優(yōu)性能得分均高出了10倍以上,其背后又有著哪些秘密呢?
據(jù)介紹,此番玄鐵C906這一成績(jī)的取得,主要是得益于阿里軟硬件協(xié)同創(chuàng)新優(yōu)化的實(shí)力,包括了從硬件,到編譯,到算法,再到應(yīng)用的各個(gè)方面 。
首先,在硬件層面,玄鐵C906處理器是業(yè)界最早量產(chǎn)的向量擴(kuò)展RISC-V指令集處理器 。采用5~8級(jí)流水線設(shè)計(jì),配備性能優(yōu)異的單雙精度浮點(diǎn)和128位矢量運(yùn)算單元,支持INT8 / INT16 / INT32 / INT64 以及 BF16 / FP16 / FP32 / FP64多種格式的矢量運(yùn)算 。同時(shí),C906在數(shù)據(jù)預(yù)取上也做了優(yōu)化,采用多通道多模式的數(shù)據(jù)預(yù)取技術(shù),可大幅提升數(shù)據(jù)訪問(wèn)帶寬 。
其次,在編譯層面,平頭哥進(jìn)一步優(yōu)化了針對(duì)玄鐵CPU平臺(tái)的神經(jīng)網(wǎng)絡(luò)模型部署工具集HHB(Heterogeneous Honey Badger) 及開源神經(jīng)網(wǎng)絡(luò)加速庫(kù)CSI-NN2,將AI算子更好地與硬件適配,使得玄鐵CPU實(shí)現(xiàn)了AI性能升級(jí) 。目前,HHB及CSI-NN2均已開源 。
第三,在算法層面,借助阿里云震旦異構(gòu)計(jì)算加速平臺(tái)SinianML對(duì)各個(gè)benchmark的神經(jīng)網(wǎng)絡(luò)進(jìn)行了壓縮、蒸餾、伸縮、網(wǎng)絡(luò)結(jié)構(gòu)搜索等多方位的優(yōu)化,在保證達(dá)到要求精度目標(biāo)的情況下,得到遠(yuǎn)高于標(biāo)準(zhǔn)模型的計(jì)算效率,同時(shí)集成阿里IoT、螞蟻IoT、達(dá)摩院語(yǔ)音實(shí)驗(yàn)室等在各自領(lǐng)域的優(yōu)化經(jīng)驗(yàn)和能力,進(jìn)一步拓展細(xì)分領(lǐng)域的優(yōu)化的效果 。
【x79平臺(tái)cpu cpu對(duì)比平臺(tái)】第四,在應(yīng)用層面,玄鐵RISC-V處理器經(jīng)過(guò)數(shù)年的發(fā)展,目前已覆蓋低功耗、高能效、高性能等各類場(chǎng)景,并支持了OpenXuantie的多操作系統(tǒng)(AliOS、FreeRTOS、RT-Thread、Linux、Android等),廣泛應(yīng)用于智能家電、車載、工業(yè)控制、邊緣計(jì)算等領(lǐng)域 。這也使得玄鐵RISC-V處理器能夠針對(duì)各種不同應(yīng)用端的需求進(jìn)行持續(xù)優(yōu)化 。

推薦閱讀