日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

xsplit vcam apk xsplit


xsplit vcam apk xsplit


3 月 30 日,英特爾正式發(fā)布英特爾銳炫 ARC 移動端獨(dú)立顯卡,代號 Alchemist(煉金術(shù)士),遙想英特爾首次面向消費(fèi)端的獨(dú)顯產(chǎn)品推出已經(jīng) 24 年了,在那之后英特爾獨(dú)顯產(chǎn)品開發(fā)就陷入了停滯轉(zhuǎn)而專注核顯開發(fā) 。
在經(jīng)過多年的技術(shù)積累,英特爾此前面向服務(wù)器市場推出了 DG1 顯卡,今年正式面向消費(fèi)端推出英特爾銳炫 ARC 獨(dú)顯產(chǎn)品,首批針對移動端推出的 A 系列產(chǎn)品包含銳炫 3/5/7 三個型號 。
其中英特爾銳炫 3 主要面向主流游戲市場,銳炫 5 主要面向性能游戲市場,銳炫 7 主要面向發(fā)燒級硬核游戲 。此次英特爾推出了移動端 A 系列的 A350M 和 A370 M 產(chǎn)品 。全新英特爾銳炫顯卡支持 XeSS 超采樣、完整的 AV1 硬件加速、Smooth Sync 抖動過濾、Deep Link 功能,全方位覆蓋游戲、創(chuàng)意設(shè)計(jì)、功耗控制等場景 。
首款搭載英特爾銳炫 ARC 獨(dú)顯的是三星 Galaxy Boo2 Pro 輕薄本產(chǎn)品,這款產(chǎn)品獲得英特爾 Evo 嚴(yán)苛認(rèn)證,目前已經(jīng)在海外市場正式上市 。
未來借助英特爾在處理器市場上的份額優(yōu)勢,將會有大量搭載英特爾銳炫 ARC 獨(dú)顯筆記本產(chǎn)品上市 。通過英特爾 Evo 認(rèn)證的產(chǎn)品在續(xù)航和顯示能力上也將得到進(jìn)一步提升 。
目前宏碁、華碩、戴爾、海爾、惠普、聯(lián)想、微星、三星、英特爾 NUC 等品牌或者產(chǎn)品已經(jīng)有推出銳炫獨(dú)顯筆記本的打算,通過銳炫獨(dú)顯,英特爾未來也可以整合自家產(chǎn)品,推出第一方英特爾筆記本 。
配套的英特爾銳炫控制面板也隨著英特爾銳炫獨(dú)顯產(chǎn)品的上市同步推出,這一控制面板集合了驅(qū)動自動更新、性能監(jiān)控、性能調(diào)優(yōu)、直播管理、游戲高光時刻生成、活動推廣等功能,并且無需強(qiáng)制登錄就可使用 。
接下來了,我們通過詳細(xì)的解析了解一下全新的英特爾銳炫 ARC 獨(dú)立顯卡的底層架構(gòu)和技術(shù)亮點(diǎn) 。
底層架構(gòu)
英特爾銳炫 ARC 獨(dú)顯產(chǎn)品基于英特爾 Xe HPG 架構(gòu)開發(fā),核心采用內(nèi)置 XMX 的 Xe 內(nèi)核,包含 Xe 媒體引擎、Xe 顯示引擎以及 Xe 圖形管線三大核心功能 。
通過 Xe HPG 微架構(gòu),英特爾銳炫顯卡在開發(fā)過程中有很大的靈活性,渲染切片是 Xe HPG 微架構(gòu)的基本模塊,每個 Xe HPG 渲染切片包含 4 個 Xe 內(nèi)核、4 個光追單元、4 個采樣器、幾何引擎、光柵引擎、HiZ 引擎以及 2 個像素后端構(gòu)成 。
每個 Xe 內(nèi)核中包含 XMX 矩陣引擎、XVE 適量引擎、光追單元、采樣器等,這些構(gòu)成了一個完整的 Xe 內(nèi)核,也是 Xe HPG 微架構(gòu)的基本運(yùn)算單元,這與以往的執(zhí)行單元 EU 概念有所不同,通過 4 個 Xe 內(nèi)核構(gòu)成的渲染切片,以不同組合方式就構(gòu)成不同的 SoC 以此形成不同的產(chǎn)品形態(tài) 。
英特爾銳炫顯卡通過疊加渲染切片方式構(gòu)成不同的產(chǎn)品線,最小為 2 個,最大為 8 個,通過不同形式的組合構(gòu)成了各種各樣的產(chǎn)品 。針對光追和 DX12 Ultimate,Xe HPG 微架構(gòu)也有很好的支持 。
回到 Xe 內(nèi)核上,每個 Xe 內(nèi)核提供 16 個 256 位的 XVE 矢量引擎、16 個 1024 位的 XMX 矩陣引擎,并配備 192KB 的共享一級緩存 。XVE 適量引擎用于執(zhí)行傳統(tǒng)的圖像處理計(jì)算,XMX 矩陣引擎則主要用于 AI 加速 。
其中 XVE 矢量引擎每個時鐘周期可以執(zhí)行 16 個 FP32 操作、32 個 FP16 操作以及 64 個 INT8 操作,專用的 FP 浮點(diǎn)執(zhí)行接口和共享 INT / EM 執(zhí)行接口 。XMX 矩陣引擎每個時鐘周期可以執(zhí)行 128 個 FP16 / BF16 操作、256 個 INT8 操作、512 個 INT4 / INT2 操作 。
XMX 算力提升相比于傳統(tǒng)的 MAC 或者進(jìn)階的 DP4a 是非常巨大的,我們知道 MAC 是圖形中使用的基本 SIMD 矢量指令,每個時鐘周期共執(zhí)行 8 次并行運(yùn)算乘法和 8 次并行加法 。而 DP4a 則針對不需要 32 位精度的 AI 計(jì)算所做的優(yōu)化,每個時鐘周期共執(zhí)行 32 次并行乘法、32 次累加或每個周期總共 64 次 操作,這比標(biāo)準(zhǔn) SIMD MAC 提高了 4 倍的性能 。

推薦閱讀