“天河三號”首秀!超級計算機的CPU數量是最重要的嗎?


“天河三號”首秀!超級計算機的CPU數量是最重要的嗎?



在天津舉行的第二屆世界智能大會上 , 國家超算天津中心對外展示了我國新一代百億億次超級計算機“天河三號”原型機 , 這也是該原型機首次正式對外亮相 。 百億億次超級計算機也稱“E級超算” , 被全世界公認為“超級計算機界的下一頂皇冠” , 它將在解決人類共同面臨的能源危機、污染和氣候變化等重大問題上發揮巨大作用 。
我國的超級計算機主要有銀河系列、天河系列、曙光系列、神威系列等 , 目前計算性能最強的當屬已多次蟬聯國際超級計算大會(ISC , International Supercomputing Conference)Top500榜單的“神威·太湖之光” 。
據悉 , “神威·太湖之光”安裝了40960個中國自主研發的“申威26010”眾核處理器 , 該眾核處理器采用64位自主申威指令系統 , 峰值性能為每秒12.5億億次 , 持續性能為每秒9.3億億次 。 簡單來說 , 這套系統1分鐘的計算能力 , 相當于全球72億人同時用計算器不間斷計算32年 , 如果用2017年生產的筆記本電腦或個人臺式機主流配置作參照 , 神威·太湖之光相當于200多萬臺普通電腦 。
這里用來衡量超級計算機性能的重要指標是“運算速度” , 即計算機每秒鐘能進行的運算次數 。 最初以執行加法運算的次數來表示 , 后以執行加法、乘法、除法等的平均運算速度來表示 。 現今 , 通常所說的計算機運算速度(平均運算速度) , 是指每秒鐘所能執行的指令條數(ips , Instruction Per Second) 。 計算機每秒鐘能夠執行450百萬條指令 , 也可以描述為計算機的主頻是450MHz 。
超級計算機相對于我們的個人計算機而言 , 它可以進行極高速度的運算和巨大量的數據處理 , 其基本組成與個人計算機沒有本質差別 , 都是自下而上由硬件、系統軟件和應用軟件組成 , 但規格上大了許多倍 , 特點是高速度和大容量 。 由此 , 不少人認為 , 構建超級計算機就是在做芯片處理的加法 , 加在一起的處理器(CPU)越多 , 計算速度也就越快 。 甚至在2010年國際超級計算機(SC2010)會議上 , 還有超級計算機供應商的高管開玩笑說:“將100,000臺Android智能手機連起來 , 就能創造最快的計算速度 。 ”事實并非如此 。 打個比方 , 三人共同協作完成任務 , 除去正常開展任務工作外 , 還需要耗費人力進行任務分解、任務分配、結果歸總等管理工作 。 管理工作不科學 , 總體工作效率會大幅降低 。 也就是說 , 理論上 , 在單個CPU性能相當的情況下 , 超級計算機采用越多的CPU , 其運算速度越快 。 但實際情況并不是1+1=2 , 超級計算機進行并行計算 , 如果并行不合理 , 每個CPU的效能就不會充分發揮出來 。
并行計算是超級計算機的核心技術
并行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程 , 是提高計算機系統計算速度和處理能力的一種有效手段 。 它的基本思想是用多個處理器來協同求解同一問題 , 即將被求解的問題分解成若干個部分 , 各部分均由一個獨立的處理機來并行計算 。 并行計算的目的是為了加快求解速度 , 擴大求解規模 。 主要方法步驟有:數據劃分(把數據集劃分為多個子集)、任務分解(將一個應用分解成多個子任務)、處理器指派(把數據子集和任務分配給不同的處理器)、協作執行(各個處理器之間相互協同并行地執行子任務)等 。 美國國家工程院院士、NVIDIA公司首席科學家兼副總裁、斯坦福大學計算機科學系Bill Dally教授曾說過 , “在超級計算機領域 , performance=parallelism” 。

推薦閱讀