華中農業大學高性能計算平臺借鯤鵬算力之翼,展基因組育種宏圖

華中農業大學高性能計算平臺借鯤鵬算力之翼,展基因組育種宏圖

文章圖片

華中農業大學高性能計算平臺借鯤鵬算力之翼,展基因組育種宏圖
在當今時代 , 科技正以前所未有的力量助力農業研發 , 創新科技為我們帶來更豐富的農產品 , 也推動農業邁向智能化、高效化、可持續發展的新征程 。

在日前舉行的CCF高性能計算學術年會上上 , 華中農業大學高性能計算平臺正式上線試運行 。 該平臺基于鯤鵬昇騰硬件基礎設施架構 , 采用自主創新技術 , 包含了鯤鵬計算、昇騰計算、分布式高性能存儲、分布式大容量存儲、RoCE網絡及調度平臺等組件 , 也成為了科技引領農業發展的新一代增長引擎 。


生物育種研究遇到大數據計算壓力
傳統架構急需升級

華中農業大學前身為1898創辦的湖北農務學堂 , 是中國高等農業教育的重要起點之一 , 距今已有120多年的辦學歷史 , 深厚的歷史底蘊使其在農業教育領域具有深遠的影響力和較高的知名度 。 智慧農業、農業數字化等新業務場景需要先進算力平臺的技術支撐 。




硬件方面 , 傳統以 CPU 為主的架構存在并行度較差、分布式性能弱等弊端 , 導致計算效率低下;軟件方面 , 華中農業大學科研用戶使用的軟件以數量繁雜的開源軟件為主 , 總計約有上萬款 , 尋找適合特定任務的工具如同大海撈針 , 也會帶來適配性等多方面的問題 。 不僅如此 , 測序技術的飛速發展帶來了多組學數據的爆炸 , 如過去10年間華中農業大學作物遺傳改良全國重點實驗室的多組學數據從0.1PB猛增到10PB , 如此大規模數據的存儲和計算處理對存儲系統的穩定性、可擴展性及性能提出了極高要求 。


由此看來 , 隨著科技發展、科研應用的深入 , 無論是數據量激增帶來的存儲壓力、軟件工具集龐雜帶來的選型壓力、算力不足帶來的處理壓力還是科研手段迭代帶來的升級壓力 , 都讓科研工作者們身心俱疲 , 而對于他們來說也急需一款高效、穩定、靈活、安全的科研平臺 , 讓大家能夠全身心的投入基因研究當中 。


“天權”新平臺誕生
讓基因研究效率大大提升




在綜合評估多家行業解決方案之后 , 結合自身應用需求和科研特點 , 華中農業大學攜手華為創新性的打造出一款高效處理百萬級群體、千萬級分子標記的育種大數據分析工具“天權(HIBLUP)一體機” , 讓育種效率大大提升 。


相比傳統方式 , “天權”在軟硬件架構層面與傳統方式完全不同 。 在硬件基礎設施層面 , “天權”采用了鯤鵬算力、麒麟操作系統 , 軟件采用自研算法 , 更適合基因組時代育種大數據的計算場景 , 與現有工具相比 , 大幅降低了達到相同的計算準確度的計算資源消耗 , 而且基因分型個體在群體中占比越大 , 優勢愈明顯 。




基因組育種就好比是用大數據為優秀“種子選手”排隊 , 育種公司會用基因分型技術檢測幾萬到幾十萬個位點 , 這樣的基因芯片 , 大型育種企業每年會用上十幾萬張 , 隨著世代增加 , 育種數據會不斷的積累 , 計算量變得越來越大 , 當然信息越多、利用的越好 , 種子選手的排序就越準確 。
就這樣 , “天權+鯤鵬”的組合實現了強強聯手 , 一方面鯤鵬平臺可以從代碼層面對應用需求實現支撐 , 保證“天權”平臺安全性、可靠性的同時 , 實現高效穩定運行;另一方面 ,“天權”平臺還在鯤鵬算力底座的基礎上鏈接了鯤鵬數學庫KML , 結合OpenMP等多種并行技術提升計算效率 , 同時運用內存映射、單雙精度混合運算等技術 , 大大降低計算過程中的內存消耗 , 這樣可以進一步發揮鯤鵬架構軟硬結合的技術優勢 , 加速科研育種效率 。
相比傳統的“x86+GCC+ MKL”模式 , “天權+畢昇編譯器+鯤鵬數學庫”的組合可以將效率提升31% , 耗時降低 。 “天權”軟件平臺在功能模塊、計算性能、用戶體驗等方面不斷升級完善 , 成為了目前唯一兼具基因組選種及基因組精準選配功能的育種計算工具 , 并被全球84個國家/地區用戶使用 , 開創了基因組育種的“中國范式” 。


俗話說:“民以食為天” 。 從田間到餐桌 , 每一粒糧食、每一道菜肴都凝聚著無數人的辛勤付出 。 如今 , 在眾多科研人員的努力下、在包括華為鯤鵬在內眾多平臺的加持下 , 我們的食物也在變得越來越精致、越來越營養、越來越健康 。
這也正是科技發展的價值所在 , 悄然改變我們的生活 , 讓每個人都感到富足與安康 。
【華中農業大學高性能計算平臺借鯤鵬算力之翼,展基因組育種宏圖】

    推薦閱讀