Qumulo推出自主AI管理和GPU數據傳輸功能

Qumulo推出自主AI管理和GPU數據傳輸功能

Qumulo為其云數據平臺推出了三項全新的AI相關軟件功能:Helios AI智能體、CloudConnectAI加速器和AI網絡 , 旨在實現管理、AI數據選擇和傳輸的自主化優化 。
這一創新理念基于AI可以改善軟件固有的監控和管理整個數據基礎設施性能的能力 , 并能選擇性地緩存數據并將其傳輸到GPU服務器 , 無需密切的系統管理員級別控制 。 Qumulo的云數據平臺軟件可以在本地運行 , 也可以在AWS、Azure和Google云中原生運行 , 為非結構化數據提供統一的全局命名空間 。 這形成了一個云數據結構 , 三項新功能都是AI數據供應鏈的重要組成部分 。
首席執行官Doug Gourlay表示:\"當今的企業需要的不僅僅是存儲——他們需要能夠思考、適應和加速的系統 。 Helios為我們的客戶提供對整個數據生態系統的預測性感知 , Qumulo CloudConnect讓他們的數據在任何需要洞察的地方流動 , 而AI網絡重新定義了性能的可能性 。 這是下一代推理基礎設施的基礎 。 \"
Helios智能體架構與功能
Helios是一個AI智能體 , 通過系統級遙測數據進行訓練——包括本地和Qumulo在AWS、Azure和Google云中的實例——能夠對Qumulo非結構化數據環境進行自我管理、自我診斷和自我優化 。 它每天接收來自基礎設施的計算、存儲、云和網絡層的數十億個事件 , 并將它們放入統一模型中 。
Helios能夠尋找和識別新出現的異常情況 , 預測即將出現的容量或性能問題 , 并在問題發生之前自動生成規范性建議或修復工作流程來解決這些新生問題 。 可以將其視為Qumulo數據基礎設施的一種接近自動駕駛的超級巡航控制系統 。
Helios支持MCP協議 , 從而將其影響力擴展到Qumulo的合作伙伴生態系統 , \"允許外部智能體和編排框架參與同一推理結構 , 創建真正自主的數據平臺 。 \"
CloudConnect AI加速器優化數據傳輸
CloudConnect AI加速器專注于將數據從Qumulo云數據結構存儲移動到GPU服務器 , 使用NeuralCache技術進行預測性緩存 , 將GPU數據加載時間減少高達64% 。 Qumulo表示 , 它可以在幾分鐘內部署到任何主要云、區域或可用性區域 , 并充當云數據結構的臨時讀/寫輻條 。
該系統可以根據需要從一個實例擴展到數百個實例 , 并動態優化數據路徑 , 確保數據僅在需要時和需要的地方移動 , 具有最小延遲且無需手動編排 。 訓練、推理和推理工作負載可以訪問單一數據真實源 , 公司表示具有\"嚴格的數據安全性、治理和控制 。 \"
AI網絡提升數據傳輸性能
AI網絡引入了專為在GPU服務器上運行的AI訓練、推理和推理工作負載調優的新數據移動器 。 這些數據移動器原生支持RDMA(遠程直接內存訪問)、基于融合以太網v2的RDMA(RoCEv2)和基于RDMA的NFS , 基于RDMA的S3正在開發中 。 它們\"在存儲和加速計算集群之間提供接近內存帶寬 , 顯著減少大規模AI操作的延遲和CPU開銷 。 \"
這些數據移動器實現了\"與Nvidia DGX、AMD Instinct和其他GPU豐富的計算基礎設施的無縫集成 。 \"
Qumulo的三項新功能從今天開始為特定客戶提供預覽版 , 并將在下個季度全面上市 。 在SC25展會的4407號展位將進行演示 , Qumulo解決方案工程師可以為HPC和AI工作流程提供實踐建議 。
Q&A
Q1:Helios AI智能體是什么?它有什么功能?
A:Helios是Qumulo開發的AI智能體 , 通過系統級遙測數據訓練 , 能夠對非結構化數據環境進行自我管理、自我診斷和自我優化 。 它每天處理數十億個事件 , 能識別異常情況 , 預測容量或性能問題 , 并自動生成修復建議 。
Q2:CloudConnect AI加速器如何提升GPU數據處理效率?
A:CloudConnect AI加速器使用NeuralCache技術進行預測性緩存 , 將數據從云數據結構存儲快速傳輸到GPU服務器 , 可將GPU數據加載時間減少高達64% 。 它能動態優化數據路徑 , 確保數據僅在需要時移動 , 實現最小延遲 。
Q3:AI網絡功能支持哪些技術標準?
A:AI網絡的數據移動器原生支持RDMA(遠程直接內存訪問)、RoCEv2(基于融合以太網v2的RDMA)和基于RDMA的NFS , 基于RDMA的S3正在開發中 。 能夠與Nvidia DGX、AMD Instinct等GPU計算基礎設施無縫集成 。
【Qumulo推出自主AI管理和GPU數據傳輸功能】

    推薦閱讀