研究機構:DeepSeek硬件GPU支出超過5億美元

研究機構:DeepSeek硬件GPU支出超過5億美元

中國創業公司DeepSeek模型成本引發熱議 , 并且造成股市震蕩 。 研究機構SemiAnalysis今天報告指出 , 至今硬件繪圖處理器(GPU)支出遠超過5億美元 。
SemiAnalysis指中國對沖基金幻方量化(High-Flyer)2023年5月成立“深度求索”(DeepSeek)以推動AI研發 , 之前幻方量化2021年 , 也就是任何出口管制生效前 , 投資買了一萬顆英偉達(Nvidia)A100 GPU 。
故DeepSeek的GPU投資花費超過5億美元 。
【研究機構:DeepSeek硬件GPU支出超過5億美元】英偉達根據法規要求 , 生產多款H100變化版如H800、H20 。 目前僅H20可銷售至中國 。 英偉達過去九個月生產超過百萬顆專供中國市場的H20 GPU 。 報告分析 , DeepSeek服務器總資本支出(CapEx)約16億美元 。
DeepSeek從中國本土招募人才 , 目前約有150名員工 , 急速擴張中 。 DeepSeek價格和性能這周因出現模型訓練成本低于600萬美元的說法引起討論 。 但報告強調預訓練成本僅占總成本小部分 , 不代表完整支出 。
DeepSeek論文提到的600萬美元成本指的是預訓練運行(pre-training run)的GPU成本 , 只占模型總成本部分 , 未計入的重要支出還包括研發(R&D)、硬件總擁有成本(Total Cost of Ownership)等關鍵因素 。 報告也提到DeepSeek獲大量算力資源與出口管制與時間滯后(lag)有關 。
美國智庫蘭德公司(RAND)研究員海姆(Lennart Heim)近期分析 , 硬件出口管制有時間滯后 , 尚未完全發揮影響力 。 真正考驗將出現在數據中心需升級或擴展時 , 這對美國企業較容易 , 但對受出口管制的中國企業而言就是挑戰 。
SemiAnalysis也評價 , DeepSeek開放權重模型表現出色 , 超越Meta Llama、法國人工智能創業公司Mistral AI及其他競爭者 。
(首圖來源:DeepSeek)

    推薦閱讀