入行僅一年!深圳17歲高中生破解AI底層難題 獲馬斯克點贊

入行僅一年!深圳17歲高中生破解AI底層難題 獲馬斯克點贊

文章圖片


快科技3月19日消息 , 3月16日晚間 , 特斯拉CEO馬斯克在社交平臺公開發聲 , 點贊中國人工智能企業月之暗面(Kimi)團隊的最新技術成果 , 直言這項工作“令人印象深刻” , 將這款國產大模型的前沿研究推向公眾視野 。
伴隨技術論文同步公開 , 作者名單中位列首位的Guangyu Chen(陳廣宇)引發全網關注——這位核心作者竟是一名年僅17歲的在讀高中生 , 來自廣東深圳 。
據論文附錄標注信息顯示 , 陳廣宇與張宇、蘇劍林三人同為同等貢獻共同第一作者 , 其余34位參與作者均未標注該資格 。
其中 , 張宇是Kimi高效模型架構的核心研發人員 , 蘇劍林則是旋轉位置編碼(RoPE)的提出者 。
值得一提的是 , 陳廣宇真正深耕AI領域僅一年時間 。 起步階段 , 他憑借自主研讀前沿論文、追蹤GitHub開源項目等方式 , 快速補齊AI基礎知識與實踐能力 。
去年暑假 , 他遠赴舊金山完成7周實習歷練 , 回國后于去年11月加入Kimi團隊參與實習 。
論文發布后 , 陳廣宇在朋友圈發文復盤成果 , 特意提及三位同等貢獻作者 , 以及負責模型擴展、基礎設施搭建的團隊同事 。 他低調回應稱“是團隊成果 , 不要造神 。 ”
【入行僅一年!深圳17歲高中生破解AI底層難題 獲馬斯克點贊】據報道 , Kimi團隊發布的這項技術報告 , 提出全新Attention Residuals(注意力殘差)機制 , 對深度學習領域沿用近十年的傳統殘差連接實現顛覆性重構 。
Kimi的創新相當于給AI裝了“智能篩選器” , 將Transformer注意力機制遷移到模型深度維度 , 讓每一層動態篩選此前有用信息、壓低冗余 , 提升傳遞效率 。

    推薦閱讀