
文章圖片

文章圖片

文章圖片

在位于巴黎郊區的法國國家科學研究中心 , 有一個超級計算中心 , 內部一排排看起來像黑色冰箱的東西正嗡嗡作響 。 聽著震耳欲聾的100分貝的聲音 , 就像是參加了一場人工智能研究的搖滾音樂會 。
這些嗡嗡作響的東西是超級計算機的一部分 , 該超級計算機花了117天時間開發了一種名為BLOOM的新大型語言模型(LLM , LargeLanguageModel) , 它的創造者希望這展現了一條與人工智能常見開發方式完全不同的道路 。
BLOOM的英文全名代表著大科學、大型、開放科學、開源的多語言語言模型 。
與其他更著名的大型語言模型 , 如OpenAIGPT-3和谷歌的LaMDA , 它的設計盡可能透明 , 研究人員會分享訓練數據的細節 , 開發過程中的挑戰 , 以及性能的評估方式 。
OpenAI和谷歌還沒有共享他們的代碼 , 也沒有向公眾提供他們的模型 , 外部研究人員對這些模型的訓練方式知之甚少 。
BLOOM是去年由1000多名志愿研究人員在一個名為“大科學BigScience”的項目中創建的 , 該項目由人工智能初創公司HuggingFace利用法國政府的資金運作的 。 該模型于7月12日正式發布 。
研究人員希望開發一種開放獲取的大型語言模型 , 性能足以媲美其他先進的模型 , 而且還可以推動人工智能開發文化發生轉變 , 并且幫助世界各地的研究人員普及尖端人工智能技術 。
(來源:《麻省理工科技評論》)
BLOOM模型的最大優勢是它的易獲取性 。 它現在已經公開發布了 , 任何人都可以在HuggingFace網站上免費下載 。 用戶有多個語種可選 , 然后將需求輸入到BLOOM中 , 任務類型包括撰寫食譜或詩歌、翻譯或總結文本 , 甚至還有代碼編程 。 人工智能開發人員可以在該模型的基礎上構建他們自己的應用程序 。
BLOOM擁有1760億個參數(決定輸入數據如何轉換為輸出內容的變量) , 稍多于擁有1750億個參數的GPT-3 , 研究人員稱它提供了與其他相同大小的模型相似的準確性和有毒文本水平 。 對于西班牙語和阿拉伯語等語言來說 , BLOOM是第一個如此規模的大型語言模型 。
但即使是該模型的創造者也警告說 , 它尚未解決困擾大型語言模型的根深蒂固的問題 , 包括在數據治理和隱私方面缺乏足夠的政策指引 , 以及算法會生成有毒內容 , 如充斥種族主義或性別歧視的文字 。
公開獲取
大型語言模型是一種使用了大量數據訓練的深度學習算法 。 它們是人工智能研究中最熱門的領域之一 。 像GPT-3和LaMDA這樣強大的模型 , 它們生成的文本讀起來就像是人類寫的 , 在改變在線信息處理方面有巨大的潛力 。
它們可以被用來開發聊天機器人 , 或者用來搜索信息、篩查在線內容、總結書籍、或者根據提示生成全新的文本 。 但它們也充滿著問題 , 只需要一點點引導 , 這些模型就可以生成有毒內容 。
這些模型也非常獨特 。 他們需要使用大量昂貴的算力來支撐大量數據的訓練 , 而這只有像谷歌這樣的大型科技公司才能負擔得起 。
大多數開發尖端大型語言模型的大型科技公司都限制了外部人士使用它們 , 也沒有公布有關其模型內部運作的信息 , 這使得他們很難承擔責任 。 保密性和排他性是BLOOM研究人員希望改變的東西 。
相關經驗推薦
- 紅米手機|紅米K60遭曝光:關鍵性參數基本確認,感覺紅米K50不香了
- 努比亞|努比亞Z40SPro即將發布,參數配置已悉數曝光,一個字“穩”
- 安卓|安卓陣營堆相機參數,蘋果仍1200W像素,噱頭還是實力派一測便知
- 華為鴻蒙系統|這顏值和配置如何?魅族19外觀和參數提前曝光,魅友們很滿意
- 空調|一代“彩電大王”落幕:年營收曾高達30億,做過手機、賣過豬肉
- 折疊屏|國內折疊屏手機榜單更新:三星排名第二,榜首市場份額高達52%
- 華為|華為人均工資高達70萬,但先看看華為員工的16項標準
- 榮耀70|“參數黨”表示看不懂,榮耀70是有多超常識?
- 微信|CPU占用率高達156% 網友吐槽:微信到底想干啥
- 芯片|iQOO10系列曝光配置參數匯總,驍龍8+搭配V1+芯片,性能天花板?
