欧美日韩国产一区二区|qovd片|小明个人发布看看|小浪货你夹真紧水又多|老头把我添高潮了A片故|99热久久精品国产一区二区|久久久春色AV

bloom|參數高達1760億個,1000多名學者聯合研發大型語言模型BLOOM

bloom|參數高達1760億個,1000多名學者聯合研發大型語言模型BLOOM

文章圖片

bloom|參數高達1760億個,1000多名學者聯合研發大型語言模型BLOOM

文章圖片

bloom|參數高達1760億個,1000多名學者聯合研發大型語言模型BLOOM

文章圖片

bloom|參數高達1760億個,1000多名學者聯合研發大型語言模型BLOOM


在位于巴黎郊區的法國國家科學研究中心 , 有一個超級計算中心 , 內部一排排看起來像黑色冰箱的東西正嗡嗡作響 。 聽著震耳欲聾的100分貝的聲音 , 就像是參加了一場人工智能研究的搖滾音樂會 。
這些嗡嗡作響的東西是超級計算機的一部分 , 該超級計算機花了117天時間開發了一種名為BLOOM的新大型語言模型(LLM , LargeLanguageModel) , 它的創造者希望這展現了一條與人工智能常見開發方式完全不同的道路 。
BLOOM的英文全名代表著大科學、大型、開放科學、開源的多語言語言模型 。
與其他更著名的大型語言模型 , 如OpenAIGPT-3和谷歌的LaMDA , 它的設計盡可能透明 , 研究人員會分享訓練數據的細節 , 開發過程中的挑戰 , 以及性能的評估方式 。
OpenAI和谷歌還沒有共享他們的代碼 , 也沒有向公眾提供他們的模型 , 外部研究人員對這些模型的訓練方式知之甚少 。
BLOOM是去年由1000多名志愿研究人員在一個名為“大科學BigScience”的項目中創建的 , 該項目由人工智能初創公司HuggingFace利用法國政府的資金運作的 。 該模型于7月12日正式發布 。
研究人員希望開發一種開放獲取的大型語言模型 , 性能足以媲美其他先進的模型 , 而且還可以推動人工智能開發文化發生轉變 , 并且幫助世界各地的研究人員普及尖端人工智能技術 。

(來源:《麻省理工科技評論》)
BLOOM模型的最大優勢是它的易獲取性 。 它現在已經公開發布了 , 任何人都可以在HuggingFace網站上免費下載 。 用戶有多個語種可選 , 然后將需求輸入到BLOOM中 , 任務類型包括撰寫食譜或詩歌、翻譯或總結文本 , 甚至還有代碼編程 。 人工智能開發人員可以在該模型的基礎上構建他們自己的應用程序 。
BLOOM擁有1760億個參數(決定輸入數據如何轉換為輸出內容的變量) , 稍多于擁有1750億個參數的GPT-3 , 研究人員稱它提供了與其他相同大小的模型相似的準確性和有毒文本水平 。 對于西班牙語和阿拉伯語等語言來說 , BLOOM是第一個如此規模的大型語言模型 。
但即使是該模型的創造者也警告說 , 它尚未解決困擾大型語言模型的根深蒂固的問題 , 包括在數據治理和隱私方面缺乏足夠的政策指引 , 以及算法會生成有毒內容 , 如充斥種族主義或性別歧視的文字 。

公開獲取
大型語言模型是一種使用了大量數據訓練的深度學習算法 。 它們是人工智能研究中最熱門的領域之一 。 像GPT-3和LaMDA這樣強大的模型 , 它們生成的文本讀起來就像是人類寫的 , 在改變在線信息處理方面有巨大的潛力 。
它們可以被用來開發聊天機器人 , 或者用來搜索信息、篩查在線內容、總結書籍、或者根據提示生成全新的文本 。 但它們也充滿著問題 , 只需要一點點引導 , 這些模型就可以生成有毒內容 。
這些模型也非常獨特 。 他們需要使用大量昂貴的算力來支撐大量數據的訓練 , 而這只有像谷歌這樣的大型科技公司才能負擔得起 。
大多數開發尖端大型語言模型的大型科技公司都限制了外部人士使用它們 , 也沒有公布有關其模型內部運作的信息 , 這使得他們很難承擔責任 。 保密性和排他性是BLOOM研究人員希望改變的東西 。

相關經驗推薦