維基百科與多家AI巨頭達成新合作 以API替代網絡爬蟲規范數據使用

維基百科與多家AI巨頭達成新合作 以API替代網絡爬蟲規范數據使用

【維基百科與多家AI巨頭達成新合作 以API替代網絡爬蟲規范數據使用】正值成立 25 周年之際 , 維基百科母公司維基媒體基金會(Wikimedia)于當地時間 1 月 15 日通過博客宣布 , 已與亞馬遜、Meta、微軟、Mistral AI 及 Perplexity 等多家科技企業達成新合作 。
此次合作將允許這些公司通過維基媒體企業版(Wikimedia Enterprise)合規獲取維基百科的應用程序接口(API)數據 , 用于大型語言模型(LLMs)的開發與訓練 , 替代此前普遍存在的網絡爬蟲抓取方式 。

維基媒體方面透露 , 上述合作均在過去一年內正式敲定 , 但此前未對外公開 。 這些企業將通過付費方式使用維基百科的海量數據 , 將這一 \"人類協作治理的知識體系\" 大規模整合到自身平臺中 。
值得一提的是 , 谷歌早在 2022 年就成為維基媒體企業版的首批合作伙伴 , 此次新增合作后 , 該項目的合作陣營已擴展至 Ecosia、Pleias、ProRata 等多家機構 。
維基媒體基金會發言人在接受 CNBC 采訪時表示:\"維基百科的知識資源為生成式 AI 聊天機器人、搜索引擎、語音助手等產品提供了核心支撐 。 對于 AI 及科技企業而言 , 其長遠發展離不開對維基百科這類知識項目的培育 , 因為這些平臺構建了它們賴以生存的人類知識基礎 。 \"
隨著 AI 行業的爆發式增長 , 數據使用權問題日益受到關注 , 維基百科、Reddit等平臺上的人類生成內容被 AI 企業使用所引發的法律爭議與倫理問題也持續升溫 。
去年 , 埃隆?馬斯克就推出了 AI 驅動的維基百科競品 \"Grokipedia\" , 該平臺以 xAI 旗下大語言模型 Grok 命名 , 所有條目均由 AI 生成 , 馬斯克宣稱其更具客觀性、\"反對 woke 思潮\" 。
此次維基媒體與科技巨頭的合作 , 不僅為 AI 企業獲取合規知識數據提供了新路徑 , 也為內容平臺與 AI 行業的良性互動探索了模式 , 有望在保護知識創作者權益與推動技術創新之間找到平衡點 。

    推薦閱讀