馬斯克認同Ilya AI訓練資料已耗盡的觀點,並表示合成資料將成未來方向
PANews 1月9日消息,根據TechCrunch報道,埃隆·馬斯克在與Stagwell董事長Mark Penn的直播對話中表示,目前AI模型的訓練已基本耗盡真實世界的數據,“我們已經用盡了人類知識的累積總和,這在去年就發生了。方式。
馬斯克認為,合成數據將是補充真實數據的途徑,AI將透過產生和自我評估數據實現自我學習。這一趨勢已被包括微軟、Meta、OpenAI和Anthropic等科技巨頭採用,如微軟Phi-4模型和谷歌Gemma模型都結合了真實數據和合成數據進行訓練。 Gartner預測,2024年AI和分析計畫中約60%的數據將為合成產生。
合成資料的優點包括成本節約,例如AI新創公司Writer僅花費約70萬美元開發其幾乎完全基於合成資料的Palmyra X 004模型,相較之下,類似規模的OpenAI模型開發成本約為460萬美元。然而,合成資料也存在風險,包括模型創造力下降、輸出偏差加劇,以及潛在的模型崩潰,尤其當訓練資料本身有偏差時,生成結果也可能受到影響。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
貝萊德與美國證券交易委員會加密貨幣工作組會面,討論加密貨幣ETF的質押和期權
簡要概述:貝萊德的代表與美國證券交易委員會(SEC)工作人員討論了“促進具有質押功能的交易所交易產品(ETP)的考量因素”。貝萊德還討論了批准加密貨幣ETF的一般標準。

去中心化AI:突破科技巨頭的圍牆
去中心化AI透過透明、可驗證的區塊鏈基礎設施挑戰中心化AI的黑箱控制,Kava、NEAR、Akash等項目正推動其從理論走向實際應用,重塑AI的透明度和用戶賦權

幣圈世紀官司畫句點:Ripple 、美國 SEC 達成 5 千萬美元和解

美國穩定幣法案《GENIUS》觸礁:民主黨強硬杯葛、參院投票破局

加密貨幣價格
更多








