最懂你的股市快報: [新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

[新聞] 成本低廉中國AI初創DeepSeek震撼矽谷 - 看板 Stock - 批踢踢實業坊

作者humbler (獸人H)

看板Stock

標題[新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

時間Mon Jan 27 14:30:41 2025

原文標題：成本低廉中國AI初創DeepSeek震撼矽谷原文連結： https://udn.com/news/story/6811/8516686 發布時間： 2025-01-27 14:17 記者署名：無原文內容：中國AI新創公司「深度求索」(DeepSeek)近期先後發布「DeepSeek-V3」和「DeepSeek-R1 」兩款大模型，由於成本低廉，性能與OpenAI相當，讓矽谷震驚，甚至引發Meta內部的恐慌。分析認為，總部位於杭州的DeepSeek可能將改寫AI大模型領域的遊戲規則。財聯社報導，甚至有投資者將輝達上周五重挫3.12％的原因指向DeepSeek的一夜爆火。德國「世界報」知名市場評論員Holger Zschaepitz表示：「中國的DeepSeek可能代表對美國股市的最大威脅，因為該公司似乎以極低的成本構建了一個突破性的人工智慧模型，並且無需使用尖端晶片。這讓人質疑投入該行業的數千億美元資本支出的實際效用。」據報導，DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月，就訓練出了一個6710億參數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3，用了1萬6384片更強的H100 顯示卡，花了54天。DeepSeek的訓練效率提升了11倍。中媒「每日經濟新聞」26日報導稱，在川普總統宣布5000億美元的「星際之門」 (Stargate)發展人工智慧基礎建設計畫之際，DeepSeek以極低的價格建立了突破性的AI模型，且未使用尖端晶片，讓人們質疑，AI行業數千億美元資本的巨額投入，是否真為最有效的方法？報導回顧，去年12月27日，DeepSeek推出開源模型「DeepSeek-V3」。AI系統排名網站「聊天機器人競技場」(Chatbot Arena)顯示，「DeepSeek-V3」在所有模型中排名第七，在開源模型排第一。且「DeepSeek-V3」是全球前十中，性價比最高的模型。不到一個月，今年1月20日，DeepSeek再推出「DeepSeek-R1」，24日「DeepSeek-R1」在聊天機器人競技場綜合榜單上排名第三，與頂尖推理模型、OpenAI推出的o1並列。同時，測評機構「Artificial-Analysis」對「DeepSeek-R1」的初始基準測試結果也顯示，「 DeepSeek-R1」在AI分析質量指數中取得第二高分，價格則是o1的約30分之1。「每日經濟新聞」稱，24日一篇發布在匿名平台teamblind上的文章瘋傳，一位自稱是 Meta員工稱，Meta內部因為DeepSeek模型進入恐慌模式，該文員工寫道，「DeepSeek-V3 」在基準測試中，已經讓(Meta推出的)Llama 4相形見絀，而更讓人難堪的是，一家「僅用550萬美元訓練預算的中國公司」就做到了這一點。該匿名文指，工程師正爭分奪秒分析DeepSeek，試圖複製其中的一切可能技術。另外，「 DeepSeek-R1」的出現，也讓情況更加嚴峻。然而，美國人工智慧數據基礎設施新創公司Scale AI執行長Alexandr Wang最近接受CNBC 採訪時爆料，DeepSeek擁有大約五萬個輝達最先進的H100 GPU，並指「但是很明顯他們不能說出來，因為這違反了美國所實施的出口管制，我相信他們擁有比外界想像的更多，他們未來會被晶片管制，和出口管制所限制」。心得/評論： AI回歸原點還是比誰的模型寫得更好中國領先美國 DeepSeek證明不用花大錢買一堆尖端晶片仍然能得到好結果矽谷圈難怪會恐慌這波AI競賽終於從硬體回歸到軟體 -- 如果還有來世，我想當一個獸人 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.247.64 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1737959443.A.78C.html

最懂你的股市快報

2025年1月27日星期一

[新聞] 成本低廉中國AI初創DeepSeek震撼矽谷

沒有留言:

張貼留言

最懂你的股市快報

2025年1月27日 星期一

[新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷

沒有留言:

張貼留言

2025年1月27日星期一

[新聞] 成本低廉中國AI初創DeepSeek震撼矽谷