DeepSeek給全世界人民,拜!年!了!
當DeepSeek從登頂中美應(yīng)用商店免費榜,蔓延到成為X、微博、小紅書的熱門話題,這場關(guān)于AI的狂歡也逐漸從技術(shù)范疇,走到了國運敘事。網(wǎng)友紛紛戲稱“建議連夜安排DeepSeek上春晚”。
春晚可能是趕不上彩排了,但這個年無疑難忘今宵。
黑神話悟空制作人馮驥表示DeepSeek為國運級別的科技成果
事情從DeepSeek發(fā)布新模型起,經(jīng)過中美再次對賬,美國芯片封鎖好像不僅沒起到作用,反而激發(fā)了中國的創(chuàng)新?
一時間,各大主流媒體開始跟進,鋪天蓋地的報道下,持續(xù)看漲的英偉達股價大跌。
一眾大佬開始現(xiàn)身評價:特朗普表示DeepSeek給美國人工智能產(chǎn)業(yè)敲響了警鐘,ScaleAI創(chuàng)始人則暗戳戳表示中國人太努力,meta更是連夜成立四個專項小組研究其技術(shù)原理……
《華爾街日報》:硅谷對中國制造的人工智能模型贊不絕口 《紐約時報》:DeepSeek是如何顛覆人工智能的 《時代雜志》:DeepSeek引發(fā)股市混亂
DeepSeek是什么?為什么是它讓硅谷科技大佬集體破防?它又憑什么造成了美股的震蕩?你需要知道這些:
DeepSeek是什么?
簡單來說,DeepSeek是一家中國的人工智能研究公司。旗下產(chǎn)品為DeepSeek,可以在PC端和移動端使用。
首先,區(qū)別于硅谷AI企業(yè)依賴明星科學家的模式,DeepSeek核心團隊不到150人,沒有“明星”,也沒有“海歸”,人才構(gòu)成完全本土。
創(chuàng)始人梁文鋒,80后,本碩均畢業(yè)于浙江大學。他曾透露,DeepSeek員工都是一些Top高校的應(yīng)屆畢業(yè)生、沒畢業(yè)的博四、博五實習生,還有一些畢業(yè)才幾年的年輕人。此前,雷軍以千萬年薪招攬的95后“天才AI少女”羅福莉,就曾是DeepSeek的團隊成員。
此外,背靠量化私募公司幻方量化,DeepSeek至今沒有融資,完全靠自有資金運行。同時,它也是國內(nèi)除大廠外,唯一擁有萬張A100芯片的公司。
2019年,梁文鋒在金牛獎頒獎儀式上,發(fā)表主題演講《一名程序員眼里中國量化投資的未來》,當時幻方管理的資金規(guī)模就已破百億。
AI界的“拼多多”, 讓硅谷連夜查賬
宣稱能力可以對標GPT系列的模型并不少,為什么偏偏是DeepSeek讓硅谷AI圈集體大破防?
核心在于其極致低價的模型成本。
據(jù)介紹,對標GPT-4o的模型DeepSeek-V3,僅使用了2000塊英偉達芯片,訓練成本不到558萬美元,是同類模型的1/10。
要知道,OpenAI給特朗普畫的”星際大餅“可是價值5000萬美元。
Meta內(nèi)部員工更是吐槽:“我們一個高管的年薪就夠訓練整個DeepSeek模型了,而這樣的高管我們有幾十個,公司怎么向股東交代?“
其實,早在這次產(chǎn)生爆炸影響力之前,DeepSeek就已經(jīng)憑借其極致性價比,在去年5月出圈。獲得“AI界拼多多”稱號的同時,也帶動國內(nèi)大廠打起了大模型價格戰(zhàn)。
但值得注意的是,區(qū)別于賠錢換流量的模式,DeepSeek在低價的同時仍然保持盈利。
梁文鋒曾介紹:我們只是按照自己的步調(diào)來做事,然后核算成本定價。我們的原則是不貼錢,也不賺取暴利。這個價格也是在成本之上稍微有點利潤。
算力神話破滅? 華爾街估值地震
而DeepSeek能夠保持低成本的原因,則在于其架構(gòu)創(chuàng)新。
其首創(chuàng)MLA(多頭潛在注意力機制)與DeepSeekMoE架構(gòu),將顯存占用降至傳統(tǒng)模型的5%-13%,并通過強化學習實現(xiàn)“無監(jiān)督推理突破”——模型可自主反思糾錯,甚至展示數(shù)萬字思維鏈。
換句話說,僅用很少的AI芯片,通過算力效率提高,模型也能實現(xiàn)同樣的智能。打破AI產(chǎn)業(yè)對芯片依賴迷信的同時,也無疑給那些認為僅靠巨額資金就能遏制競爭的巨頭們,當頭一棒。
正因如此,DeepSeek-R1發(fā)布次日,英偉達、博通股價分別暴跌16.9%和17.4%,微軟、谷歌跟跌,歐洲ASML、西門子能源跌幅超7%。
挑戰(zhàn)OpenAI霸權(quán), 用開放擊穿閉源護城河
此外,DeepSeek更是將代碼、訓練方法、論文全部公開,并在MIT協(xié)議下允許商業(yè)應(yīng)用。
在”X“上我們已經(jīng)可以看到伯克利、港科大等學生已用幾十美元成功復現(xiàn)模型,被英偉達科學家稱為“非美國公司踐行OpenAI初心”。
伯克利博士用DeepSeek復現(xiàn)模型能力
要知道,OpenAI的API定價幾乎為DeepSeek的30倍,而DeepSeek應(yīng)用更是當前唯一支持免費聯(lián)網(wǎng)與深度思考的模型。試問什么會比免費更香?
——DeepSeek的開源生態(tài)直接動搖了硅谷“閉源壟斷——高額訂閱”的盈利邏輯。正如深度學習之父楊立昆所言:“這不是中美之爭,而是開源對閉源的超越”。
以上就是,DeepSeek此次引起巨大反響的原因。
One More Thing
更令人驚喜的是,更多人看到了DeepSeek具備的“本土靈魂”。借著年味,小紅書上的用戶已經(jīng)開始嘗試用DeepSeek寫詩,寫春聯(lián)。
Midjourney創(chuàng)始人使用DeepSeek之后的評價
而DeepSeek能夠帶來的驚喜顯然不止于此,除夕,DeepSeek再次推出新模型。
辭舊迎新,2025年的AI江湖,好戲剛剛開場。期待中國科技早日從“追趕敘事”走向“定義敘事”。
|
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選