首頁 > 科技要聞 > 科技> 正文

DeepSeek真正成為了一條鯰魚

鳳凰科技 整合編輯:太平洋科技 發(fā)布于:2025-02-16 23:05

自走紅之初,DeepSeek就因成本優(yōu)勢不斷震驚業(yè)界,這為其開源生態(tài)發(fā)展奠定了非常好的基礎(chǔ)。

過去大模型走閉源路線與成本息息相關(guān)。許多大模型在預(yù)訓(xùn)練階段幾乎都選擇了不計(jì)成本地投入,而DeepSeek選擇劍走偏鋒,把重點(diǎn)放在了上崗之后的強(qiáng)化學(xué)習(xí)。用反復(fù)高強(qiáng)度地訓(xùn)練,倒逼自身不斷地調(diào)整姿勢,理解邏輯,自我反思,直到結(jié)果令人滿意。

以一直在難產(chǎn)的OpenAI GPT-5為例,估算顯示,該項(xiàng)目一次為期半年的訓(xùn)練,僅計(jì)算成本就高達(dá)約 5億美元。目前,該項(xiàng)目已開發(fā)超過18個(gè)月,成本花費(fèi)巨大,卻仍未取得預(yù)期成果。

這給國內(nèi)很多大模型公司都敲響了警鐘,意味著想訓(xùn)練頂級(jí)的模型,單是GPU的采購成本就高達(dá)幾十億,部署十萬卡集群的 “燒錢”程度更是難以想象。

相比之下,DeepSeek找到了一條低算力,高效率的路徑,其訓(xùn)練成本只是OpenAI相關(guān)模型的十幾甚至幾十分之一。

DeepSeek還狠狠回?fù)袅怂^“開源是硅谷精神”的論調(diào),其不僅開源了所有的模型和論文,供所有人去免費(fèi)下載,還公開了訓(xùn)練方法,允許大家去做數(shù)據(jù)的蒸餾,去訓(xùn)練自家的模型。

這意味著全球所有相關(guān)的技術(shù)人員,都能在現(xiàn)有的能力基礎(chǔ)之上,去做研發(fā)與開發(fā),至此,新的技術(shù),新的應(yīng)用就會(huì)在這個(gè)新生態(tài)里產(chǎn)生。

DeepSeek在2025年1月20日發(fā)布R1模型后,僅7天新增用戶1億(含網(wǎng)頁端與應(yīng)用端),成為史上最快破億的AI應(yīng)用。至2月1日,其日活躍用戶(DAU)突破3000萬大關(guān),超越豆包(1695萬),直逼ChatGPT的5323萬。

從云服務(wù)商、電信運(yùn)營商,到多數(shù)手機(jī)、汽車廠商,越來越多企業(yè)正在奮力擁抱 DeepSeek。

這條鯰魚很快也攪動(dòng)了全球AI市場,兩大“AI巨頭”先后決定一改閉源態(tài)度,松口向公眾免費(fèi)。

先是1月31日,OpenAI上線了新的推理模型o3-mini,并進(jìn)一步下放了免費(fèi)的權(quán)限。OpenAI CEO Sam Altman首次承認(rèn)在開源上的失誤,指出后續(xù)可能找到不同的開源策略,有望重拾模型開源。

最新消息則來自于百度,其在2月13宣布,從4月1日起,文心一言將全面免費(fèi)。同時(shí)即日起,文心一言上線深度搜索功能;該功能也將于4月1日起免費(fèi)開放使用。

要知道,去年李彥宏還是堅(jiān)定的閉源擁躉!敖裉觳还苁窃谥袊埠谩⒚绹埠茫顝(qiáng)的基礎(chǔ)模型都是閉源的。閉源是有真正商業(yè)模式的,是能夠賺到錢的,能賺到錢才能聚集算力、聚集人才”。

僅僅不到一年過去,情況就開始逆轉(zhuǎn)。

開源的底氣到底是什么?

其實(shí)許多人仍對(duì)DeepSeek如何算得又快又好抱有好奇,其中比較重要的一點(diǎn),就是它實(shí)現(xiàn)了芯片最底層的優(yōu)化。DeepSeek在其發(fā)布的技術(shù)論文中表示,DeepSeek采用了PTX(Parallel Thread Execution)編程,通過定制PTX優(yōu)化,使DeepSeek的系統(tǒng)和模型可以更好釋放底層硬件的性能。

相比于外界盛傳的算力限制讓其尋找性價(jià)比方案,DeepSeek其實(shí)是主動(dòng)擁抱的優(yōu)化,用PTX把某些SM(GPU里負(fù)責(zé)計(jì)算的核)做了編程,讓他們來負(fù)責(zé)做數(shù)據(jù)的傳輸,使得多個(gè)GPU之間的數(shù)據(jù)傳輸?shù)乃俣茸兛,解決了大模型計(jì)算中的一大瓶頸;同時(shí),它還用PTX優(yōu)化了其他的包括計(jì)算梯度在內(nèi)的運(yùn)算,使得同樣的GPU發(fā)揮出了10倍的效能,這在訓(xùn)練與推理過程中扮演著十分重要的角色。

除了芯片優(yōu)化,DeepSeek在訓(xùn)練方法上也下了真功夫。不同于傳統(tǒng)的大模型訓(xùn)練方法,它選擇直接跳過監(jiān)督微調(diào)階段,專注于通過規(guī)則驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)訓(xùn)練推理模型。

從DeepSeek V3 Base的預(yù)訓(xùn)練模型開始,完全省略了監(jiān)督微調(diào)階段,為了實(shí)現(xiàn)大規(guī)模的強(qiáng)化學(xué)習(xí),研究團(tuán)隊(duì)使用了一種名為GRPO(群體相對(duì)策略優(yōu)化)的方法。有人用現(xiàn)實(shí)生活生動(dòng)類比了這一數(shù)學(xué)原理的精妙之處,“通俗的說,就是一群學(xué)生在解決一個(gè)問題。老師不再單獨(dú)給每個(gè)學(xué)生打分,而是讓學(xué)生自己比較答案。答案更好的學(xué)生會(huì)受到鼓勵(lì),而其他人則會(huì)從錯(cuò)誤中吸取教訓(xùn)。隨著時(shí)間的推移,整個(gè)團(tuán)隊(duì)會(huì)共同進(jìn)步,變得更加準(zhǔn)確和一致”。

觀察DeepSeek這一本土化大模型的發(fā)展路徑,芯片優(yōu)化與GRPO,可謂是兩大法寶,提供源源不斷的光照與養(yǎng)分,但光有養(yǎng)分還不夠,一個(gè)好的土壤更加重要。DeepSeek的全資母公司幻方量化,原本對(duì)AI押寶許久,同時(shí)也是國內(nèi)少數(shù)破千億的量化私募,既不缺錢也沒有融資需求。跟國內(nèi)絕大多數(shù)AI相比,DeepSeek在商業(yè)化上可以說完全佛系,內(nèi)部甚至沒有設(shè)立過多的營銷、產(chǎn)品崗位。

同時(shí),據(jù)公開信息顯示,DeepSeek研發(fā)團(tuán)隊(duì)有 139人,均是立足于本土的年輕團(tuán)隊(duì),他們更知道這片土地到底需要什么,所以以上這些快速迭代,前沿的實(shí)驗(yàn)成果才有了茁壯成長的土壤。

工程上精益求精,技術(shù)上大刀闊斧進(jìn)行創(chuàng)新,DeepSeek的爆火絕非偶然。事實(shí)上,六年前這場布局就已開始。它的母公司幻方量化早在2019年就花費(fèi)2億打造螢火一號(hào)超算集群, 2022年默默地屯了萬張A100顯卡,是ChatGPT 3.5發(fā)布之后第一波手握萬卡入場券的少數(shù)模型公司,積累下的豐富資源增強(qiáng)了開疆拓土的信心。

至此,他們在V3實(shí)現(xiàn)了震撼的性價(jià)比,R1在實(shí)現(xiàn)性價(jià)比的同時(shí)還跑通了影響很大的新范式,一躍成為AI領(lǐng)域的新星,甚至有些觀點(diǎn)認(rèn)為,DeepSeek可以稱為中國AI大模型的ChatGPT時(shí)刻。對(duì)于行業(yè)而言,DeepSeek的案例再次證明:在AI競賽中,垂直突破、開放協(xié)作、長期主義仍是贏得競爭的關(guān)鍵。

全球資本重估中國科技企業(yè)

DeepSeek掀起的人工智能革命浪潮還改變了中國科技企業(yè)的估值敘事。

截至2025年2月12日,恒生科技指數(shù)ETF近1周累計(jì)上漲7.67%。2月13日,恒生指數(shù)再度高開0.46%,恒生科技指數(shù)漲0.77%。嗶哩嗶哩-W、網(wǎng)易-S、百度集團(tuán)-SW、中芯國際等漲超2%。

據(jù)中國證券報(bào)報(bào)道,高盛日前發(fā)布報(bào)告稱,中國人工智能(AI)企業(yè)深度求索(DeepSeek)的出現(xiàn)正激發(fā)投資者加速購買中國股票的熱情。同時(shí),高盛維持對(duì)明晟(MSCI)中國指數(shù)的超配評(píng)級(jí),預(yù)計(jì)該指數(shù)今年將上漲14%。

此前,中國科技企業(yè)一直普遍處于被低估的狀態(tài)中。大摩的一篇報(bào)告指出,全球投資者對(duì)中國科技企業(yè)的估值體系仍停留在傳統(tǒng)互聯(lián)網(wǎng)思維,未能充分反映其在前沿科技領(lǐng)域的突破。以騰訊、阿里為例,二者港股市盈率分別只有19和15,遠(yuǎn)遠(yuǎn)低于美股科技股的市盈率。

現(xiàn)在,DeepSeek真正成為了一條鯰魚。

美國針對(duì)DeepSeek的報(bào)道里,有一個(gè)高頻詞匯經(jīng)常出現(xiàn):“Sputnik Moment”,又名斯普特尼克時(shí)刻(該術(shù)語源于1957年10月4日蘇聯(lián)成功發(fā)射的 “斯普特尼克 1號(hào)”人造衛(wèi)星。這是人類歷史上第一顆人造地球衛(wèi)星,它的發(fā)射成功使蘇聯(lián)在太空領(lǐng)域取得了領(lǐng)先地位,讓美國意識(shí)到自己在科技,尤其是太空技術(shù)方面的落后,給美國帶來了巨大的危機(jī)感和緊迫感)。

這件事對(duì)當(dāng)時(shí)的美國沖擊很大,隨后1958年NASA成立,美國舉全國之力完成了登月,重新回到太空領(lǐng)域里面領(lǐng)先的地位,才拔掉了自己心頭的這根刺。而這次,在美國最核心的AI領(lǐng)域里,DeepSeek又扎進(jìn)去了一根新的刺。

本文來源:鳳凰科技

鳳凰科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢不可擋
    漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢不可擋

    作為美國百年家電品牌,HamiltonBeach漢美馳在美國市場處于行業(yè)領(lǐng)導(dǎo)地位,在本屆AWE展會(huì)上,漢美馳與太平洋網(wǎng)絡(luò)合作,展出了他們的三個(gè)主打品類:破壁機(jī)、慢燉鍋和空氣炸鍋,其中,破壁機(jī)屬于攪拌類小家電,漢美馳是這個(gè)品類的開創(chuàng)者;慢燉鍋是美國家庭的必需品,就像我們中國家庭的電飯煲一樣,漢美馳慢燉鍋累計(jì)在美國的銷量超過3000萬臺(tái),是這個(gè)品類的領(lǐng)導(dǎo)品牌;漢美馳的這款HALO空氣炸鍋剛剛獲得了全球頂級(jí)設(shè)計(jì)大獎(jiǎng)——iF設(shè)計(jì)獎(jiǎng)。 今年,漢美馳在國內(nèi)市場的動(dòng)作很多,包括:推出了家電行業(yè)第一款應(yīng)用chatGPT的AI牛排機(jī),全球首發(fā)煙灶產(chǎn)品,全球首發(fā)中式廚電產(chǎn)品,自建抖音、淘寶直播間,與頭部主播烈兒寶貝等合作……這些經(jīng)營動(dòng)作的背后,漢美馳有怎樣的戰(zhàn)略規(guī)劃?他們對(duì)中國市場有些什么樣的判斷?他們的優(yōu)勢有哪些?請(qǐng)看PConline獨(dú)家專訪漢美馳中國營銷中心總經(jīng)理李梟雄先生。

    呼倫 呼倫 2023-05-05 00:03
  • 二維碼 回到頂部
    国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av