首頁(yè) > 科技要聞 > 科技> 正文

Perplexity免費(fèi)推出Deep Research:性能超過(guò)R1、o3-mini等,CEO:感謝DeepSeek

量子位 整合編輯:太平洋科技 發(fā)布于:2025-02-17 15:55

AI搜索“老大哥”Perplexity,剛剛也推出了自家的Deep Research——

隨便給個(gè)話題,就能生成有深度的研究報(bào)告。

先來(lái)劃個(gè)重點(diǎn):免費(fèi)向所有人開(kāi)放!

具體來(lái)說(shuō),非訂閱用戶(hù)每天最多可查詢(xún)5次,Pro用戶(hù)每天可查詢(xún)500次。

然后啊,效果是醬紫的。

例如給出一個(gè)問(wèn)題:

What should I know before the market opens?
開(kāi)市前我該知道些什么?

在Deep Research加持下的Perplexity先是會(huì)查找海量的資料

接下來(lái)是推理過(guò)程,用Perplexity的話來(lái)說(shuō)就是專(zhuān)家級(jí)別的分析

對(duì)原始材料進(jìn)行充分評(píng)估之后,Perplexity就會(huì)將所有研究綜合成一份清晰而全面的報(bào)告

最后,你還可以把Perplexity寫(xiě)好的專(zhuān)業(yè)報(bào)告一鍵導(dǎo)出,格式包括PDF、Markdown和Perplexity Page:

性能方面,Perplexity官方也給出了他們的測(cè)試結(jié)果。

他們采用的基準(zhǔn),是最近考驗(yàn)AI推理能力大火的Humanity’s Last Exam(人類(lèi)的最后考試),準(zhǔn)確率達(dá)到了20.5%

(注:“人類(lèi)的最后考試”涵蓋100多個(gè)科目、包含3000多個(gè)問(wèn)題,涉及數(shù)學(xué)、科學(xué)、歷史和文學(xué)等領(lǐng)域。)

從成績(jī)上來(lái)看,是優(yōu)于Gemini Thinking、o3-mini、o1、DeepSeek-R1和其他許多主流模型。

在另一項(xiàng)SimpleQA(一個(gè)包含數(shù)千個(gè)測(cè)試事實(shí)性的問(wèn)題庫(kù))的測(cè)試中,Perplexity Deep Research的表現(xiàn)更是明顯遠(yuǎn)超領(lǐng)先模型,達(dá)到了93.9%的準(zhǔn)確率。

更重要的一點(diǎn)是,Perplexity的Deep Research有夠快——平均在3分鐘內(nèi)可以完成大多數(shù)研究任務(wù)。

對(duì)此,Perplexity的CEO(Aravind Srinivas)公開(kāi)致謝DeepSeek

這是因?yàn)镈eepSeek是開(kāi)源的,又便宜又快。

其實(shí)在10天前的一條推文中,Aravind Srinivas其實(shí)已經(jīng)有所劇透:

在推文下方的評(píng)論中,我們也看到了不少關(guān)于DeepSeek的身影:

不得不說(shuō),DeepSeek的含金量還在上升。

實(shí)測(cè)Perplexity的Deep Research

Perplexity新功能的操作方式也是極其簡(jiǎn)單。

只需在搜索框下方的選項(xiàng)中pick一下Deep Research即可:

從官方展示的案例來(lái)看,Deep Research擅長(zhǎng)在金融、市場(chǎng)營(yíng)銷(xiāo)和技術(shù)等領(lǐng)域的深度研究,并且在健康、產(chǎn)品研究和旅行計(jì)劃等領(lǐng)域作為個(gè)人顧問(wèn)同樣有用。

例如在默認(rèn)搜索和Deep Research下,同時(shí)問(wèn):

What’s the best strategy for advertising at the Super Bowl? Analyze the ROI of each major advertiser at the 2025 Super Bowl. Which brands were the biggest winners and losers? What ad techniques were most and least effective? If I wanted to advertise at the 2026 Super Bowl, what should I do to maximize success?
在超級(jí)碗(Super Bowl)投放廣告的最佳策略是什么?分析2025年超級(jí)碗上每個(gè)主要廣告商的投資回報(bào)率(ROI)。哪些品牌是最大的贏家和輸家?哪些廣告技巧最有效和最無(wú)效?如果我想在2026年超級(jí)碗上投放廣告,我該怎么做才能最大限度地取得成功?

可以看到,Deep Research給出的答案更像是一個(gè)專(zhuān)業(yè)的報(bào)告。

先是以類(lèi)似論文“摘要”的形式,把問(wèn)題的核心亮點(diǎn)全部提煉、總結(jié)出來(lái),然后再撰寫(xiě)并展開(kāi)包括Introduction在內(nèi)的更多內(nèi)容。

同樣的,讓Deep Research完成撰寫(xiě)“黃仁勛傳記”,從輸出內(nèi)容和格式來(lái)看,是更加清晰且一目了然:

現(xiàn)在,也有很多網(wǎng)友開(kāi)始在網(wǎng)上po出自己實(shí)測(cè)的效果。

例如讓Perplexity做下面這個(gè)任務(wù):

compile a research report on how has retail industry changed in the last 3 years.
編寫(xiě)一份關(guān)于過(guò)去3年零售業(yè)變化的研究報(bào)告。

然后這位網(wǎng)友還總結(jié)了一下Deep Research和普通AI搜索功能的區(qū)別:

普通搜索為簡(jiǎn)單的查詢(xún)提供快速的、表面的信息。它適用于查找基本事實(shí)或獲得簡(jiǎn)短的摘要。另一方面,Deep Research是為需要深入分析的復(fù)雜、多層次的查詢(xún)而設(shè)計(jì)的。

正常的搜索通常會(huì)在幾秒鐘內(nèi)產(chǎn)生結(jié)果。Deep Research是一個(gè)更耗時(shí)的過(guò)程,需要5到30分鐘才能完成。

但,好多“Deep Research”啊

除了效果之外,對(duì)于Perplexity發(fā)布的Deep Research,網(wǎng)友們還有另外一個(gè)熱議的焦點(diǎn)——名字。

例如有網(wǎng)友就直接提出了自己的困惑:

Deep Research是你們能想到的唯一的名字了嗎?


其實(shí)這也不怪網(wǎng)友們提出這樣的質(zhì)疑。

因?yàn)椤F(xiàn)在有太多叫Deep Research的產(chǎn)品了……

2024年12月,谷歌發(fā)布Deep Research

2025年2月,OpenAI發(fā)布Deep Research

2025年2月,Perplexity發(fā)布Deep Research

AI的問(wèn)題,我們就讓AI來(lái)回答。

Perplexity在回答中總結(jié)出了一個(gè)表格:

CEO對(duì)此也給出了自己的答案,一言蔽之,就是“快好省”,不過(guò)他順便還陰陽(yáng)了一波OpenAI:

我們每月不用200美元。

最后,CEO還預(yù)告了一則消息,下周Perplexity還有一個(gè)很cool的東西要發(fā)布。

參考鏈接:
[1]https://x.com/perplexity_ai/status/1890452005472055673
[2]https://x.com/perplexity_ai/status/1890452359773405675
[3]https://x.com/AravSrinivas/status/1890486069361025040

本文來(lái)源:量子位

量子位

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 二維碼 回到頂部
    国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av