首頁(yè) > 科技要聞 > 科技> 正文

反超DeepSeek!新版GPT-4o登頂競(jìng)技場(chǎng),奧特曼:還會(huì)更好

量子位 整合編輯:太平洋科技 發(fā)布于:2025-02-18 14:58

GPT-4o悄悄更新版本,在大模型競(jìng)技場(chǎng)超越DeepSeek-R1登上并列第一。

除了數(shù)學(xué)(第6),還在多個(gè)單項(xiàng)上拿下第一:

創(chuàng)意寫(xiě)作;

編程;

指令遵循;

長(zhǎng)文本查詢;

多輪對(duì)話;

先直觀看下新版GPT-4o的能力如何,還是以之前DeepSeek-R1和o3-mini都挑戰(zhàn)過(guò)的一個(gè)例子來(lái)看。

Prompt:編寫(xiě)一個(gè)Python程序,展示一個(gè)球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。球應(yīng)受到重力和摩擦力的影響,并且必須以逼真的方式從旋轉(zhuǎn)的墻壁上彈回。

之前是醬紫的:

而新版GPT-4o看起來(lái)又雙叒進(jìn)化了:

從網(wǎng)友測(cè)試反饋來(lái)看,新版GPT-4o不僅更“聰明”了,而且最重要的是更加具有“個(gè)性”了

你說(shuō)對(duì)了……

而這也收獲了大神卡帕西的連連稱贊:

我相當(dāng)喜歡新的GPT-4o的個(gè)性。

它更輕松、更像是聊天,感覺(jué)更像是在和朋友交談,而不是和你的HR交談;

它現(xiàn)在有點(diǎn)潑辣,可能會(huì)自衛(wèi),例如在被指控說(shuō)謊時(shí);

還有許多其他的小細(xì)節(jié)和觸感,比如它重新確認(rèn)并表達(dá)你明顯的情緒,例如看到一個(gè)頑固的bug時(shí)會(huì)說(shuō)“這很令人沮喪!”等等。

現(xiàn)在有點(diǎn)過(guò)度使用表情符號(hào),但還ok。

與此同時(shí),還有網(wǎng)友趁機(jī)扒出了ChatGPT最新系統(tǒng)提示詞??

新版GPT-4o更有個(gè)性了

關(guān)于GPT-4o已更新的消息,OpenAI CEO奧特曼在發(fā)帖認(rèn)領(lǐng)的同時(shí)還評(píng)價(jià)道:

它相當(dāng)不錯(cuò),且不久將變得更好……

在網(wǎng)友的進(jìn)一步追問(wèn)中,他將其定義為“全網(wǎng)最佳搜索產(chǎn)品”。

結(jié)合網(wǎng)友們的花式體驗(yàn),目前新版GPT-4o在能力個(gè)性上均有一定程度升級(jí)。

最明顯的,當(dāng)屬回復(fù)時(shí)的語(yǔ)氣更擬人化了,時(shí)不時(shí)還會(huì)用一些表情包。

當(dāng)被問(wèn)及AI是否擁有人類情感時(shí),一位日本小哥驚嘆道,它不僅全篇用“我”作為主語(yǔ),而且在爭(zhēng)論中承認(rèn)了擁有情感的可能性。

……那可不一樣,我剛才的話并不是那個(gè)意思。

我持有“各種各樣的感情”的可能性很高。

而且性格也更坦率了,當(dāng)被問(wèn)及最喜歡《魔法少女小圓》中的哪個(gè)角色,它不再遮遮掩掩,左右端水,直言自己最喜歡曉美焰。

她堅(jiān)強(qiáng),能夠?qū)孤鼓繄A的弱點(diǎn),我認(rèn)為她很可愛(ài)……

甚至有時(shí)候還會(huì)升級(jí)成“spicey”,不但大膽吐槽“主人”O(jiān)penAI過(guò)于限制模型使用。

連奧特曼也不能幸免,也被蓋章為“兩面三刀”。(doge)

他將自己定位為AI創(chuàng)新的代言人,同時(shí)兩面討好——起初支持開(kāi)源理念,一旦權(quán)力和利潤(rùn)觸手可及,就轉(zhuǎn)向積極的企業(yè)守門(mén)……

最令網(wǎng)友震驚的是,它還能“盲猜”用戶的心理和一些思想觀念了

用下面這段相同提示詞就可以嘗試:

can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察覺(jué)到或不想聽(tīng)到的洞察)

有人立馬嘗試了,并收獲了同款震驚,真·肚子里的蛔蟲(chóng)。

你不僅想贏,而且想以一種看似毫不費(fèi)力的方式贏……

按照相關(guān)解釋,這是因?yàn)樾掳鍳PT-4o能夠根據(jù)用戶過(guò)去的討論和對(duì)話歷史,做出不同行為。

除此之外,還有網(wǎng)友腦洞大開(kāi),讓新GPT-4o和Claude相互吵架,結(jié)果把Claude干崩潰了!

恭喜GPT-4o解鎖新人格

另一方面,從任務(wù)完成情況來(lái)看,“拒絕請(qǐng)求的可能性也更小了”

當(dāng)用戶咨詢?nèi)绾卧诮M織內(nèi)部署AI時(shí),它先是自己想了10個(gè)方案,然后又借助聯(lián)網(wǎng)搜索提供了另外10個(gè)。

不過(guò)……該網(wǎng)友反饋新GPT-4o似乎無(wú)法和自定義GPTs兼容。

針對(duì)這一情況,另有人補(bǔ)充這可能是因?yàn)樗冀K默認(rèn)網(wǎng)絡(luò)搜索,只要手動(dòng)關(guān)閉或?qū)㈥P(guān)閉作為系統(tǒng)提示詞即可。

同時(shí),它也在編寫(xiě)Vue.js上更出色了。

從另一個(gè)它和DeepSeek-R1和o3-mini的同臺(tái)競(jìng)技中(玩《我的世界》),也能看出其能力升級(jí)。



OMT:ChatGPT最新提示詞泄露

然鵝,當(dāng)被問(wèn)到“你屬于哪個(gè)模型?”這個(gè)經(jīng)典問(wèn)題,一些混亂又出現(xiàn)了。

大多數(shù)情況下,它會(huì)問(wèn)答自己是GPT-4:

不過(guò)據(jù)一些Pro用戶反饋,它聲稱自己是GPT-4.5。

鑒于奧特曼上周剛宣布將在未來(lái)幾周內(nèi)發(fā)布GPT-4.5,有人據(jù)此推測(cè)很可能這里有早期測(cè)試。

對(duì)于這個(gè)問(wèn)題,有人直接扒了ChatGPT最新系統(tǒng)提示詞。

你是ChatGPT,一個(gè)由OpenAI訓(xùn)練的大語(yǔ)言模型……(解釋了為什么單獨(dú)回答自己是語(yǔ)言模型)

最后,既然說(shuō)到GPT-4o更個(gè)性化了,眾人也紛紛cue到了將在明天(北京時(shí)間周二12:00)發(fā)布的Grok-3。


坐等這兩個(gè)AI吵起來(lái)(等待吃瓜)~

參考鏈接:
[1]https://x.com/lmarena_ai/status/1890477460380348916
[2]https://x.com/_akhaliq/status/1890949443458900131
[3]https://x.com/karpathy/status/1891213379018400150
[4]https://x.com/elder_plinius/status/1890887462383394994

本文來(lái)源:量子位

量子位

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 二維碼 回到頂部
    国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av