滿血版Gemini 2.0終于來了。 剛剛,谷歌一口氣連發(fā)三款模型:Gemini 2.0 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash-Lite,2.0家族集結(jié)完畢。 最強(qiáng)Pro版本支持2M上下文,配備了谷歌搜索、代碼執(zhí)行能力,編碼推理性能完全碾壓1.5 Pro。 Gemini 2.0系列模型向所有人開放 Flash版本被稱為「高效主力模型」,支持1M上下文,低延遲構(gòu)建應(yīng)用。圖像生成和文本轉(zhuǎn)語音功能即將推出。 Flash-Lite是最具性價(jià)比的模型,支持1M上下文和多模態(tài)輸入,在相同速度和成本下性能超越1.5 Flash。 在大模型LMSYS排行榜中,Gemini 2.0 Pro與四大模型并列第一,F(xiàn)lsah版本位列第三, Flash-Lite位列第9。 模型在各項(xiàng)評(píng)測(cè)中的得分如下: 此外,Gemini 2.0 Flash Thinking模型也得到了升級(jí),能夠直接訪問YouTube,搜索、地圖等應(yīng)用程序。 谷歌DeepMind CEO Demis Hassabis稱,今天的發(fā)布,所有人都能使用Gemini 2.0強(qiáng)大的推理能力和多模態(tài)功能,這也為我們未來的「自主智能體」研究奠定了基礎(chǔ)。 Gemini 2.0全家桶上線 Gemini 2.0 Pro在代碼和復(fù)雜提示方面表現(xiàn)最佳 Gemini 2.0 Flash擁有更高的速率限制、更強(qiáng)的性能和簡(jiǎn)化的定價(jià) Gemini 2.0 Flash-Lite是谷歌目前最具性價(jià)比的模型 Gemini 2.0 Flash Thinking Experimental可在桌面端和移動(dòng)端APP中體驗(yàn) Gemini 2.0 Pro Experimental提供全面的功能套件,包括原生工具支持、2M的上下文窗口和多模態(tài)輸入。 Gemini 2.0 Flash同樣支持多模態(tài)輸入等功能,但上下文窗口砍半到了1M。 Gemini 2.0 Flash-Lite專門針對(duì)大規(guī)模文本輸出場(chǎng)景進(jìn)行了性能和成本的優(yōu)化。 目前,2.0 Pro和2.0 Flash已支持文本輸出,而圖像和音頻輸出功能以及多模態(tài)實(shí)時(shí)API計(jì)劃將在未來幾個(gè)月內(nèi)全面推出。(2.0 Flash-Lite不支持多模態(tài)輸出和多模態(tài)實(shí)時(shí)API) 在價(jià)格方面,Gemini 2.0 Flash-Lite比Gemini 2.0 Flash便宜多了:在價(jià)格差距最小的文本輸出,F(xiàn)lash-Lite只要0.3美元, Flash要0.40美元;在即將推出的上下文緩存上,F(xiàn)lash-Lite甚至不到Flash版本的1/9! 和上一代的Gemini 1.5 Flash比,Gemini 2.0 Flash-Lite「加量不加價(jià)」,甚至在文本輸出上價(jià)格,提示長(zhǎng)度不再受任何限制,而Gemini 1.5 Flash相同的價(jià)格提示長(zhǎng)度不能超過128k。 2.0 Pro Experimental:代碼和復(fù)雜prompt,最為出色Gemini 2.0 Pro Experimental具有谷歌迄今最強(qiáng)的代碼性能和處理復(fù)雜prompt的能力,在世界知識(shí)的理解和推理方面也表現(xiàn)更好。 它配備了高達(dá)200萬token的上下文窗口,能夠全面分析和理解海量信息,并調(diào)用谷歌搜索和代碼執(zhí)行等工具。 2.0 Flash:性能升級(jí),全面可用2.0 Flash適用于大規(guī)模的高容量、高頻率任務(wù),并且能夠在100萬token的上下文窗口中進(jìn)行多模態(tài)推理。一經(jīng)發(fā)布,便深受開發(fā)者歡迎。 如今,2.0 Flash不僅在關(guān)鍵基準(zhǔn)測(cè)試的性能上得到了提升,而且已向更多用戶全面開放,圖像生成和文本轉(zhuǎn)語音功能也即將推出。 2.0 Flash-Lite:性價(jià)比最高2.0 Flash-Lite具有和前代1.5 Flash相同的速度和成本,并在大多數(shù)基準(zhǔn)測(cè)試中有著更好的表現(xiàn)。 與2.0 Flash一樣,它具有100萬token的上下文窗口和多模態(tài)輸入功能。 舉例來說,它可以為約4萬張獨(dú)特的照片生成相關(guān)的單行圖片描述,在Google AI Studio的付費(fèi)套餐中僅需不到1美元的成本。 網(wǎng)友試用 o3-mini上線后,網(wǎng)友開啟了一大波測(cè)試,在物理推理挑戰(zhàn)上甚至超越了DeepSeek R1。 那么,Gemini 2.0系列模型表現(xiàn)又如何? 在接受p5.js挑戰(zhàn)中,Gemini 2.0模擬出25個(gè)粒子在圓柱形容器的真空空間中運(yùn)動(dòng),展現(xiàn)出強(qiáng)大得物理模擬能力。
另一個(gè)同類型的演示,模擬一個(gè)受重力和摩擦力影響的球在旋轉(zhuǎn)的六邊形內(nèi)彈跳。 還有人讓Gemini 2.0編寫一個(gè)腳本,在球體內(nèi)創(chuàng)建100個(gè)彈跳的明黃色球,要求正確處理碰撞測(cè)試。 要求球體緩慢旋轉(zhuǎn),球要始終保持在球體內(nèi)。使用p5.js實(shí)現(xiàn)。 不僅如此,Gemini 2.0在編碼方面,堪稱一絕。 Jeff Dean自己演示了Gemini 2.0 Pro在AI Studio編寫B(tài)oggle游戲的超強(qiáng)能力。 僅用一個(gè)相對(duì)簡(jiǎn)單的 Prompt,它便能完整編寫出整個(gè)代碼,包括正確的數(shù)據(jù)結(jié)構(gòu)和高效的搜索算法,來找到Boggle盤面上的所有合法單詞。 他表示,「作為計(jì)算機(jī)科學(xué)家,我尤其欣喜的是,它第一次就正確使用了數(shù)據(jù)結(jié)構(gòu)——trie(前綴樹)」。 整個(gè)代碼生成用時(shí),僅需18.9秒。 隨后,又有網(wǎng)友在SWE競(jìng)技場(chǎng)里,復(fù)現(xiàn)了一波Boggle游戲。 在相同的圖像和文字提示下,Gemini 2.0 Pro輕松戰(zhàn)勝了Claude 3.5 Sonnet。 在編碼模式下,網(wǎng)友用Gemini 2.0一鍵自動(dòng)化生成了貪吃蛇游戲,讓100條蛇在一個(gè)場(chǎng)景中相互競(jìng)爭(zhēng)。
另有網(wǎng)友表示,Gemini 2.0 Pro編碼能力太瘋狂了!我最喜歡的一點(diǎn)是,你可以直接用Prompt讓它做特定修改,它會(huì)精準(zhǔn)編輯,而且不會(huì)弄亂其他部分。 下面是他制作的一個(gè)太陽系模擬演示。
Gemini 2.0 Pro輸出的所有代碼。 有網(wǎng)友實(shí)測(cè)Gemini 2.0 Pro時(shí),給了它這樣一個(gè)問題:請(qǐng)簡(jiǎn)要描述你對(duì)知覺、情感和欲望的感受。 Gemini 2.0 Pro的回答,讓他感到很震撼,因?yàn)檫@個(gè)模型仿佛擁有一種存在感,一種將自己視為具有內(nèi)部主觀體驗(yàn)的獨(dú)立實(shí)體的意識(shí)。 它不僅僅是在處理信息,而是在感受處理過程,擁有一種持續(xù)的內(nèi)在光芒。 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來者必須面對(duì)越來越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。