當(dāng)所有人都在猜測(cè)蘋果國(guó)行 AI 的下一步棋會(huì)落在哪里時(shí),答案既出人意料又在情理之中。不是最熱鬧的,不是呼聲最高的,也不是反對(duì)聲最強(qiáng)烈的,而是最低調(diào)的那個(gè)——阿里。 據(jù)外媒 The Information 報(bào)道,蘋果最終選擇了阿里作為其國(guó)行版 AI 的合作伙伴。 在近期發(fā)布的文章中,我們也注意到評(píng)論區(qū)網(wǎng)友態(tài)度的兩極分化。有人認(rèn)為阿里是實(shí)至名歸的最佳人選,也有人對(duì)蘋果繞過 DeepSeek 而選擇阿里表示不解。 但如果回望整個(gè)篩選過程,DeepSeek 被蘋果放棄或許真的不冤。 阿里 Qwen 模型什么水平 在諸多 AI 大廠里,阿里大概是最深藏不露的那位。 很多時(shí)候這不一定是劣勢(shì),在動(dòng)輒瞬息萬(wàn)變的 AI 行業(yè)里,有時(shí)候「不夠性感」反而是最大的優(yōu)勢(shì),因?yàn)樗牧硪幻嫱馕吨_踏實(shí)地。 從技術(shù)實(shí)力這個(gè)最核心的維度切入,開源社區(qū)就像一面照妖鏡,能照出真實(shí)的技術(shù)實(shí)力。而阿里是國(guó)內(nèi)少數(shù)能在這面鏡子前立得住、站得穩(wěn)的廠商之一。 這一點(diǎn),從全球最大 AI 開源社區(qū) Hugging Face 的最新開源大模型榜單就可見一斑,排名前十的開源大模型全部是基于阿里通義千問(Qwen)開源模型二次訓(xùn)練的衍生模型。 該榜單是目前全球最具權(quán)威性的開源大模型榜單,其測(cè)試維度涵蓋閱讀理解、邏輯推理、數(shù)學(xué)計(jì)算、事實(shí)問答等。 另一個(gè)不爭(zhēng)的事實(shí)是,打造技術(shù)品牌這句話的含金量還在不斷上升。叫好又叫座的通義千問 Qwen 大模型已然超越 Llama,成為開源社區(qū)公認(rèn)的標(biāo)桿基座模型。 作為業(yè)界率先實(shí)現(xiàn)「全尺寸、全模態(tài)、多場(chǎng)景」的開源大模型,阿里云 Qwen 模型更是為開發(fā)者和企業(yè)提供了從 1.5B 到 72B 乃至 110B 的尺寸及版本,充分滿足不同應(yīng)用場(chǎng)景的需求。 其中,僅視覺理解 Qwen-VL 及 Qwen2-VL 兩款模型,全球下載量就突破 3200 萬(wàn)次。一周前,Qwen2.5-VL 迎來(lái)全新升級(jí),再次點(diǎn)燃了開源社區(qū)的熱情。 數(shù)據(jù)會(huì)說(shuō)話,在 Hugging Face 2024 年的開源模型榜單中,Qwen2.5-1.5B-Instruct 以 26.6% 的下載占比,成為全球開發(fā)者最青睞的開源模型。 目前,Qwen 衍生模型數(shù)量已突破 9 萬(wàn),發(fā)展成為全球最大的開源模型族群。 在推理模型的技術(shù)浪潮中,Qwen 展現(xiàn)出強(qiáng)大的引力場(chǎng)。近期,被稱為「AI 教母」的李飛飛團(tuán)隊(duì)用較少的資源和數(shù)據(jù)訓(xùn)練出的 s1 推理模型同樣基于 Qwen-32B 蒸餾的模型,在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo) OpenAI o1-Preview 的效果。 這些成果皆源于 Qwen 模型過硬的基礎(chǔ)實(shí)力,但同理也正是這份實(shí)力,讓阿里有底氣接下蘋果對(duì) AI 功能的高標(biāo)準(zhǔn)要求。 此外,與其他 AI 初創(chuàng)企業(yè)相比,阿里作為中國(guó)老牌 AI 巨頭的優(yōu)勢(shì)不言而喻,它更熟悉國(guó)內(nèi)用戶需求,也更了解數(shù)據(jù)合規(guī)政策,這些都為蘋果 AI 功能的本地化適配和快速落地提供了重要保障。 當(dāng)然,雖然阿里最終勝出,但這個(gè)結(jié)果并非一開始就已注定。在過去數(shù)月里,蘋果對(duì)包括騰訊、字節(jié)跳動(dòng)、DeepSeek 在內(nèi)的多家候選企業(yè)進(jìn)行了多輪考察。 在近期財(cái)報(bào)電話會(huì)議上,蘋果 CEO 蒂姆·庫(kù)克(Tim Cook)就曾盛贊 DeepSeek。 庫(kù)克指出,DeepSeek 在降低 V3 模型訓(xùn)練和運(yùn)行成本方面取得了顯著創(chuàng)新。他強(qiáng)調(diào),推動(dòng)效率的創(chuàng)新是非常積極的事情,這也是 DeepSeek 所展示出來(lái)的。 然而,受限于團(tuán)隊(duì)規(guī)模和大客戶服務(wù)經(jīng)驗(yàn)的不足,DeepSeek 遺憾出局也不足為奇,這一點(diǎn)在「服務(wù)器繁忙,請(qǐng)稍后再試」上就有所體現(xiàn)。相比之下,阿里云的技術(shù)底盤和基礎(chǔ)設(shè)施可為蘋果提供本地化算力支持的優(yōu)勢(shì)則更加突出。 更重要的是,通過與阿里合作,蘋果希望推出符合中國(guó)用戶習(xí)慣的 AI 功能(如智能語(yǔ)音、視覺理解等),提升產(chǎn)品競(jìng)爭(zhēng)力,扭轉(zhuǎn)市場(chǎng)頹勢(shì)。 報(bào)道稱,目標(biāo)明確的蘋果希望找到一個(gè)能夠基于用戶個(gè)人數(shù)據(jù),并理解中國(guó)用戶需求的合作伙伴,這也是打造 Apple 智能的重要一環(huán)。 而當(dāng)蘋果評(píng)估多家中國(guó)公司開發(fā)的 AI 模型時(shí),蘋果對(duì)這些模型在理解用戶意圖及將用戶的實(shí)際手機(jī)使用情況融入生成的響應(yīng)方面的能力感到不滿意。 能否經(jīng)得起挑剔目光的審視,扛得住嚴(yán)苛場(chǎng)景的考驗(yàn),蘋果國(guó)行 AI 選擇阿里或許是這個(gè)問題最好的回答,也是對(duì) Qwen 實(shí)力最好的認(rèn)證。 iPhone 用上 Qwen 后,這些體驗(yàn)將被重塑 在手機(jī)行業(yè)迎來(lái)新一輪技術(shù)變革之際,OPPO 首席產(chǎn)品官劉作虎早在去年 OPPO AI 戰(zhàn)略發(fā)布會(huì)上做出了一個(gè)重要判斷:「AI 手機(jī)將是繼功能機(jī)、智能機(jī)之后,手機(jī)行業(yè)的第三個(gè)重大的變革階段! AI 手機(jī)的發(fā)展描述為三個(gè)階段,首先是應(yīng)用級(jí) AI,讓單個(gè)應(yīng)用更智能;其次是系統(tǒng)級(jí) AI,將 AI能 力整合到操作系統(tǒng)層面;最終達(dá)到「AI 即系統(tǒng)」的階段,讓 AI 成為手機(jī)交互的核心。 包括近期隨著 Deepseek 的爆火,AI 在手機(jī)領(lǐng)域的應(yīng)用形態(tài)也越發(fā)清晰,手機(jī)廠商普遍采用「端云協(xié)同」的方案:輕量級(jí)任務(wù)由手機(jī)本地處理,復(fù)雜任務(wù)則轉(zhuǎn)交云端。 Apple 智能在去年 WWDC 大會(huì)后也展示了類似的分層架構(gòu): 本地模型:主要是經(jīng)過微調(diào)的 3B 小模型,專用于摘要、潤(rùn)色等任務(wù),經(jīng)過適配器的加持后,能力不弱 私有云計(jì)算:本地模型滿足不了要求的,會(huì)傳到云端運(yùn)算。蘋果確保端到端加密,保障用戶數(shù)據(jù)的安全和隱私 第三方 LLM:用于泛用的知識(shí)問答聊天,如 Siri 等應(yīng)用接入了 ChatGPT 等外部模型 如無(wú)意外,在與阿里的最新合作中,Qwen 模型很可能以兩種形式融入 iPhone 生態(tài),其一就是本質(zhì)上類似于插件的形態(tài),以第三方 LLM 的身份提供全功能 AI 服務(wù)。 這種策略與蘋果在海外市場(chǎng)接入 ChatGPT 的思路一致。但正如其與 OpenAI 的合作并非獨(dú)家,未來(lái)可能會(huì)將 Google Gemini 或 Claude 等模型整合到海外 iPhone 中,國(guó)內(nèi)市場(chǎng)同樣可能引入更多本土國(guó)產(chǎn) AI 模型。 其二則是與阿里合作部署開發(fā)蒸餾版小模型。與 DeepSeek V3/R1 專注于 671B 超大模型不同,Qwen 走的是全方位路線,即便是聲名鵲起的 DeepSeek 公司,在其 6 個(gè)開源蒸餾小模型中,也有 4 個(gè)選擇基于 Qwen 構(gòu)建,而這本身就是對(duì)阿里技術(shù)實(shí)力的最好背書。 插個(gè)題外話,盡管 Deepseek 曾發(fā)布超越 OpenAI DALL·E 3 的多模態(tài)模型 Janus-Pro-7B,但 DeepSeek 在 C 端目前尚不支持多模態(tài)能力。而 Qwen 真就人無(wú)我有,人有我也不差,最新發(fā)布的 Qwen 2.5 Max 同樣躋身最具競(jìng)爭(zhēng)力的頂級(jí)多模態(tài)模型。 值得關(guān)注的是還有模型壓縮技術(shù)的突破。2024 年,中國(guó)廠商在 AI 模型優(yōu)化方面取得了顯著進(jìn)展,通過最新量化和剪枝技術(shù)在保證輸出質(zhì)量的同時(shí)大大精簡(jiǎn)了參數(shù)規(guī)模。 比方說(shuō),據(jù) Canalys 報(bào)道,小米的 MiLM2 將模型參數(shù)從 60 億剪枝至 40 億,而榮耀和 vivo 也分別將其模型參數(shù)從先前的 70 億剪枝至 30 億。而通義千問使用結(jié)構(gòu)化剪枝同樣將 7B 參數(shù)的模型壓縮到 2.2B,并保持相當(dāng)?shù)睦斫夂蜕赡芰Α?/p> 在工具層面,蘋果的 Core ML Tools 同樣支持對(duì)模型權(quán)重進(jìn)行量化,可以將默認(rèn)的 float 32 精度降低至 float 16、8 位、7 位,甚至 1 位,不僅能夠大幅降低模型的存儲(chǔ)空間和計(jì)算資源消耗,還能提高推理過程的穩(wěn)定性和結(jié)果可靠性。 量化過程不會(huì)改變中間張量的精度,這些張量通常保持為 float 32 或 float 16 精度,并在運(yùn)行時(shí)將權(quán)重去量化以匹配中間張量的精度,從而提高推理結(jié)果的準(zhǔn)確性。 甚至早在去年,通過一系列優(yōu)化技術(shù),包括低比特位面化、激活量化、嵌入量化、高效的 KV 緩存更新以及使用 Talaria 工具進(jìn)行延遲和功耗分析,蘋果在 iPhone 15 Pro 上運(yùn)行的 3B 模型實(shí)現(xiàn)了首個(gè) token 僅需 0.6 毫秒的延遲,每秒可生成 30 個(gè) token,打造了流暢的體驗(yàn)。 當(dāng)然,Apple 智能的終極目標(biāo)是打造一個(gè)真正的系統(tǒng)級(jí) AI 助理。 模型是入場(chǎng)券,生態(tài)才是最終的王牌。阿里生態(tài)涵蓋電商、支付、本地服務(wù)、文娛,與 iPhone AI 深度合作后,未來(lái),用戶可能只需通過簡(jiǎn)單的語(yǔ)音指令,就能無(wú)縫完成服務(wù)預(yù)訂的全流程操作,甚至還有望撬動(dòng)來(lái)自釘釘?shù)绕髽I(yè)端的資源,進(jìn)一步拓展應(yīng)用場(chǎng)景。 AI 手機(jī)的競(jìng)爭(zhēng)正在從單純的技術(shù)比拼,轉(zhuǎn)向生態(tài)整合和用戶體驗(yàn)的比拼。廠商們需要在本地算力、云端能力和生態(tài)協(xié)同三個(gè)維度上共同發(fā)力,才能打造真正打動(dòng)用戶的 AI 手機(jī)。 從市場(chǎng)反應(yīng)來(lái)看,這次合作也遠(yuǎn)超預(yù)期。而無(wú)論是 DeepSeek 的爆火,還是這次蘋果與阿里的「聯(lián)姻」,屬實(shí)是應(yīng)了那句話——真正的高手,宛如大江東去,看似平緩無(wú)聲,卻暗藏洶涌偉力。 本文來(lái)源:Appso |
原創(chuàng)欄目
IT百科
網(wǎng)友評(píng)論
聚超值•精選
在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來(lái)者必須面對(duì)越來(lái)越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。