安徽蕪湖,成了中國大模型行業(yè)乃至AI產業(yè)的關注焦點。 這里并非是數(shù)據(jù)中心傳統(tǒng)意義上的集聚地,如今成為全國十大數(shù)據(jù)中心集群之一和國家“東數(shù)西算”的重要節(jié)點,三大運營商、華為、中科曙光、字節(jié)跳動等15個龍頭企業(yè)數(shù)據(jù)中心項目落子集群起步區(qū)。 6月14日,華為云華東(蕪湖)數(shù)據(jù)中心成為該集群首個開服的項目,自然受到了額外的關注。 一方面,這是在東數(shù)西算和大模型背景下,觀測蕪湖乃至中國智算產業(yè)的一個絕佳窗口;另一方面,安徽蕪湖與貴州貴安、內蒙古烏蘭察布三大數(shù)據(jù)中心,是華為最高規(guī)格、最大規(guī)模、最新技術的數(shù)據(jù)中心,構成了華為云的算力“鐵三角”。 有心者可能還記得一個時間點,2018年,華為輪值董事長徐直軍首次發(fā)布華為AI戰(zhàn)略與全棧全場景AI解決方案,其中包括全球首個覆蓋全場景人工智能的華為Ascend(昇騰)系列芯片以及基于華為Ascend(昇騰)系列芯片的產品和云服務。 當時大模型還遙遙無期,華為的AI戰(zhàn)略不可謂不超前,而且華為沒有把人工智能定位為新業(yè)務,更多定位為一種使能技術,用全棧全場景的能力,支撐所有企業(yè)探索人工智能。 全場景,是指包括公有云、私有云、各種邊緣計算、物聯(lián)網(wǎng)行業(yè)終端以及消費類終端等部署環(huán)境;全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。 如果按照正常的產業(yè)發(fā)展方向,華為本該早已完成AI全棧戰(zhàn)略布局。但是2019年的“制裁事件”,打亂了華為所有的節(jié)奏,也給國內算力產業(yè)敲響了警鐘。 行業(yè)內外一度懷疑,華為還能不能活下來,AI戰(zhàn)略似乎也難以實現(xiàn)。 華為云蕪湖數(shù)據(jù)中心開服的意義遠超一個數(shù)據(jù)中心本身,它標志著華為云全國存算網(wǎng)云核心樞紐布局全面完成,繼而成為華為AI全棧能力的錨點,也在宣告——華為六年前吹過的“!,正在一步步兌現(xiàn)。 通用目的技術,缺失的一環(huán) 技術進步是經(jīng)濟增長的源泉,而長期的經(jīng)濟增長是由少數(shù)幾種關鍵技術所推動的,經(jīng)濟學家稱之為“通用目的技術” ,蒸汽機、電力、內燃機和數(shù)字技術,就是四種最典型、最重要的通用目的技術。 不同于此前蒸汽機驅動了第一次工業(yè)革命,單一技術的作用更大,有學者認為,數(shù)字技術曾以計算機和互聯(lián)網(wǎng)為典型代表,目前已從過去的單點突破進入多技術協(xié)同推進、群體性演變的爆發(fā)期,呈現(xiàn)出擴散速度加快、迭代周期縮短的特點。 前幾年云計算和大數(shù)據(jù)、物聯(lián)網(wǎng)等技術如火如荼,在如今的人工智能面前卻遜色不少,說明即便同屬于通用目的技術,也有主次之分。 華為早有預判:人工智能是一組技術集合,是一種新的通用目的技術,不僅可以使我們以更高的效率解決已解決的問題,也可以解決很多沒有解決的問題。 其中值得思考的是,華為并沒有將云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術視作通用目的技術,而是置于人工智能的技術集合中。 圖片系AI生成 根據(jù)技術代差遞補性(Technical Generation Complementary)理論,當一項具有代差的全新技術出現(xiàn)時,由于它自身的不完備性,往往需要現(xiàn)有技術作為其補充,與之形成在技術上的“高低搭配”,因此新技術并不能夠完全取代現(xiàn)有技術而主宰整個市場。 比如,固定電話的出現(xiàn)并沒有立刻導致電報的出局,但移動電話的出現(xiàn)卻直接將電報三振出局;再如五代戰(zhàn)機與四代戰(zhàn)機形成高低搭配,淘汰三代機等。 這也就啟示我們,人工智能是新的代差技術,云計算等則是承載人工智能的底座,當人工智能與現(xiàn)有技術形成高低搭配的全棧組合,它的價值才能徹底釋放。 雖然如何供應大模型算力,業(yè)界目前尚未統(tǒng)一,有私有云、公有云等多種方式,但最終都在走向云計算的技術架構,例如全球多地、多活、多架構,離線在線混布、容器化部署等。 海外公有云和AI也在趨近,典型如OpenAI和微軟,AWS和一眾大模型創(chuàng)企,都說明了云計算成為補足AI技術代差的關鍵,中國市場的特殊之處,就是缺失了芯片層。 每一次通用目的技術的發(fā)展,舊有巨頭總會面臨淘汰危局,新的明星企業(yè)總會異軍突起,越早轉身,越早抓住機會的企業(yè),才能收集到盡可能多的籌碼。然而,當這些企業(yè)準備轟轟烈烈擁抱新時代時,有一重問題難以避開,和華為6年前AI戰(zhàn)略轉型相似,在人工智能的技術集合中,由于海外封鎖原因,導致中國企業(yè)更難獲得底層關鍵的算力。 科大訊飛董事長劉慶峰就提到,關鍵問題是算力能不能頂上,我們特別需要更大規(guī)模的國產算力支撐,還好有華為公司,能夠在真正的硬科技算力層面上解決給世界第二種選擇,F(xiàn)在業(yè)界能夠量產做大模型訓練除了英偉達只有華為一家,在推理上已經(jīng)做到完全對標英偉達。 云和AI的關系近似電和電機、魚和水,水大魚大,更大的發(fā)電廠才有豐富多樣的電器。與此同時,云計算從定義IaaS往下已經(jīng)延伸到了芯片指令集,如果哪家公有云巨頭沒有深入到芯片側,則意味著在智能時代即將出局。 沒有算力根技術的基礎設施,智能便無法發(fā)展起來。由此云計算被硬生生劃分為兩個階段,以x86為主的通算云,和以NPU、GPU為主的智算云,所有的一切都在被重構。 重新定義大模型時代的數(shù)據(jù)中心 數(shù)據(jù)中心是AI全棧技術的重要一環(huán),自然也處于重構當中。數(shù)據(jù)中心向下納管數(shù)以十萬計的服務器,計算、存儲和網(wǎng)絡共同構成龐大的計算集群,支撐AI大模型的訓練等任務; 向上將算力服務化,以云計算的形式對外輸出給千行百業(yè),讓企業(yè)不必擔心基礎設施底座,只需要專注于自己的核心業(yè)務,實現(xiàn)AI戰(zhàn)略轉型。 根據(jù)Scaling Law原理,隨著模型規(guī)模的增加,包括參數(shù)數(shù)量、數(shù)據(jù)規(guī)模和計算資源,模型的性能也會相應提高,這也是為何單體數(shù)據(jù)中心的規(guī)模越做越大,企業(yè)需要的單一算力集群規(guī)模也越來越大。 因此,具備更大規(guī)模效應的公共算力中心,才是解決算力緊缺問題的最佳方案,“算力的盡頭是上云”,而具備自主可控芯片的昇騰云服務,則是企業(yè)所需云算力的最佳方案。 如果說此前的數(shù)據(jù)中心產業(yè)格局,更多是政府規(guī)范下的市場自然演進,先有需求再有建設,那么,“東數(shù)西算”就是在國家頂層規(guī)劃下,算力產業(yè)資源和生態(tài)的協(xié)調再分配。不僅要解決當下的算力需求,也要考慮未來產業(yè)如何發(fā)展。 2022年2月,“東數(shù)西算”工程正式全面啟動,如今火熱的大模型,在2022年底才掀起了新一輪的算力熱潮,東數(shù)西算工程適度超前建設的思路,在大模型領域有了直觀的效果。 面向大模型時代的數(shù)據(jù)中心,也要遵循Scaling Law的指引,華為云華東(蕪湖)數(shù)據(jù)中心率先打了個樣。 華為云華東(蕪湖)數(shù)據(jù)中心的建設規(guī)格與以往有很大不同,按照Uptime Tier3、國標A級標準設計,每個園區(qū)總體規(guī)劃多棟DC+1棟綜合樓+變電站,江北、三山、職教園三個園區(qū),總占地6000畝,規(guī)劃了300萬臺服務器,園區(qū)之間通過光纖網(wǎng)進行連接,對外是TB級互聯(lián)網(wǎng)出口帶寬。 規(guī)格高、規(guī)模大只是一方面,華為云還在數(shù)據(jù)中心引入了多種首創(chuàng)技術。例如AI技術精準控制溫度,采集了數(shù)據(jù)中心、IT基礎設施、云服務的全棧數(shù)據(jù)集進行訓練,首創(chuàng)了云服務感知能效調優(yōu)技術,AI智能調優(yōu)精度高達99.5%,可使PUE降低8%至15%,液冷數(shù)據(jù)中心PUE低至1.1,華東區(qū)域能效最優(yōu),每100萬臺服務器每年可以節(jié)省10億度電。 此外,華為云蕪湖數(shù)據(jù)中心也是業(yè)界首個全棧使用IPv6的云數(shù)據(jù)中心,同時首創(chuàng)機房產品化,交付過程中的質量問題降低了90%,在運維層面首次引入IOT技術,實現(xiàn)了告警秒級上報,故障分鐘級定位。 數(shù)據(jù)中心內,服務器一刻不停地計算、存儲、傳輸,但是作為AI基礎設施底座,用戶對數(shù)據(jù)中心的感知并不明顯,他們也不必關心數(shù)據(jù)中心的建設,更不必提“風火水電”等數(shù)據(jù)中心的基本要素。 他們關心的是,數(shù)據(jù)中心如何直接作用于大模型等人工智能業(yè)務換句話說,數(shù)據(jù)中心只是表象,內里的AI全棧能力,是華為更值得關注的部分。 主權AI,如何建設? 在AI熱潮下,全球范圍內主要國家均大力投資AI基礎設施,“主權AI”的概念隨之興起,指的是單個國家或地區(qū)通過建立AI基礎設施、提高AI能力來滿足自身發(fā)展需求,這也是國家層面希望人工智能作為通用目的技術起到的效果,經(jīng)濟增長、產業(yè)革新。 實際上,不僅國家需要主權AI,產業(yè)、企業(yè)和個人都需要自己的主權AI,這就涉及到從智算中心到云計算,從芯片到大模型平臺的全棧AI體系。華為云昇騰AI云服務不僅包括云化算力,也提供了AI開發(fā)生產線ModelArts和AI開發(fā)者生態(tài)AI Gallery。 首先,昇騰云服務可提供“6A”級算力,故障恢復快 、資源獲取快,模型遷移快、 云上推理投資優(yōu)、就近服務時延優(yōu) 、云上性能優(yōu),滿足自研大模型、增量訓練大模型、智能應用開發(fā)等; 昇騰云服務可提供多樣化算力的使用、管理和部署模式,獨有的多級恢復機制和完備的工具鏈可實現(xiàn)千卡訓練連續(xù)30天不中斷,任務恢復時長小于30分鐘,為大模型和AI應用的開發(fā)、運行、運維提供最佳算力云底座。 其次,昇騰云服務提供了AI開發(fā)生產線ModelArts,其是面向AI開發(fā)者的一站式開發(fā)平臺,提供海量數(shù)據(jù)預處理及半自動化標注、大規(guī)模分布式訓練、自動化模型生成及端 - 邊 - 云模型按需部署能力,幫助用戶快速創(chuàng)建和部署模型,管理全周期AI工作流。 同時,昇騰云服務還可以滿足多樣化算力部署模式,除了支持華為全場景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺。 最后是AI開發(fā)者生態(tài)AI Gallery,基于昇騰云服務算力底座,構建一站式AI社區(qū)服務平臺,包含豐富AI資產、服務、解決方案。適配業(yè)界主流開源大模型,易用開發(fā)工具和超強算力,助力企業(yè)和開發(fā)者快速創(chuàng)建模型應用,在大模型時代快人一步。 縱觀全球大模型產業(yè),中國大模型產業(yè)缺失關鍵一環(huán),因此遭受了最嚴峻的挑戰(zhàn),如今這些難題正在被包括華為在內的產業(yè)各方逐步解決。 徐直軍此前曾表示,任何技術只有準確的定位,才會充分發(fā)揮其價值,給人工智能技術進行合理的定位,是理解和應用此技術的基礎。 當華為確立了人工智能的定位,也找到了自己在AI產業(yè)中的定位。華為是國內最早布局AI的廠商之一,且攻取的都是AI的根技術,算力、大模型、開發(fā)平臺等,根深葉茂,本固枝榮,中國大模型產業(yè)的天花板可能不在于大模型本身,而在于算力根柢。 回到云計算的視角,中國云計算產業(yè)的競爭焦點,也不只關乎云平臺本身,更與如何滿足企業(yè)的AI需求息息相關。表面上,云仍然是最重要的基礎設施,企業(yè)上云和深度用云的進程仍在進行中;而實質上,從云時代到智能時代,企業(yè)對于AI的訴求將決定云計算行業(yè)的未來格局,華為云正憑借全棧AI能力,試圖描摹出這個新時代的清晰輪廓。 如同互聯(lián)網(wǎng)產業(yè)的繁榮,離不開通信基礎設施的完善,華為一以貫之做“黑土地”,無論在哪個時代,都去做孕育應用誕生的tech of tech。 江湖多風波,何妨且徐行。華為用了六年,兌現(xiàn)了此前的承諾。 文章來源:鈦媒體 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選