潮新聞客戶端 實習(xí)生 何樂 關(guān)春源 記者 張云山
【資料圖】
“盤古為行業(yè)而生,就要為行業(yè)著想,更好地服務(wù)千行百業(yè)的客戶”,華為開發(fā)者大會2023(Cloud)在中國東莞正式揭開帷幕,華為常務(wù)董事、華為云CEO張平安重磅發(fā)布盤古大模型3.0,他表示,盤古大模型不寫詩只做事。
在昨天的2023世界人工智能大會上,華為輪值董事長胡厚崑發(fā)表演講表示,“去年年底Chat GPT的出現(xiàn),把人工智能推向了新的風(fēng)口。人工智能將幫助改寫身邊的一切。”同時,他透露,面向未來,華為在人工智能發(fā)展上有兩個著力點:第一,打造強有力的算力底座,來支撐中國人工智能產(chǎn)業(yè)的發(fā)展。第二,真正讓人工智能服務(wù)好千行百業(yè),服務(wù)好科研創(chuàng)新。
胡厚崑表示,華為云發(fā)布的盤古大模型,面向ToB千行百業(yè),為生產(chǎn)活動服務(wù)、為科研創(chuàng)新服務(wù)。讓人工智能創(chuàng)造價值。華為人工智能的發(fā)展關(guān)鍵是走深向?qū)崳c放在讓人工智能為千行百業(yè)的生產(chǎn)活動服務(wù),為科研創(chuàng)新服務(wù)。
其實早在2020年華為就已經(jīng)布局大模型,2021年4月,華為云盤古大模型對外發(fā)布,今天的版本是盤古大模型3.0。過去的4年,華為大模型之路是怎么雄起的呢?
破解小作坊困境,盤古大模型功課天塹
ChatGPT引發(fā)的百模大戰(zhàn)正如火如荼的進行,很多公司都想借助大模型開發(fā)細分賽道的AI應(yīng)用,但一算成本,覺得太貴,只能放棄。
很多AI公司都遇到了同一個問題:一道名為“AI開發(fā)”的產(chǎn)業(yè)天塹。在AI從實驗室走向應(yīng)用的過程中,需要大量的資金支撐,開發(fā)人員專業(yè)性要求高、綜合成本高、不可控程度高,還要租用服務(wù)器開發(fā)、訓(xùn)練、部署模型,這樣的困難讓很多公司望而卻步。
在華為內(nèi)部,2020年3月,華為云人工智能領(lǐng)域首席科學(xué)家田奇,和團隊發(fā)起了一次安靜的沖鋒。這次沖鋒的“行動代號”——盤古大模型。當年11月,盤古大模型在華為云內(nèi)部立項成功,也完成了與合作伙伴、高校的合作搭建。
在開始打造盤古大模型的時候,團隊確立了三項最關(guān)鍵的核心設(shè)計原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強,能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
盤古大模型瞄準了兩條賽道,同時開啟了NLP和機器視覺兩個領(lǐng)域的大模型開發(fā)。與此同時,盤古大模型也做好了未來規(guī)劃。首先希望能夠把機器視覺、NLP、語音,甚至計算機圖形學(xué)的技術(shù)結(jié)合起來,形成多模態(tài)的預(yù)訓(xùn)練大模型,增強預(yù)訓(xùn)練大模型的跨領(lǐng)域協(xié)同落地能力。
困難隨之而來。首先是數(shù)據(jù)和算力的問題。即便華為云擁有非常好的資源基礎(chǔ),在千億參數(shù)級別的大模型面前也依舊存有不足。為此,華為云和合作伙伴的多方推動,確保了所需數(shù)據(jù)和算力資源的保障到位。
其次是與行業(yè)知識體系、數(shù)據(jù)系統(tǒng)的磨合問題。盤古大模型的開發(fā),時間緊張、訓(xùn)練難度高、成本耗費大,自然也需要內(nèi)部團隊的“超人發(fā)揮”。田奇回憶,團隊內(nèi)部都叫自己“特戰(zhàn)隊員”,也就是角色需要經(jīng)常互換,工作需要相互支撐,哪里缺人就要哪里頂上。一個技術(shù)專家,同時也要考慮很多產(chǎn)業(yè)落地、商業(yè)化方面的問題。
盤古大模型不斷攻堅克難的團隊,從起初僅有少數(shù)幾個人,到如今陸續(xù)壯大起來,已經(jīng)吸納了百余人,包括3名廣受關(guān)注的“華為天才少年”。2021年4月,華為云盤古大模型正式對外發(fā)布。今天,盤古大模型3.0再度升級。
大模型不再只是實驗室被觀賞的東西,而是可以改變行業(yè)
盤古大模型立項、研發(fā)和落地的故事,給了我們一個思考AI工業(yè)化的鮮活樣本。
從歷史中看,一種產(chǎn)品的工業(yè)化進程必然需要經(jīng)歷研發(fā)為重—基座為重—產(chǎn)品為重三個層級。
將這個邏輯回溯到AI領(lǐng)域。自深度學(xué)習(xí)為代表的AI第三次興起之后,這項技術(shù)得到了快速發(fā)展,但其基礎(chǔ)業(yè)態(tài)還處于“研發(fā)為重”的第一階段。行業(yè)中缺乏公開、有效、低成本的產(chǎn)業(yè)基礎(chǔ),最終導(dǎo)致很多理論上成立的落地方案難以成行。
而盤古大模型的價值,恰恰就在于推動AI的低成本、可復(fù)制。
田奇認為,目前我們處在AI工業(yè)化開發(fā)模式起步后的快速發(fā)展階段,而大模型是最有希望將AI進行落地的一個方向。
從盤古大模型的故事中看,這個過程的實現(xiàn),需要多重力量的攜手與跨界——田奇加入華為就是一例。
田奇有著最新的研究方法、技術(shù)創(chuàng)新能力與國際視野;在華為云的產(chǎn)業(yè)結(jié)構(gòu)中,田奇團隊也找到了學(xué)術(shù)界所不具備的驅(qū)動力——科學(xué)家也開始思考功耗、效率、成本、商業(yè)場景等等一系列真實問題。
從這個角度看,盤古大模型也是一次產(chǎn)業(yè)、科研的虹吸范本。產(chǎn)學(xué)研的縱向融合,不同行業(yè)領(lǐng)域的橫向協(xié)同,誕生了AI在工業(yè)化階段必須經(jīng)歷的虹吸效應(yīng)。
田奇回憶說,如果不能復(fù)制推廣,那么大模型可能就是“一個只能在實驗室中被觀賞的東西”。團隊期待大模型應(yīng)用能滲透更多場景,并帶來改變。
當更多科學(xué)家、行業(yè)專家、AI架構(gòu)師,用這樣的角度和動力去思考AI、推動AI、建造AI,橫亙在AI面前的產(chǎn)業(yè)天塹,最終將會成為成為AI工業(yè)化變革的標志。
大模型是新一輪AI發(fā)展的核心,其已在推進產(chǎn)業(yè)智能化升級中已表現(xiàn)出巨大潛力,并將在未來三年里形成風(fēng)起云涌之勢。
“轉(zhuǎn)載請注明出處”