1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 大數(shù)據(jù)
  4. 正文

“多云多模型”時代到來,火山引擎的數(shù)字化升級“刀法”

 2023-04-24 18:06  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。

ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。

大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對算力的需求急劇增長,技術層面從單一云架構向“多云架構”轉(zhuǎn)變的趨勢日益顯著。

2022年,字節(jié)跳動旗下云服務品牌“火山引擎”對4000多家在云上消耗超過100萬的企業(yè)客戶進行調(diào)研,他們發(fā)現(xiàn),目前有88%的企業(yè)采用多云架構,平均每家企業(yè)會使用“五朵云”。

在多云架構趨勢與大模型持續(xù)迭代的背景下,火山引擎總裁譚待認為,未來將是“多云多模型”的時代。

不難理解,如今國內(nèi)云服務市場呈現(xiàn)多元化趨勢,企業(yè)從不同廠商采買云服務已是常態(tài),而大模型也不會一家獨大,最終會形成多模型共生甚至協(xié)作的生態(tài)。

“在多云方面的實踐,字節(jié)可以說是經(jīng)驗最豐富的一家。”譚待說。

具體到技術與業(yè)務層面,在“多云多模型”時代下,火山引擎如何為企業(yè)提供針對性的解決方案?

做好大模型的“基礎設施”

大模型是人人都想摘得的“玫瑰枝”,但在國內(nèi)落地實現(xiàn)的壁壘依然很高。

大模型的訓練與迭代是對算力和數(shù)據(jù)的雙重考驗,也是對企業(yè)資金儲備與戰(zhàn)略定力的挑戰(zhàn);有業(yè)內(nèi)人士估算過,OpenAI 訓練 GPT-3 一年,算力成本就高達 2000 萬美元。

尤其對中小科技企業(yè)或初創(chuàng)公司而言,建設大模型更具體的挑戰(zhàn)在于,企業(yè)缺乏足夠的應用場景實踐和行為分析數(shù)據(jù),在訓練和迭代升級上也存在壁壘。

譚待也認為,國內(nèi)很多科技公司投入到大模型建設中,他們有優(yōu)秀的技術團隊、豐富的行業(yè)知識和創(chuàng)新想法,但往往缺乏經(jīng)過大規(guī)模場景實踐的系統(tǒng)工程能力。

對此,火山引擎的解法是:為大模型客戶提供高穩(wěn)定性和高性價比的AI基礎設施。

如何為大模型提供基礎設施?據(jù)譚待透露,國內(nèi)大模型領域七成以上企業(yè)是火山引擎客戶,火山引擎將為他們提供關鍵的算力支持和技術平臺,并為消費者帶來更豐富的AI應用。

具體到產(chǎn)品端,近日,火山引擎發(fā)布新版機器學習平臺:支持萬卡大模型訓練、微秒級延遲網(wǎng)絡,讓大模型訓練更穩(wěn)更快。

同時,火山引擎發(fā)布了基于自研DPU的Intel CPU計算實例、AMD CPU計算實例、NVIDIA GPU計算實例,以其中“DPU+AMD Genoa CPU平臺的計算實例”為例,整機性能最高提升138%,單核性能最高提升39%。

算力是實現(xiàn)大模型迭代的關鍵一環(huán),而火山引擎通過與字節(jié)跳動國內(nèi)業(yè)務并池,將抖音等業(yè)務的空閑計算資源極速調(diào)度給火山引擎客戶使用,確保企業(yè)在大模型建設中的數(shù)據(jù)支持與算力保障。

字節(jié)跳動副總裁楊震原表示,“并池”意味著可以調(diào)度一些資源,去錯峰互用,把運力提上去,“比如其實也有波峰和波谷,凌晨用的人少,這種資源就很適合科學計算的能力。”

字節(jié)跳動副總裁楊震原分享抖音的機器學習實踐

基于字節(jié)系的算力資源和生態(tài)能力,火山引擎所提供的大模型基礎設施,在運算效率和性價比方面更有優(yōu)勢。

以火山引擎的合作客戶MiniMax為例,這是一家已經(jīng)推出自研大模型產(chǎn)品的獨角獸公司,其與火山引擎合作建立的超大規(guī)模推理平臺,擁有萬卡級算力池,支撐單日過億次調(diào)用。

再比如抖音的推薦系統(tǒng),在火山引擎的算力支持下,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本只有5000元。

“火爆全網(wǎng)的抖音’AI繪畫’特效,從啟動到上線只用一周多,模型由一名算法工程師完成訓練。”楊震原介紹說。

楊震原還認為,業(yè)務創(chuàng)新需要試錯,試錯要大膽、敏捷,但試錯也一定要控制成本。

效率更優(yōu)、算力資源豐富、成本可控的大模型訓練與迭代方式,往往是初創(chuàng)型科技公司最為看重的模式,也是火山引擎努力實現(xiàn)的目標。

譚待指出,火山引擎要服務好那些立志做好大模型的公司,為其提供基礎算力支持和技術平臺。“如何在工程上幫它們優(yōu)化,提高效率,穩(wěn)定性,都是我們關注的重點。”

當然,不同企業(yè)在不同應用場景下,對云服務和大模型的需求千差萬別,火山引擎又如何做好個性化的企業(yè)級解決方案?

數(shù)據(jù)驅(qū)動,升級企業(yè)解決方案

從2020年成立至今,火山引擎基于內(nèi)部業(yè)務的技術生態(tài),已經(jīng)向外開放機器翻譯、視覺智能等能力,業(yè)務覆蓋金融、汽車、消費、文娛等行業(yè)場景。

不過,事情正在起變化,“多云多模型”時代對云廠商提出更復雜的挑戰(zhàn)。

一方面,企業(yè)加速搭建“多云架構”,以實現(xiàn)算力的快速增長;另一方面,多模型意味著多場景應用,企業(yè)在不同的業(yè)務場景中需要差異化的AI應用。

早在2022年,火山引擎就提出“體驗創(chuàng)新、數(shù)據(jù)驅(qū)動、敏捷迭代”的云上增長三要素,基于企業(yè)不同的應用場景,利用數(shù)據(jù)驅(qū)動搭建云增長模型。

譚待認為,“過去很多企業(yè)花費了大量時間構建數(shù)據(jù)中臺,但最后失敗了,找不到數(shù)據(jù)應用的場景,價值也沒有發(fā)揮出來。其本質(zhì)在于,企業(yè)沒有將數(shù)據(jù)驅(qū)動整個體系設計好。”

火山引擎總裁譚待宣布支持“多云多模型”的未來架構

火山引擎非常看重數(shù)據(jù)驅(qū)動為企業(yè)降本增效、技術升級所帶來的作用,內(nèi)部對數(shù)據(jù)使用的價值也有一個明確標準——“0987”,即零事故、滿足90%的需求、80%的需求能夠通過技術優(yōu)化實現(xiàn)秒級調(diào)用、通過業(yè)務部門評價達到70分以上。

堅持以數(shù)據(jù)驅(qū)動為增長核心,火山引擎能在內(nèi)容、營銷等領域提供更多個性化的企業(yè)級應用,比如在內(nèi)容領域通過算法和AI平臺幫助創(chuàng)作更優(yōu)質(zhì)內(nèi)容、在內(nèi)部運營方面通過數(shù)據(jù)平臺優(yōu)化供應鏈和庫存管理等。

如今,火山引擎的解決方案已經(jīng)在各行各業(yè)落地,進一步帶動產(chǎn)業(yè)的數(shù)字化升級。

2022年卡塔爾世界杯期間,火山引擎就用AI的方式做出窄帶高清,一方面提升視頻幀率,另外還能降低帶寬。

同時,針對網(wǎng)絡觀眾收看比賽最頭疼的直播延時問題,火山引擎通過RTM超低時延直播技術,將直播畫面的端到端延遲最低降到1s,電視觀眾和網(wǎng)絡觀眾幾乎都能“同頻”觀看賽事直播。

此外,在公益領域,火山引擎與字節(jié)跳動公益將聯(lián)合推出公益版的電子票據(jù)服務與公有云服務,為符合條件的公益組織提供為期3年的免費服務。

據(jù)地歌網(wǎng)了解,字節(jié)跳動公益電子票據(jù)服務已于今年2月上線,目前中華社會救助基金會、中國聽力醫(yī)學發(fā)展基金會已申請使用該服務。

中華社會救助基金會相關負責人表示,該基金會2022年開票量超過1萬張,電子開票可以節(jié)約0.5個財務人力成本。

從直播體驗升級到公益票據(jù)服務,火山引擎通過數(shù)據(jù)驅(qū)動,努力在不同行業(yè)的不同業(yè)務場景中落地數(shù)字化應用。

火山引擎所處的云計算領域是大市場,專業(yè)機構估算,國內(nèi)云計算市場規(guī)模預計在今年突破3000億元。

但,“多云多模型”時代逐步變?yōu)楝F(xiàn)實,企業(yè)對云服務的差異化能力提出更高要求,并且需要將云計算與大模型賦能到實際業(yè)務中,帶來整體業(yè)務升級。

行業(yè)正在起變化,云計算企業(yè)“不得不變”。

在海外,亞馬遜AWS于日前為企業(yè)客戶推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分類、開放式問答和信息提取等任務的生成式大語言模型等。

在國內(nèi),云計算領域競爭激烈,阿里云、華為云等均在行業(yè)內(nèi)深耕多年,火山引擎作為“后發(fā)之人”,依托于字節(jié)生態(tài)“溢出”的2B能力,持續(xù)升級企業(yè)數(shù)字化解決方案。

當然,為適應“多云多模型”時代,為大模型客戶提供AI基礎設施,火山引擎有著“任重道遠”的目標。好在,基于多年的資源儲備和場景實踐,火山引擎已經(jīng)摸索出了一條自己的云增長道路。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
數(shù)字化技術

相關文章

  • 九四智能創(chuàng)始人劉嗣平榮獲2023金瑞獎“數(shù)字服務年度人物”

    7月5日,由艾瑞咨詢主辦的第15屆2023iResearchAwards金瑞獎獲獎名單正式揭曉。廣州九四智能科技有限公司(簡稱:九四智能)創(chuàng)始人、CEO劉嗣平憑借在企業(yè)服務領域創(chuàng)新的智能用戶運營方法論及細致的場景解決方案,從眾多候選人中脫穎而出,榮獲本屆金瑞獎“數(shù)字服務年度人物”。金瑞獎于2006年

  • 2023MWC上海 | 釋放產(chǎn)業(yè)數(shù)字化平臺服務價值,賦能產(chǎn)業(yè)新未來

    2023年上海世界移動通信通信大會(簡稱“MWC上?!保┥?,思特奇以“智啟萬物數(shù)轉(zhuǎn)賦能”為主題,通過300m2超大展位、8大展臺板塊,全面呈現(xiàn)公司自主創(chuàng)新原生技術和應用案例,賦能千行百業(yè)數(shù)智化轉(zhuǎn)型。產(chǎn)業(yè)數(shù)字化是指以數(shù)字技術為引領、數(shù)據(jù)賦能為主線、平臺為支撐,對產(chǎn)業(yè)鏈上下游全要素數(shù)字化升級改造的過程,

  • 思特奇智慧城市:創(chuàng)新構筑城市級數(shù)字中樞平臺 助推城市轉(zhuǎn)型升級

    6月28-30日,2023上海世界移動通信大會(MWC)在上海新國際博覽中心舉辦,作為行業(yè)領先的數(shù)字化轉(zhuǎn)型產(chǎn)品及解決方案服務商,北京思特奇信息技術股份有限公司(簡稱:思特奇;股票代碼:300608.SZ)以“智啟萬物數(shù)轉(zhuǎn)賦能”主題強勢亮相展會,從運營商服務升級、政企產(chǎn)業(yè)服務創(chuàng)新、科技創(chuàng)新引領、數(shù)字生

  • MAXHUB 2023年新品品鑒會圓滿落幕:再掀企業(yè)數(shù)字化升級新風向

    在過去的兩個多月時間里,MAXHUB2023全國新品品鑒會已先后走進廣州、北京、西安、重慶、武漢、上海、杭州、深圳、石家莊、鄭州、長沙、成都、呼和浩特、南京、哈爾濱、烏魯木齊等城市,舉辦121個場次,吸引超一萬名嘉賓參加,構建產(chǎn)業(yè)人士與MAXHUB三大空間數(shù)字化解決方案近距離體驗的平臺,打造令眾人眼

  • 企企通創(chuàng)始人&CEO徐輝:數(shù)字生態(tài)與數(shù)字化供應鏈如何連通

    描述:2023年華映資本年度大會以“無限新成皆繁星”為主題。企企通作為數(shù)字化采購與供應鏈領域的專家,受邀出席本次大會,其創(chuàng)始人&CEO徐輝作為華映資本的被投企業(yè)代表進行了數(shù)字生態(tài)與數(shù)字化供應鏈等核心內(nèi)容進行了精彩分享。6月16日,2023年華映資本年度大會在杭州成功舉辦。2023年華映資本年度大會以