文 | 智能相對論
作者 | 葉遠(yuǎn)風(fēng)
毫無疑問,大模型熱潮正一浪高過一浪。
在發(fā)展進(jìn)程上,從最開始的技術(shù)比拼到現(xiàn)在已開始全面強調(diào)商業(yè)價值變現(xiàn),百度、科大訊飛等廠商都喊出類似“不能落地的大模型沒有意義”等口號。
在模型類型上,除了百度文心大模型、訊飛星火認(rèn)知大模型、阿里通義千問大模型等通用大模型,醫(yī)藥研發(fā)、金融等垂直大模型正積極涌現(xiàn)。幾個月前,新華三集團(tuán)在業(yè)內(nèi)首提“私域大模型”概念,并發(fā)布融合了行業(yè)屬性及地域?qū)傩缘乃接虼竽P?mdash;—“百業(yè)靈犀”LinSeer,為行業(yè)增添了企業(yè)落地大模型的創(chuàng)新類型。
而在更直接的數(shù)字上,截止到2023年10月初,國內(nèi)僅公開的大模型數(shù)量已達(dá)238個,百模大戰(zhàn)正在升級千模大戰(zhàn)。
……接近一年的熱潮后大模型沒有冷卻的跡象,行業(yè)普遍的共識形成,這不是風(fēng)口,而是技術(shù)革命。
然而,歷史一次次證明,賽道越是熱鬧,參賽者越需要冷靜的思考。
種種跡象顯示,雖然看起來百花齊放,但事實上AI三大要素(算力、數(shù)據(jù)、算法),以及大模型發(fā)展的行業(yè)規(guī)則中,當(dāng)下以及未來很多因素已經(jīng)既定,一頭熱扎進(jìn)去的企業(yè)們,更應(yīng)該尋找的是那些不由既成的客觀因素所限制、能夠進(jìn)行自我價值發(fā)揮的地方,才能盡可能獲得相對競爭優(yōu)勢。
算力“積木化”,可控價值創(chuàng)造集中到“調(diào)度”環(huán)節(jié)
算力常常被視為大模型發(fā)展的瓶頸問題,但是,如果從是否“可控”的視角看,在業(yè)務(wù)層面企業(yè)能自己做出決定從而影響算力獲取的地方,其實越來越少。
IT時代Windows+Intel構(gòu)建起WinTel體,演變?yōu)橐苿踊ヂ?lián)網(wǎng)時代安卓+ARM(以高通為代表),到了大模型時代,又進(jìn)一步演化為AI大模型+GPU——在當(dāng)前,Nvidia已經(jīng)成為大模型趨同的算力來源。
2021的Ampere(對應(yīng)A100等)、2022年的Hopper(對應(yīng)H100等)、2023的Ada架構(gòu)……性價比高不高,要看Nvidia架構(gòu)發(fā)展有多快。
算力不再是瓶頸,或者說,其“總體基本面”的提升并沒有什么操作空間——要多少算力就需要多少資本投入,反過來有多少資本投入基本也能買來多少算力。
當(dāng)算力“口子”被外部技術(shù)、內(nèi)部預(yù)算等限定,通過調(diào)度提升既有資源利用效率,就成為企業(yè)“可控”的價值創(chuàng)造過程。特別是私域大模型,對于企業(yè)來說,AI大模型的大小需要平衡算力和能耗的開支,應(yīng)選擇適合行業(yè)特點和業(yè)務(wù)特點的大模型進(jìn)行私域部署。
此時,如何榨取硬件資源提供的每一滴能力,加速模型的訓(xùn)練速度成為首要考慮的問題,而這方面術(shù)業(yè)有專攻,往往依賴基礎(chǔ)設(shè)施服務(wù)廠商——針對算力等底層基礎(chǔ)設(shè)施提供支撐成為考驗各個服務(wù)廠商最基本的能力,其中尤以算力調(diào)度能力是其重點。
算力調(diào)度往往需要多維能力協(xié)同,所以,作為業(yè)內(nèi)首倡私域大模型的新華三給出了自己的回答:依托通過傲飛算力平臺實現(xiàn)算力調(diào)度的“最優(yōu)解”,讓算力可以最大化的按需調(diào)度。另一方面以綠洲平臺實現(xiàn)大模型所需的數(shù)據(jù)支撐,同時在分布式訓(xùn)練等需求下以智能無損網(wǎng)絡(luò)支持AI集群訓(xùn)練,配備高性能存儲帶來更好的底層存儲支撐,甚至還建設(shè)有液冷數(shù)據(jù)中心來維持算力輸出的穩(wěn)定性,以此構(gòu)成一套完整的智算解決方案。
而新華三算力調(diào)度的“主腦”傲飛算力平臺則具備異構(gòu)計算資源統(tǒng)一管理、多元算力資源智能調(diào)度的能力,提供包含智能標(biāo)注、智能訓(xùn)練、智能調(diào)優(yōu)、智能部署、智能推理的全流程算力智能調(diào)度能力。
按官方數(shù)據(jù),該平臺能夠?qū)⑺懔寐侍岣咧?0%以上。同時,還支持8000節(jié)點的算力調(diào)度,并發(fā)訓(xùn)練時間縮短至50%,且斷點自動接續(xù)無感知訓(xùn)練更穩(wěn)定,在既有GPU資源下能全方面提升大模型訓(xùn)練性能。
說白了,就是通過一系列算力流程環(huán)節(jié)的銜接優(yōu)化(尤其是面對并行計算與分布式計算需求),在充分保障訓(xùn)練與應(yīng)用需求的同時降低GPU的空閑時間,讓巨大成本獲取來的算力資源工作盡可能飽和。
總體而言,這一整套高性能算力集群及調(diào)度讓客戶能夠?qū)崿F(xiàn)算力、存力、運力協(xié)同感知,實現(xiàn)算力資源充分供給、靈活部署、異構(gòu)算力最優(yōu)調(diào)度——雖然有多少算力資源很難控制,但用好這些資源企業(yè)卻能夠做到完全可控。
當(dāng)然,除了提升算力利用效率,行業(yè)中一些做法還在試圖通過其他方式直接降低模型訓(xùn)練對GPU資源的要求,例如數(shù)據(jù)存儲層面進(jìn)行算子優(yōu)化等,未來或也存在較大的價值開發(fā)空間。
數(shù)據(jù)“斷面化”,以數(shù)據(jù)質(zhì)量建設(shè)帶來“護(hù)城河”成為企業(yè)的必然選擇
目前,企業(yè)能夠獲得的數(shù)據(jù)量來源主要包括公開的數(shù)據(jù)集與自身沉淀。
在當(dāng)下時間斷面,這兩種都只能被動等待或由時間積累,數(shù)據(jù)“量”其實很難有突破,優(yōu)勢有就是有,沒有就是沒有,并不可控。
當(dāng)然,也有一些企業(yè)試圖主動出擊,例如國外公司Inflection AI以大規(guī)模提問的方式來主動提升數(shù)據(jù)沉淀速度,但這顯然這并不會是主流。
“量”上不可控,則可控的價值創(chuàng)造空間必須更聚焦于“質(zhì)”上。
中信智庫《人工智能十大發(fā)展趨勢》認(rèn)為,“未來一個模型的好壞,80%由數(shù)據(jù)質(zhì)量決定。”
從長遠(yuǎn)視角看,大模型的競爭并不是要比誰跑得更快,而是比誰走得更遠(yuǎn),這就需要大模型真實的應(yīng)用效果,也就需要通過各種方式提升數(shù)據(jù)質(zhì)量,來鍛造大模型發(fā)展的“內(nèi)功”。
在數(shù)據(jù)的計劃、獲取、存儲、共享、維護(hù)、應(yīng)用等環(huán)節(jié),都需要針對性的數(shù)據(jù)管理、治理,最終提升數(shù)據(jù)質(zhì)量。這是一個系統(tǒng)性工程,也為市面上的基礎(chǔ)設(shè)施服務(wù)商們帶來了機會。
例如新華三的綠洲平臺就以場景需求為導(dǎo)向,打造了一個圍繞數(shù)據(jù)采集、存儲、管理和應(yīng)用的全棧數(shù)據(jù)平臺。
通過內(nèi)置AI算法,綠洲平臺大大提升了數(shù)據(jù)標(biāo)記能力,讓數(shù)據(jù)治理、數(shù)據(jù)開發(fā)等過去很繁雜的流程工作變得極為簡單,而知識圖譜構(gòu)建能力則幫助數(shù)據(jù)躍升為知識,從而能夠更好地被業(yè)務(wù)場景所使用。
事實上,數(shù)據(jù)深加工帶來高質(zhì)量數(shù)據(jù)訓(xùn)練一直是前沿大模型的核心競爭力所在,OpenAI一貫公開其訓(xùn)練過程及算法,但對數(shù)據(jù)如何處理緘口不言。
回過頭來看,數(shù)據(jù)的“要素化”與“資產(chǎn)化”正在讓百行百業(yè)再次審視數(shù)據(jù)的價值,在數(shù)據(jù)越來越作為一種新型生產(chǎn)力要素的時代,大模型的本質(zhì)可以視作一種挖掘數(shù)據(jù)要素價值的工具,而工具不決定價值,只決定效率。
大模型終將走入底層成為一種普遍的后端能力,技術(shù)本身越來越無法成為護(hù)城河,而數(shù)據(jù)則代表了企業(yè)在前端與客戶/用戶的連接程度,數(shù)據(jù)要素的價值釋放將成為企業(yè)真正的“護(hù)城河”。
所有的數(shù)據(jù)類平臺提升數(shù)據(jù)質(zhì)量的過程,就是在幫助企業(yè)進(jìn)一步挖掘數(shù)據(jù)要素價值、沉淀數(shù)據(jù)資產(chǎn),真正打造企業(yè)的“護(hù)城河”。
算法“收斂化”,殊途同歸下企業(yè)需聚焦訓(xùn)練效率提升
算法是大模型的能力核心,但長期來看,算法能力卻終將“收斂”。
目前的大模型算法基本上都基于Transformer架構(gòu),該架構(gòu)解決了過去RNN架構(gòu)難以并行化等核心缺陷,是基因“優(yōu)勝劣汰”的結(jié)果,BERT、GPT、T5、GLM等都其“衍生品”。
所以,算法生來都幾乎有著相同的“基因”。
而在開發(fā)框架層面,伴隨著開源生態(tài)建設(shè),國外的TensorFlow、Pytorch,國內(nèi)的MindSpore等幾個主流框架逐步成為共同的選擇。
這意味著,算法的后天的“成長環(huán)境”也逐步趨同。
先天+后天,算法創(chuàng)新當(dāng)下看起來百花齊放,但在未來其價值創(chuàng)新的空間將逐步收窄,企業(yè)能夠通過努力獲得的相對優(yōu)勢將越來越少。
甚至,在Llama 2掀起的開源浪潮下,算法創(chuàng)新的價值被進(jìn)一步壓縮。
因此,從長期來看,企業(yè)最“可控”的價值創(chuàng)造將側(cè)重到訓(xùn)練效率而非算法創(chuàng)新上——同樣的能力與潛力,PK更快速地訓(xùn)練迭代。
很多廠商提供的開發(fā)工具鏈都在直接推進(jìn)訓(xùn)練效率,而一些原本旨在提供算力服務(wù)的平臺也實現(xiàn)了等價的功能。
例如,傲飛算力平臺支持?jǐn)帱c自動接續(xù)無感知訓(xùn)練,其原本目的在于降低參數(shù)迭代期間的GPU資源等待、提升資源利用效率,但客觀上也直接帶來訓(xùn)練效率的提升,讓算法加速迭代,先把潛力跑出來。
畢竟,加速算法訓(xùn)練,就是在提升算力資源利用效率。
行業(yè)規(guī)則“沉淀化”:長期主義仍需回歸到正確的價值觀
大模型熱潮中,人人都會不自覺追求技術(shù)與商業(yè)價值“上限”,但大模型“下限”問題也日益突出,例如數(shù)據(jù)隱私、數(shù)據(jù)安全、知識產(chǎn)權(quán)、技術(shù)濫用等。
從企業(yè)的視角看,行業(yè)規(guī)則建立迫在眉睫,但其形成過程同樣存在著不由企業(yè)決定的“客觀因素”。
關(guān)于行業(yè)發(fā)展的一些法律法規(guī),監(jiān)管部門在逐步沉淀,例如國家網(wǎng)信辦聯(lián)合多部門公布的《生成式人工智能服務(wù)管理暫行辦法》,企業(yè)要做的是等待并盡力配合與落實。
關(guān)于行業(yè)統(tǒng)一共識,也需要一個個沉淀,例如,目前已經(jīng)有從業(yè)者提議行業(yè)協(xié)作開發(fā)統(tǒng)一、可信的框架,在隱私保護(hù)、模型效用和訓(xùn)練效率之間取得平衡,企業(yè)要做的是積極響應(yīng)、積極參與。
但在一些規(guī)則上,企業(yè)能夠、也必須充分發(fā)揮“可控”的價值創(chuàng)造能力。
例如,大模型數(shù)據(jù)安全“容錯率低”,企業(yè)必須加大投入。
很多基礎(chǔ)設(shè)施廠商都提供了相關(guān)的服務(wù),例如新華三的私域大模型百業(yè)靈犀以內(nèi)置安全限制提示詞和出入內(nèi)容過濾攔截對所有場景下大模型生成內(nèi)容進(jìn)行安全性限制,針對所有出入流量和內(nèi)容進(jìn)行安全審計和敏感信息攔截。
當(dāng)然,最直觀反應(yīng)大模型倫理、體現(xiàn)“下限”的是場景應(yīng)用的選擇問題。
科研、制造、醫(yī)藥、法律……大模型已經(jīng)走向諸多能帶來社會正向價值的場景。但是,諸如偽造視頻進(jìn)行詐騙等“場景應(yīng)用”也已經(jīng)出現(xiàn),基于強力的大模型技術(shù)有著更強的欺騙性。
技術(shù)是刀,大模型是一把更鋒利的刀,它的作用和價值由使用的人決定。
說到底,企業(yè)需要構(gòu)建正確的價值觀,將大模型能力導(dǎo)向數(shù)字經(jīng)濟(jì)的正向價值上,才能守住“下限”、實現(xiàn)大模型的長期健康發(fā)展。
結(jié)語
大模型賽道上,企業(yè)必須在“可控”的價值創(chuàng)造空間上發(fā)力,才能不斷在各個維度獲得更多相對競爭優(yōu)勢與發(fā)展可能性。
企業(yè)也必須以此為標(biāo)準(zhǔn)選擇基礎(chǔ)設(shè)施服務(wù)、大模型服務(wù)的廠商,尤其是在多個維度都能滿足需要的廠商。
可以說,大模型給了這個時代全新的增量價值方向,只有幫助企業(yè)實現(xiàn)對“可控”價值創(chuàng)造的把握,才能讓企業(yè)在這個全新方向更有著力點。
*本文圖片均來源于網(wǎng)絡(luò)
#智能相對論 Focusing on智能新產(chǎn)業(yè)新服務(wù),這是智能的服務(wù)NO.245 深度解讀
此內(nèi)容為【智能相對論】原創(chuàng),
僅代表個人觀點,未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
部分圖片來自網(wǎng)絡(luò),且未核實版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。
•AI產(chǎn)業(yè)新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機、無人機等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
擁抱AI,賦能白糖產(chǎn)業(yè)創(chuàng)新發(fā)展隨著新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,行業(yè)數(shù)字化轉(zhuǎn)型進(jìn)入深水區(qū),人工智能產(chǎn)業(yè)規(guī)??焖僭鲩L。大模型的出現(xiàn),將躍升人工智能供給能力,更好應(yīng)對行業(yè)數(shù)智化升級面臨的挑戰(zhàn),帶來新發(fā)展機遇。2023年,隨著OpenAI公司大模型ChatGPT4.0的發(fā)布,今年科技領(lǐng)域乃至各行各業(yè)的
根據(jù)北京市經(jīng)信局公布的數(shù)據(jù),截止到2023年10月初,國內(nèi)公開的AI大模型數(shù)量已經(jīng)達(dá)到238個。盡管學(xué)術(shù)界對大模型的參數(shù)量并沒有明確的標(biāo)準(zhǔn),許多10億級參數(shù)的模型并不能和GPT4相提并論,國內(nèi)大模型的爆發(fā)式增長,無疑揭示了一個既定事實:和每一次風(fēng)口出現(xiàn)時一樣,總有人一窩蜂地涌入,試圖在新一輪的創(chuàng)業(yè)潮
蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)
智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實
崔大寶|節(jié)點財經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達(dá)股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄
黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供
8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當(dāng)下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知