當(dāng)前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

大模型中場戰(zhàn)事,訊飛星火找到領(lǐng)先時刻

 2023-08-20 07:56  來源: A5專欄   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

落地為王階段,在算力、平臺、模型、應(yīng)用、生態(tài)等方面,都有持續(xù)深入的企業(yè),對產(chǎn)業(yè)來說有更強的吸引力。

作者|劉珊珊

編輯|楊 銘

轟轟烈烈大模型,走到市場化大規(guī)模落地前夜。

8月15日,《生成式人工智能服務(wù)管理暫行辦法》施行。這是我國第一部AIGC管理辦法,明確行業(yè)健康、安全、規(guī)范同時,進一步促進生成式人工智能應(yīng)用的加速落地。

這被解讀為,在國內(nèi)已經(jīng)打響半年,熱度空前的“千模大戰(zhàn)”迎來關(guān)鍵戰(zhàn)場節(jié)點,正式進入應(yīng)用PK、“落地為王”階段。

硝煙背后,業(yè)界與大眾普遍關(guān)心話題是:當(dāng)大模型逐漸變成一種基礎(chǔ)能力,如何進行技術(shù)上的迭代升級?又如何與更多行業(yè)結(jié)合,提速規(guī)?;⑸虡I(yè)化進程,在競賽長跑中占據(jù)領(lǐng)先地位?

這考驗著入局者的智慧,亦決定入局者未來命運走勢。

“通用人工智能絕不僅僅是單個企業(yè)、單個科研院所的使命,而是整個社會的機會,大模型賦能個體和行業(yè)的大未來正在到來。”8月15日,長達140多分鐘的訊飛星火認知大模型V2.0升級發(fā)布會上,身著傳統(tǒng)黑西褲、白襯衫的科大訊飛董事長劉慶峰說。

這是科大訊飛大模型又一次重要亮相——自5月6日對外正式展示至今,訊飛星火認知大模型剛好100天,期間經(jīng)歷了V1.5的迭代。

當(dāng)前V2.0 升級,是在提升通用能力基礎(chǔ)上,重點突破代碼能力和多模態(tài)能力。根據(jù)劉慶峰的說法,代碼能力是支撐認知大模型智慧的關(guān)鍵維度,多模態(tài)能力則是實現(xiàn)通用人工智能的必經(jīng)之路。

這些能力,已同步在iFlyCode1.0(編程助手)、訊飛智作2.0(視頻創(chuàng)作平臺)、星火語伴2.0(練習(xí)口語)等應(yīng)用和產(chǎn)品上,成為科大訊飛大模型落地應(yīng)用和商業(yè)化上的重要一步。

從技術(shù)能力來看,訊飛星火V1.5Python語言效果只有41分,V2.0已有61分,接近ChatGPT。根據(jù)計劃,到今年10月24日,訊飛星火各個代碼緯度能力將比ChatGPT,實現(xiàn)中文超越、英文相當(dāng)?shù)乃?,到明年上半年對標GPT-4。

這意味著,伴隨大模型進入“落地為王”的中場戰(zhàn)事階段,中國大模型也將迎來自己的領(lǐng)先時刻。

01大模型落地,從產(chǎn)業(yè)開始

命運齒輪,轉(zhuǎn)動于5月6日。彼時科大訊飛躬身入局,發(fā)布星火認知大模型1.0版本。

短短幾個月,大模型已在國內(nèi)掀起一場場“肉搏戰(zhàn)”。通用、行業(yè)、垂直、開源和閉源等不同類型大模型,基于GPT,就像樹干上的枝丫一樣,瘋狂開枝散葉?;ヂ?lián)網(wǎng)、人工智能巨頭、創(chuàng)業(yè)公司、各類型中小企業(yè)、研究機構(gòu)入局者數(shù)不勝數(shù),幾乎每天都有不同類型大模型推出。

比如,10億級參數(shù)規(guī)模大模型——參數(shù)量被默認為通用大模型、垂直和行業(yè)模型區(qū)別重要因素。規(guī)模參數(shù)越高,對算力、數(shù)據(jù)、資源、技術(shù)要求就更高,但在國內(nèi),10億級參數(shù)以上多模態(tài)大模型卻超80個。

這并不意味著賽道的真正崛起。在國內(nèi),投資者逐漸趨冷,部分入局者黯然離場;在國外,ChatGPT誕生9個月花費近2億美元,高昂成本讓OpenAI有“破產(chǎn)風(fēng)險”。

盲目燒錢不可持續(xù),大模型成本、商業(yè)化落地兩大難題,讓大眾開始重新審視,大模型的經(jīng)濟和社會價值。

各界“到底需要什么大模型”探討中,深耕行業(yè),與生態(tài)結(jié)合,讓大模型在不同行業(yè)、不同類型企業(yè)發(fā)揮生產(chǎn)力作用,成為解決大模型難題,真正產(chǎn)生價值行業(yè)共識。

“誰能在具備社會剛需的應(yīng)用場景落地,誰就能最先形成自我造血的良性循環(huán)。”劉慶峰明確斷言。在他看來,對科大訊飛這樣體量的公司,不做通用大模型就不可能在國際舞臺上未來爭得一席之地,連上桌機會都沒有。

通用還是垂直選擇題上,每家企業(yè)都有自己理由和抉擇。多模態(tài)通用大模型,被業(yè)界視為“綜合大學(xué)學(xué)生”,可能在某些垂類領(lǐng)域沉淀數(shù)據(jù)有所不足,卻是各個行業(yè)通向智能化、通用化必由之路,也是業(yè)界公認事實。

事實上,應(yīng)用落地才是衡量一切大模型價值最高標準。最大難題是,如何搞懂行業(yè)、每個客戶需求,以及應(yīng)用安全、易用,具備產(chǎn)業(yè)價值。

行業(yè)場景分為政府及大型企業(yè)(ToB、ToG)、個人(ToC)、中小企業(yè)(ToSME)等不同類型。不同行業(yè)與大模型結(jié)合本質(zhì)邏輯不同,如ToB、ToG,往往要求邏輯復(fù)雜定制化場景中,必須做到可控、可追溯、可修正。ToSME同樣有定制化需求,但降本增效,給企業(yè)帶來增長價值,卻是衡量關(guān)鍵。

多位觀察人士認為,深入行業(yè)Know-how基礎(chǔ)上,和大模型能力融合,是大模型產(chǎn)業(yè)化最有效路徑。

劉慶峰認為,其前提是,要在國產(chǎn)算力安全和數(shù)據(jù)安全下,回歸場景驅(qū)動。“場景給客戶帶來的價值是什么,新增效益,還是節(jié)約成本、提高質(zhì)量,同時能夠讓用戶快速地、低技術(shù)門檻訓(xùn)練,才能夠使它賦能千行百業(yè)。”

這是科大訊飛在8月15日推出星火一體機重要原因——其與華為昇騰AI聯(lián)合研發(fā),意在為每一家企業(yè)提供專屬的大模型,適合有數(shù)據(jù)安全需求的大型客戶。

“開箱即使用,提供從底層算力、AI 框架、訓(xùn)練算法、推理能力、應(yīng)用成效等全棧 AI 能力。”劉慶峰稱。

對科大訊飛來說,TOB端探索出的大模型賦能路徑是,在研、產(chǎn)、供、銷、服、管等各維度賦能。例如,大模型掌握行業(yè)基本能力、通用知識后,結(jié)合企業(yè)專屬知識庫,讓新員工也能迅速掌握經(jīng)驗和知識,大幅提升工作效率。

不止科大訊飛,百度、騰訊、阿里、360都試圖通過為企業(yè)提供專屬大模型,加快產(chǎn)業(yè)融合、落地速度。“落地為王階段后,淘汰賽就會一觸即發(fā)。”多位觀察人士判斷。

必須意識到,受制于數(shù)據(jù)、算力、場景等限制,真正能跑通大模型商業(yè)化的入局者,數(shù)量將不會太多。其一,大模型仍會像互聯(lián)網(wǎng)、人工智能、云計算一樣,以互聯(lián)網(wǎng)、科技大廠為主導(dǎo);其二,大廠不會局限于泛通用行業(yè),而是“大模型+業(yè)務(wù)”深入垂類,走通用+垂類“并行”路徑。

比如科大訊飛,星火是多模態(tài)通用大模型,卻早已開枝散葉,應(yīng)用在教育、醫(yī)療、辦公、數(shù)字員工、汽車、金融、工業(yè)等多垂類場景。

02千模大戰(zhàn),訊飛星火憑啥第一?

當(dāng)前,賽道各大玩家紛紛結(jié)合自身已有業(yè)務(wù)場景,試圖在大模型釋放更大價值前,搶占戰(zhàn)場制高點。

但客觀來看,科大訊飛目前是脫穎而出,走得最快的那個。

這從科大訊飛最新財報,大模型加持后的商業(yè)化增長,得到印證。今年上半年,教育、開放平臺及消費者、智慧汽車、智慧醫(yī)療、智慧金融等業(yè)務(wù)收入分別為22.9億元、24.2億元、2.1億元、1.9億元、0.9億元,分別同比增長3.63%、21.6%、26.14%、37.13%和22.19%。

"可以看到,大模型正實實在在推動產(chǎn)業(yè)前進。" 劉慶峰稱。

這也讓外界頗為疑惑:ChatGPT都遭遇變現(xiàn)難題時,科大訊飛為何領(lǐng)先業(yè)界,先一步嘗到大模型的商業(yè)化甜頭?

有人工智能從業(yè)人士對“極點商業(yè)”稱,大模型應(yīng)用落地,其實是一條技術(shù)—產(chǎn)品—場景—規(guī)?;难葑兟窂?。“就像一個木桶,不能存在短板,才有成功接受市場考驗可能。”

大模型并非短期內(nèi)一蹴而就,而是長期技術(shù)沉淀下所推動。1999年成立的科大訊飛,24年來在劉慶峰博士帶領(lǐng)下,一直是人工智能領(lǐng)頭羊形象存在,在深度學(xué)習(xí)算法、行業(yè)大數(shù)據(jù)、知識圖譜、多模態(tài)感知、系統(tǒng)工程等技術(shù)方面有著深厚積累。

外界未曾關(guān)注到的是,其在認知大模型上也有近十年沉淀。2014年,科大訊飛啟動“訊飛超腦”計劃,實現(xiàn)機器從“能聽會說到能理解會思考”。到2022年,累計摘取16項國際人工智能大賽的冠軍,其中認知智能領(lǐng)域有13項冠軍。

這離不開研發(fā)的持續(xù)投入。2022年,科大訊飛總研發(fā)投入33.6億元,研發(fā)人員數(shù)量占公司總?cè)藬?shù)的比例為約60%。而根據(jù)最新財報,科大訊飛上半年研發(fā)支出16.6億元,同比去年同期16億元增加大約3.8%。這是星火認知大模型短時間內(nèi)多次重要升級關(guān)鍵。

研發(fā)投入、技術(shù)領(lǐng)先帶來的,是在G/B/C端應(yīng)用場景不斷拓展,占據(jù)更多用戶心智。根據(jù)IDC《中國人工智能軟件2022年市場份額》,在語音語義AI市場,科大訊飛位于榜首,持續(xù)領(lǐng)先百度智能云、阿里云。

長達20年多年的技術(shù)沉淀,讓科大訊飛在大模型的打造上,有了“所有技術(shù)平臺完全自主研發(fā),每一階段技術(shù)都可控”的底氣。

比如,在大模型多個關(guān)鍵技術(shù),多家權(quán)威評測就將訊飛火星排在了第一位。

根據(jù)新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布《人工智能大模型體驗報告2.0》(以下簡稱《報告》),訊飛星火以總分1013分位列本次國產(chǎn)主流大模型測評榜首位,超過商湯商量、通義千問等大模型,在四大評測維度中的智商指數(shù)、工具提效指數(shù)兩個維度獲得第一。

IT之家評測中,在完善度、功能性、易用性等維度,訊飛星火同樣超過文心一言、通義千問、360智腦,排在第一。

《麻省理工科技評論》則將訊飛星火稱為“最聰明”的大模型。在8個一級大類的600道題目的測試和盲評中,訊飛星火認知大模型V2.0在編程能力、理科綜合、邏輯思維、數(shù)學(xué)專項、語言專項和綜合知識6個大類中得分率排名第一,超過文心一言、商湯商量、通義千問,獲得“最聰明”的國產(chǎn)大模型稱號。

商業(yè)化探索上,有別大多數(shù)大模型,科大訊飛采取的是“技術(shù)能力+落地應(yīng)用”并行策略。

一個細節(jié)是,科大訊飛在5月6日推出訊飛星火時,盡管發(fā)布時間并不領(lǐng)先,卻在現(xiàn)場明確了教育、醫(yī)療、金融、辦公、汽車、工業(yè)六個行業(yè)的應(yīng)用場景。

此后兩次升級,也有明確加速上述行業(yè)探索邊界,推進其規(guī)?;瘧?yīng)用落地和產(chǎn)業(yè)生態(tài)的構(gòu)建——值得一提的是,科大訊飛是第一個在發(fā)布時,即明確階段性升級時間,并同步生態(tài)應(yīng)用規(guī)劃的企業(yè)。

另外,LUMIE 10系列、智能辦公本X3等與訊飛星火結(jié)合的硬件產(chǎn)品,在展示技術(shù)能力時,也同步落地上市。

“不僅要做基礎(chǔ)通用大模型,還要同步做落地教育、醫(yī)療、辦公場景的產(chǎn)品應(yīng)用。”今年4月,科大訊飛副總裁、研究院執(zhí)行院長劉聰曾透露,為進一步提高大模型細分行業(yè)的實用性,科大訊飛實行了“1+N”攻關(guān)體系。其中,“1”是通用認知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺,“N”則是應(yīng)用于教育、醫(yī)療、人機交互、辦公等多個行業(yè)領(lǐng)域的專用大模型版本。

“‘1’ 的能力融入到 ‘N’ 的產(chǎn)品應(yīng)用中,‘N’ 的數(shù)據(jù)和場景更新到 ‘1’ 里迭代能力,構(gòu)建一個循環(huán)的系統(tǒng)性工程。”劉聰說,訊飛大模型的技術(shù)、產(chǎn)品與服務(wù),一直是圍繞產(chǎn)業(yè)應(yīng)用場景來展開。

因此,外界也得以在短短三個月內(nèi),就清晰看到了科大訊飛大模型,在C端和B/G端的齊頭并進。

C端,科大訊飛消費者產(chǎn)品覆蓋AI辦公、AI學(xué)習(xí)、AI健康三大賽道,是國內(nèi)AI應(yīng)用產(chǎn)品最豐富的企業(yè)。

其中在AI學(xué)習(xí)賽道,僅僅是5-6月,科大訊飛AI學(xué)習(xí)機GMV就分別同比增長136%和217%;訊飛AI硬件在今年6.18獲得京東和天貓雙平臺7類銷售冠軍。

當(dāng)前AI學(xué)習(xí)機為代表的智能學(xué)習(xí)硬件市場強敵林立、同質(zhì)化嚴重,是各路巨頭都看上的市場,包括小度、步步高、猿輔導(dǎo)、作業(yè)幫、讀書郎等新老玩家齊聚??拼笥嶏w利用AI大模型能力,是其差異化突圍關(guān)鍵。

B/G端,作為AI“國家隊”,科大訊飛已在政務(wù)、電力、醫(yī)療、工業(yè)、司法、金融等行業(yè)深耕多年。

金融領(lǐng)域,訊飛和人??萍嫉冗_成合作,推進大模型技術(shù)在金融垂直領(lǐng)域的應(yīng)用;工業(yè)領(lǐng)域,星火大模型搭載在羚羊工業(yè)互聯(lián)網(wǎng)平臺,智能匹配方案、服務(wù)商、專家等資源,實現(xiàn)供需匹配;醫(yī)療領(lǐng)域,訊飛診后康復(fù)管理平臺基于大模型技術(shù)進行了升級,與北京協(xié)和醫(yī)院、四川華西醫(yī)院等多所醫(yī)院進行合作,覆蓋20多個科室的主要病種。

在8月15日的發(fā)布會上,劉慶峰強調(diào)說,訊飛星火已完成金融、政務(wù)、汽車等領(lǐng)域9個專屬大模型數(shù)據(jù)顯示,在場景任務(wù)優(yōu)化、私域知識增強等方面增效20%。

03競賽馬拉松,科大訊飛如何走更遠

大模型競賽是一場馬拉松,當(dāng)下大模型仍然處于一個技術(shù)不斷迭代、培育市場、搶占用戶心智階段。

這意味著,眼前領(lǐng)跑之外,更重要的是未來如何走得更遠。

對于未來,科大訊飛從未掩飾它的“野心”,在5月推出訊飛星火時,就成為國內(nèi)首家明確公布時間表的企業(yè):今年10月24日,訊飛星火代碼各維度能力將超越ChatGPT,明年上半年對標GPT-4。

此前,因為種種原因,幾乎所有國內(nèi)大模型都被外界認為,在技術(shù)、算法、可應(yīng)用性上和ChatGPT存在差距。顯然,在算力、算法等底層能力上保持迭代優(yōu)化,并和產(chǎn)業(yè)應(yīng)用緊密結(jié)合,是科大訊飛能否實現(xiàn)上述目標的保障。

“對代碼能力的邏輯、算法、方法、體系、數(shù)據(jù)準備已經(jīng)全部就緒,所需要的就是時間和算力。”劉慶峰稱。

技術(shù)永無止境。多次迭代后,訊飛星火大模型核心能力、應(yīng)用和產(chǎn)品正不斷擴容。比如此次訊飛星火2.0,科大訊飛就對代碼能力進行5個維度的升級,包括:代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成。

圖像描述、圖像問答、識圖創(chuàng)作、文圖生成、虛擬人合成等多模態(tài)能力方面,訊飛星火大模型也全面升級。在代碼能力和多模態(tài)能力迭代基礎(chǔ)上,科大訊飛推出了能夠進行視頻創(chuàng)作的訊飛智作2.0、“智能編程助手iFlyCode2.0”、一鍵生成課件星火教師助手等,作為AIGC內(nèi)容的生產(chǎn)工具。

代碼能力和多模態(tài)能力升級,意味著幫助專業(yè)程序員提升效率,創(chuàng)造更大價值。

從演示來看,借助iFlyCode1.0工具,簡單幾步Prompt完iFlyCode界面后,一行代碼都不用寫,就可以馬上實現(xiàn)“凌空手寫”功能。以前,經(jīng)驗豐富的工程師要半天到1天才能完成,現(xiàn)在只需要幾分鐘。

過去一個月,iFlyCode在訊飛內(nèi)部有2000多名員工實現(xiàn)試點應(yīng)用,代碼采樣率超過30%,編碼效率提升30%以上,綜合工作效率提升15%,能明顯感受到大模型帶來的效率提升。

此外,哪怕不是編程高手的普通人,只要發(fā)揮想象力、基于對應(yīng)用場景的認知,也可以“零門檻”進入代碼世界。

例如,使用Python畫紅色的心形線、用代碼生成“貪吃蛇”等小游戲、利用小視頻做表情包等需求,訊飛星火都能迅速完成。

此前,科大訊飛已將星火大模型的能力,包裝為中英文類人批改、英語類人口語對話等諸多應(yīng)用場景,置入進T20、LUMIE 10、T10等AI學(xué)習(xí)機產(chǎn)品。有經(jīng)銷商表示,用戶對搭載星火大模型的旗艦產(chǎn)品,熱情度非常高。

升級后的星火大模型,圍繞教育落地多款產(chǎn)品和功能。星火教師助手應(yīng)用在訊飛教育數(shù)字基座上,零編程基礎(chǔ)的老師也能使用,并滿足學(xué)校管理數(shù)字化轉(zhuǎn)型中的個性需求和定制開發(fā)。AI 智能編程助手和 AI 創(chuàng)意繪畫伙伴的推出,標志著大模型對AI學(xué)習(xí)機賦能,更全面貼近新課標的要求。

代碼和多模態(tài)能力的升級,也是大模型降低門檻,解放生產(chǎn)力,釋放想象力的關(guān)鍵。目前,結(jié)合原有應(yīng)用數(shù)據(jù)和場景描述,集成訊飛星火的代碼能力和語言理解能力,大大提升學(xué)校開發(fā)效率:原有開發(fā)應(yīng)用周期從17天縮短至1天,投資成本由15萬降低至1.5萬元。根據(jù)科大訊飛透露,該教育數(shù)字基座已經(jīng)在上海、湖北、安徽的一些學(xué)校試點落地。

產(chǎn)業(yè)生態(tài)上,為行業(yè)、政務(wù)提供業(yè)界領(lǐng)先、自主可控的私有化代碼能力平臺——比如星火一體機。另外,開發(fā)者生態(tài)也是大模型產(chǎn)業(yè)良性循環(huán)關(guān)鍵。

5月6日星火大模型發(fā)布后兩個月內(nèi),訊飛人工智能開放平臺開發(fā)者數(shù)量增加了85萬家。6月9日以來,已有4000余個助手開發(fā)者團隊加入進來,開發(fā)出了7800多個助手。

隨著生態(tài)集中,大模型不僅與產(chǎn)業(yè)應(yīng)用更緊密,加快賦能千行百業(yè)進程,也能通過正向反饋,促進基礎(chǔ)研究和關(guān)鍵技術(shù)的自主迭代,更大程度解放生產(chǎn)力,釋放想象力。

科大訊飛就表示,當(dāng)前多模態(tài)能力已廣泛應(yīng)用在教育、醫(yī)療、工業(yè)、汽車、機器人等領(lǐng)域。真實世界獲得的數(shù)據(jù),將提升產(chǎn)品終端的學(xué)習(xí)、訓(xùn)練,從而推出更自主的工業(yè)機器人、更好的自動駕駛、走入家庭的陪伴機器人等等。

“這會是一個長期過程。在算力、平臺、模型、應(yīng)用、生態(tài)等方面,都有持續(xù)深入的企業(yè),對產(chǎn)業(yè)來說有更強的吸引力。”一位人工智能分析人士說。

寫在最后:

大模型落地道阻且長??傮w而言,當(dāng)前大模型尚未完全離開“喧囂”,各行各業(yè)大多處于賦能階段,想收獲大規(guī)模產(chǎn)業(yè)價值,還有很長的路要探索。

如同比爾·蓋茨在《人工智能時代已經(jīng)開啟》中所描述,自1980年圖形用戶界面出現(xiàn)以來,大模型是所見過最具革命性的技術(shù)進步。一場事關(guān)所有產(chǎn)業(yè)的商業(yè)變革,已經(jīng)拉開了大幕。

通過技術(shù)、產(chǎn)品、應(yīng)用深耕,訊飛星火大模型“長坡厚雪”,正率先走向產(chǎn)業(yè)深處。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
科大訊飛

相關(guān)文章

熱門排行

信息推薦