123,123,123

文 / 六金

出品 / 節(jié)點(diǎn)商業(yè)組

大模型熱度遲遲不退，有能力的企業(yè)紛紛搶占生態(tài)位。百度、阿里、華為、商湯、科大訊飛、360等大型互聯(lián)網(wǎng)公司，都已經(jīng)在國內(nèi)展開了“諸神之戰(zhàn)”。

在媒體報(bào)道中，參與了大模型競(jìng)技的公司幾乎都是大公司。這是因?yàn)橥度氪竽Ｐ?，最直觀的需求就是“錢”。大廠能成為“開卷”的主力軍，主要是因?yàn)榇竽Ｐ偷拈_發(fā)訓(xùn)練，資金、技術(shù)門檻都很高，并非創(chuàng)業(yè)者以及小公司可以輕松吃下的蛋糕。

例如國盛證券的一份研報(bào)顯示，GPT-3訓(xùn)練一次的成本約為140萬美元，對(duì)于一些更大的LLM模型，訓(xùn)練成本介于200萬美元至1200萬美元之間。這一成本于全球科技大企業(yè)而言并不便宜，但也在可接受范圍內(nèi)。

將大模型的投入“坦誠相告”

由于“貴”，投身大模型的很多企業(yè)其實(shí)都沒告訴投資者們，自己花了多少錢，估計(jì)也是怕投資者看到后會(huì)產(chǎn)生認(rèn)知偏差。

最近科大訊飛發(fā)了財(cái)報(bào)，倒是對(duì)這一點(diǎn)很坦誠，2023年一季度科大訊飛的利潤(rùn)轉(zhuǎn)虧，其管理層明確表示，除了一些去年遺留的特殊問題外，是因?yàn)楣驹?022年12月15日啟動(dòng)了“1+N認(rèn)知智能大模型”的專項(xiàng)攻關(guān)，將于2023年5月6日正式發(fā)布訊飛星火大模型，攻關(guān)項(xiàng)目的新增投入一定程度上影響了當(dāng)期利潤(rùn)。

科大訊飛的掌門人劉慶峰說得很明白：“針對(duì)大模型的技術(shù)投入，我們?cè)撏兜耐?、絕不手軟。”所以在行業(yè)內(nèi)，大家不妨都坦誠點(diǎn)，畢竟大模型已經(jīng)成為了“陽謀”，花錢投入也是為收獲果實(shí)打基礎(chǔ)。當(dāng)年馬斯克不就是嫌再次投資OpenAI太貴，后來又想去“摘桃子”被拒之門外了嗎？

除了“投錢”以外，大模型還需要“投人”，在這一點(diǎn)上，國內(nèi)外廠商的爭(zhēng)搶都很激烈。“谷歌大腦”的大模型人才，從去年底到今年被OpenAI挖走了好幾個(gè)；節(jié)點(diǎn)財(cái)經(jīng)也聽說，某一線大廠開價(jià)140萬美元年薪，挖腳OpenAI的員工。在國內(nèi)，有公司廣發(fā)英雄帖，把公司的大部分股權(quán)拿出來獎(jiǎng)勵(lì)研發(fā)人才。

但是有NLP領(lǐng)域的專家對(duì)節(jié)點(diǎn)財(cái)經(jīng)表示，做大模型這樣的前沿核心技術(shù)研發(fā)還不能只靠高薪挖人才，更要考慮團(tuán)隊(duì)適配程度。

該人士舉例，研發(fā)大模型是為了落地在業(yè)務(wù)上，技術(shù)團(tuán)隊(duì)?wèi)?yīng)該充分了解業(yè)務(wù)特性。具體到業(yè)務(wù)場(chǎng)景，訴求存在著不小的差異，大模型的作用是實(shí)時(shí)掌握這些需求，并對(duì)此作出快速響應(yīng)。

聽起來理論很簡(jiǎn)單，落地可一點(diǎn)都不容易，如果技術(shù)團(tuán)隊(duì)沒有磨合、不適配業(yè)務(wù)，很可能會(huì)導(dǎo)致迭代落后于業(yè)務(wù)變化。

不過科大訊飛卻表示，未來一段時(shí)間公司不需要太多額外的人力投入，現(xiàn)在訊飛的團(tuán)隊(duì)和資金完全靠得住。有業(yè)內(nèi)人士分析，科大訊飛敢于這樣說，大概率是因?yàn)橛嶏w研究院作為人工智能創(chuàng)新研究院的“元老級(jí)”機(jī)構(gòu)，建制完整、團(tuán)結(jié)且沒有技術(shù)上的內(nèi)耗。

公開資料顯示，目前訊飛研究院最核心的研究團(tuán)隊(duì)有200余人，其中有兩位是《麻省理工科技評(píng)論》“35歲以下科技創(chuàng)新35人”榜單中頂尖的年輕科學(xué)家，其他團(tuán)隊(duì)成員不少是和訊飛一起成長(zhǎng)的博士，憑這一點(diǎn)可以能推測(cè)出，這群科學(xué)家的特點(diǎn)是“懂訊飛的業(yè)務(wù)訴求”。

此外在算力算法方面，訊飛也是業(yè)界公認(rèn)的AI領(lǐng)域長(zhǎng)期堅(jiān)守者。公開資料顯示，科大訊飛在Transformer深度神經(jīng)網(wǎng)絡(luò)算法方面擁有豐富經(jīng)驗(yàn)，已經(jīng)應(yīng)用于訊飛的語音識(shí)別、圖文識(shí)別、機(jī)器翻譯等任務(wù)中，并達(dá)到國際領(lǐng)先水平；而且訊飛創(chuàng)新提出了知識(shí)與大模型融合統(tǒng)一的理解框架X-Reasoner，有望彌補(bǔ)大模型的模糊記憶技術(shù)短板。

而在算力投入上，訊飛過去幾年就一直牽頭承擔(dān)著國家自主可控人工智能平臺(tái)的諸多項(xiàng)目、在總部自建有業(yè)界一流的數(shù)據(jù)中心，為大模型訓(xùn)練平臺(tái)建設(shè)奠定了基礎(chǔ)條件，另外它之前與華為、寒武紀(jì)、曙光等企業(yè)，也都建立了深度算力合作。

所以推出大模型，并且讓它具備商業(yè)化條件，對(duì)于互聯(lián)網(wǎng)大廠來說并不是一蹴而就的，以科大訊飛為例，它能在認(rèn)知大模型能實(shí)現(xiàn)快速突破、并且敢于披露和預(yù)測(cè)自己的投入，與長(zhǎng)期在人才、算法、算力上的積累密不可分。

大模型賽道，國家隊(duì)下場(chǎng)

在這場(chǎng)大模型帶來的AI熱中，還有很多“吃瓜群眾”很難理解科技圈對(duì)大模型的擁躉，畢竟類似的場(chǎng)景在元宇宙、AR/VR等領(lǐng)域都出現(xiàn)過。但如果深入回顧人工智能的發(fā)展歷史與傳統(tǒng)AI時(shí)代的困境，就能理解大模型之于科技時(shí)代的含義。

我們可以將大模型的開發(fā)，理解為打造AI時(shí)代的“操作系統(tǒng)”，就像我們使用windows系統(tǒng)在電腦中完成工作一樣，經(jīng)由AI時(shí)代的“操作系統(tǒng)”大模型，人人都可以是開發(fā)者，生產(chǎn)出新產(chǎn)品和新的應(yīng)用場(chǎng)景。

如果上升到這個(gè)層面，各個(gè)有能力的國家對(duì)大模型的基本要求就是“自主可控”。在360宣布進(jìn)軍大模型領(lǐng)域時(shí)，周鴻祎也在采訪中提到，GPT是個(gè)生產(chǎn)力工具，這將決定未來國際競(jìng)爭(zhēng)當(dāng)中的國運(yùn)。所以，國家隊(duì)也在大模型的開發(fā)和訓(xùn)練上陸續(xù)下場(chǎng)。

不久前，中國電信布局了企業(yè)版的ChatGPT；復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室開發(fā)的MOSS 模型已經(jīng)上線開源；中科院自動(dòng)化所早在2021年就發(fā)布業(yè)界首個(gè)圖文音三模態(tài)大模型“紫東·太初”，清華大學(xué)、北京大學(xué)等院校雖然沒有推出大模型，但是也在人工智能領(lǐng)域國際頂級(jí)期刊發(fā)表了多篇大模型相關(guān)的重要文章。

某知名互聯(lián)網(wǎng)公司的NLP團(tuán)隊(duì)負(fù)責(zé)人對(duì)節(jié)點(diǎn)財(cái)經(jīng)表示，國家隊(duì)下場(chǎng)更容易在一些核心數(shù)據(jù)、參數(shù)上占有優(yōu)勢(shì)。大模型的訓(xùn)練的本質(zhì)，就是把語料、數(shù)據(jù)、參數(shù)等當(dāng)作“食物”喂給大模型，當(dāng)食物品質(zhì)越高，大模型就會(huì)越智能，還能節(jié)省算力。

例如作為“人工智能國家隊(duì)”，科大訊飛在中文語料上有著明顯優(yōu)勢(shì)。據(jù)了解，在多年認(rèn)知智能系統(tǒng)研發(fā)推廣中，科大訊飛積累了超過50TB的行業(yè)語料和每天超10億人次用戶交互的活躍應(yīng)用，擁有大量的機(jī)器翻譯、語音識(shí)別、語音合成等方面的數(shù)據(jù)，這些數(shù)據(jù)均是用于大模型訓(xùn)練和優(yōu)化自然語言處理模型的重要來源之一。

另外，科大訊飛要搭建的“認(rèn)知大模型”特別注重多輪對(duì)話和邏輯推理，才能在行業(yè)中深度應(yīng)用，這就意味著需要更高質(zhì)量的數(shù)據(jù)和參數(shù)。以醫(yī)療領(lǐng)域?yàn)槔?，科大訊飛是全國唯一通過國家執(zhí)業(yè)醫(yī)師資格考試的“人工智能系統(tǒng)”，超過了96.3%的醫(yī)學(xué)考生，現(xiàn)在科大訊飛已累計(jì)為基層醫(yī)生提供了超過5.8億次、日均超過70多萬人次的人工智能輔診。這就意味著在專業(yè)領(lǐng)域，科大訊飛可以避免一本正經(jīng)地回復(fù)錯(cuò)誤消息，使得專業(yè)保障性更強(qiáng)，大模型的落地也“更有專長(zhǎng)”。

科大訊飛，將人工智能與智慧醫(yī)療深度融合

還有不少機(jī)構(gòu)在研報(bào)中提到，科大訊飛在教育領(lǐng)域的應(yīng)用規(guī)模比醫(yī)療更大、數(shù)據(jù)更翔實(shí)，未來的增長(zhǎng)更強(qiáng)勁。機(jī)構(gòu)們的肯定也印證了，在真正有剛需、適合認(rèn)知智能大模型的地方，國家隊(duì)下場(chǎng)后可以推動(dòng)大模型在具體行業(yè)上做得更透。

投入大模型，反哺根據(jù)地

在大模型的“諸神之戰(zhàn)”中還有個(gè)特點(diǎn)，即面對(duì)著市場(chǎng)上成百上千個(gè)大模型投資標(biāo)的，一級(jí)市場(chǎng)和二級(jí)市場(chǎng)在投資上都有些不知所措。

有VC合伙人評(píng)價(jià)，大家都看好大模型的發(fā)展趨勢(shì)，也更愿意做跟投，但是一級(jí)市場(chǎng)的投資人不一定都能看懂大模型的落地前景，沒有領(lǐng)投人就不知道如何開始。二級(jí)市場(chǎng)的投資者則提出了靈魂疑問，現(xiàn)在宣布投身大模型的公司這么多，如何判斷他們是蹭熱點(diǎn)還是真做大模型？我不想買到只會(huì)炒作概念的“妖股”。

上海一券商的計(jì)算機(jī)行業(yè)賣方分析師提出了一個(gè)解決方案，對(duì)于上市公司，可以仔細(xì)觀察企業(yè)有沒有讓大模型反哺主要業(yè)務(wù)的發(fā)展。

例如百度的文心一言全面嵌入百度內(nèi)部工作平臺(tái)如流、對(duì)外也上車了百度apollo等業(yè)務(wù)；釘釘也表示全面接入阿里的 "通義千問 "大模型，增加了 10余種 AI能力、對(duì)外也表示要開放；WPS AI表示將嵌入金山辦公全線產(chǎn)品，科大訊飛的投資者交流會(huì)中也表示，大模型對(duì)于其根據(jù)地業(yè)務(wù)，有著很大推動(dòng)意義。

據(jù)了解，科大訊飛即將發(fā)布的星火大模型是“1＋N認(rèn)知智能大模型”，其中“1”是代表的是大模型訓(xùn)練平臺(tái)，“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、工業(yè)、汽車等多個(gè)根據(jù)地領(lǐng)域的專用大模型版本。

能提出這樣的模型架構(gòu)，是因?yàn)榭拼笥嶏w在行業(yè)內(nèi)是少數(shù)既懂B端又懂C端的AI公司。劉慶峰預(yù)測(cè)道，超大規(guī)模的大模型已經(jīng)到了一個(gè)臨界點(diǎn)，下一個(gè)階段應(yīng)該用更多專業(yè)的子模型來協(xié)同訓(xùn)練，獲得更可靠的成效。

這個(gè)專業(yè)階段的子模型，關(guān)聯(lián)的就是科大訊飛的“根據(jù)地業(yè)務(wù)”，之前我們看科大訊飛的財(cái)報(bào)時(shí)，其根據(jù)地業(yè)務(wù)的基本盤一直非常穩(wěn)健，例如去年即使在宏觀因素的擠壓和疫情影響時(shí)，科大訊飛根據(jù)地業(yè)務(wù)仍能實(shí)現(xiàn)23%的增長(zhǎng)。而基于上文提到語料、數(shù)據(jù)、參數(shù)的優(yōu)勢(shì)，專業(yè)模型通過協(xié)調(diào)聯(lián)動(dòng)，根據(jù)地業(yè)務(wù)還能形成效益的提升。

劉慶峰同樣預(yù)測(cè)道，訊飛在教育、醫(yī)療等根據(jù)地業(yè)務(wù)上的大模型成效不比千億級(jí)模型差。特別是想要形成通用領(lǐng)域的智慧涌現(xiàn)，需要把這些模型的知識(shí)相互銜接，在整體的大模型中去統(tǒng)一訓(xùn)練，未來就有希望在教育、辦公、醫(yī)療等應(yīng)用領(lǐng)域搶占先機(jī)。有不少機(jī)構(gòu)同樣預(yù)測(cè)道，星火認(rèn)知大模型反哺業(yè)務(wù)，會(huì)讓科大訊飛的根據(jù)地業(yè)務(wù)壁壘更加深厚。

幾天前，被譽(yù)為“AI界傳奇”的陸奇在《我的大模型世界觀》演講中提到了對(duì)于大模型的展望，即大模型是平臺(tái)型機(jī)會(huì)，以模型為先的平臺(tái)需要以下幾個(gè)特征：1.開箱即用；2.要有一個(gè)足夠簡(jiǎn)單和好的商業(yè)模式；3.有自己殺手級(jí)應(yīng)用。

所以星火大模型的發(fā)布落地，不僅是簡(jiǎn)單易用的專業(yè)化模型；還可以在科大訊飛自己的教育、醫(yī)療、辦公等場(chǎng)景打造經(jīng)典應(yīng)用；再經(jīng)由訊飛的開放平臺(tái)開放出去，讓AI認(rèn)知大模型從“可用”階段邁入“常用”階段，帶動(dòng)AI時(shí)代的“操作系統(tǒng)”更加普惠化；最后為大模型的使用者創(chuàng)造現(xiàn)金流、創(chuàng)造真金白銀的產(chǎn)業(yè)附加值，這才是大模型的發(fā)展“偉力”。

節(jié)點(diǎn)財(cái)經(jīng)聲明：文章內(nèi)容僅供參考，文章中的信息或所表述的意見不構(gòu)成任何投資建議，節(jié)點(diǎn)財(cái)經(jīng)不對(duì)因使用本文章所采取的任何行動(dòng)承擔(dān)任何責(zé)任。

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

當(dāng)前位置：首頁 > 科技 > 互聯(lián)網(wǎng) > 正文

互聯(lián)網(wǎng)公司投入大模型的原動(dòng)力：反哺自己的「根據(jù)地」

相關(guān)文章

互聯(lián)網(wǎng)2023：新老對(duì)決，江湖生變

匯付天下入選“2022中國互聯(lián)網(wǎng)綜合實(shí)力百強(qiáng)企業(yè)”

2022年中國前10大互聯(lián)網(wǎng)公司廣告營收榜

2022，互聯(lián)網(wǎng)大廠不太平

大廠集體“失速”，互聯(lián)網(wǎng)行業(yè)無望重回高增長(zhǎng)？

熱門排行

信息推薦

熱門標(biāo)簽