文 | 智能相對(duì)論
作者 | 沈浪
Long-LLM(長文本大模型)時(shí)代似乎來得有些突然,而引爆這場熱潮的,竟是一家由清華學(xué)霸牽頭的本土AI初創(chuàng)企業(yè)。
前不久,月之暗面(Moonshot AI)公司宣布旗下對(duì)話式 AI 助理產(chǎn)品 Kimi 應(yīng)用現(xiàn)已支持200萬字無損上下文輸入。
對(duì)比去年10月份Kimi上線時(shí)僅支持的20萬字,這一波升級(jí)直接提升了10倍文本處理能力,同時(shí)也引起了強(qiáng)烈的市場反應(yīng),特別是在資本市場,Kimi概念股應(yīng)運(yùn)而生,諸如九安醫(yī)療、華策影視、中廣天擇等都受益于Kimi概念而實(shí)現(xiàn)了股價(jià)不同程度的漲幅。
這些刺激更讓大模型領(lǐng)域徹底卷起了長文本大戰(zhàn)。
01 “長文本”大戰(zhàn),卷的不是字?jǐn)?shù)而是財(cái)力
阿里率先完成自家的大模型產(chǎn)品升級(jí),強(qiáng)化長文本處理能力,免費(fèi)面向大眾開放最高1000萬字的長文本處理能力。
360則緊隨其后,宣布旗下360智腦正式內(nèi)測500萬字的長文本功能,并在360AI瀏覽器開放給用戶使用。
而百度也宣布在下個(gè)月進(jìn)行版本升級(jí),開放長文本能力,文字范圍會(huì)在200萬-500萬字。
目前,文心一言的文本上限大致為2.8萬字。而像GPT-4Turbo-128k公布的文本范圍也不過為10萬漢字,Claude3200k上下文約16萬漢字。
可以說,這一波熱潮直接把國內(nèi)的大模型廠商一下子都拉進(jìn)了百萬量級(jí)的長文本競賽,而主流廠商的入局也為這場“長文本”大戰(zhàn)增添了很多看頭。
目前來看,“長文本”大戰(zhàn)的賽點(diǎn)主要呈現(xiàn)在兩個(gè)方面。
一方面,是大模型的支持文本參數(shù)。類似阿里通義千問的1000萬字、360智腦的500萬字、百度文心一言的200萬-500萬字、Kimi的200萬字等等,都在極力向市場爭“彩頭”,告訴用戶自家的長文本處理能力足夠“長”。
另一方面,是長文本處理能力的開放程度。有意思的是,Kimi是免費(fèi)開放給用戶使用的,阿里通義千問的長文本處理功能也是免費(fèi)的,360智腦、百度文心一言也沒有要收費(fèi)的意思。——以“長文本”大戰(zhàn)為例,今年的大模型競爭遠(yuǎn)比去年要“卷”得多。
還記得去年大火的妙鴨相機(jī),以及各式各樣的圖片生成式服務(wù),都或多或少地通過各種形式如充值、辦會(huì)員等,要求用戶付費(fèi)才能體驗(yàn)。
今年大模型領(lǐng)域的這把“火”燒得旺,也燒的離奇地“free”。
為什么?
Kimi自升級(jí)以來,就有大量用戶不斷涌入,激增的流量更是一度讓月之暗面(Moonshot AI)的服務(wù)器承受了巨大的壓力,一度陷入宕機(jī),旗下的App和小程序都無法正常使用。
根據(jù)月之暗面(Moonshot AI)發(fā)布的官方消息,從3.20觀測到流量異常增高后,已經(jīng)進(jìn)行了5次擴(kuò)容工作。推理資源會(huì)持續(xù)配合流量進(jìn)行擴(kuò)容,以盡量承載持續(xù)增長的用戶量。
簡單來說,用戶對(duì)長文本功能是非常有興趣的,相關(guān)的市場需求還在保持持續(xù)性的、爆炸性的增長。同時(shí),大量的用戶涌進(jìn),不僅提高了大模型產(chǎn)品的知名度,更重要的是在大量用戶的基礎(chǔ)上通過類似于UGC的模式去探索大模型的應(yīng)用,或許更能進(jìn)一步推動(dòng)Long-LLM(長文本大模型)的商業(yè)化進(jìn)程。
當(dāng)然,在這個(gè)過程中,不可避免地就得投入大量資金,一旦商業(yè)化加速,大模型廠商就得做好“卷”財(cái)力的準(zhǔn)備。
阿里通義千問目前免費(fèi)對(duì)所有人開放高達(dá)萬頁的文檔處理能力,如果要計(jì)算成本,按照目前最便宜的市價(jià)0.1元/頁,10000頁的文檔光解析費(fèi)用就要1000元,這還不包括解析完成之后大模型處理文檔的成本??紤]到通義千問網(wǎng)頁、APP、釘釘?shù)榷鄠€(gè)端口的用戶基數(shù),需要投入的資金恐怕不會(huì)是個(gè)小數(shù)目。
大模型的商業(yè)化在開始階段并非“賺錢”,而是“燒錢”。
02 長文本,直接“接駁”商業(yè)化場景
在大模型的商業(yè)化進(jìn)程上,長文本的爆火是很關(guān)鍵的一環(huán)。
就大模型的技術(shù)原理而言,解決長文本問題是必要的。因?yàn)槲谋鹃L度的提高,對(duì)應(yīng)的模型能解決問題的邊界也將大幅提升,兩者呈現(xiàn)出明顯的正向關(guān)系。
傳統(tǒng)的文本處理模型受限于訓(xùn)練結(jié)構(gòu),可支持的文本范圍都不算長,在處理復(fù)雜任務(wù)和深度專業(yè)知識(shí)(這一類知識(shí)往往都是長篇巨著)時(shí),只能拆解輸入訓(xùn)練,由此就有可能導(dǎo)致輸出的結(jié)果上下文邏輯不連貫不順暢等問題。
區(qū)別于傳統(tǒng)的文本處理模型,長文本模型就具備更準(zhǔn)確的文本理解和生成能力以及更強(qiáng)大的跨領(lǐng)域遷移能力。這對(duì)于打造垂直領(lǐng)域的行業(yè)專家是一個(gè)非常必要的能力支持,比如面向一些長篇巨制的醫(yī)療文獻(xiàn)、法律文件、財(cái)務(wù)報(bào)告等,長文本模型就具備更好的理解能力,對(duì)應(yīng)完成跨領(lǐng)域?qū)W習(xí)和應(yīng)用,從而打造出更專業(yè)的醫(yī)療助理、法律助理以及金融助理等應(yīng)用。
話不多說,實(shí)踐一下。
在這里,「智能相對(duì)論」向阿里通義千問相繼“投喂”了幾本長達(dá)數(shù)百頁的專業(yè)書籍,涵蓋以《高產(chǎn)母豬飼養(yǎng)技術(shù)有問必答》為代表的農(nóng)業(yè)養(yǎng)殖、以《犬貓營養(yǎng)需要》為代表的寵物喂養(yǎng)等等小眾領(lǐng)域。
結(jié)果所能實(shí)現(xiàn)的效果確實(shí)令人驚訝,阿里通義千問不僅能高度概括總結(jié)這些長篇巨著的主要內(nèi)容,還能有針對(duì)性的給出具體篇章的知識(shí)解答。比如,在《高產(chǎn)母豬飼養(yǎng)技術(shù)有問必答》一書中,「智能相對(duì)論」向其提問“夏季高溫提問應(yīng)該如何飼養(yǎng)母豬?”很快就得到了書中的精煉解答。
這意味著什么?只要用戶有足夠多的專業(yè)書籍“投喂”給大模型,那么大模型就可以成長為一個(gè)專業(yè)的專家助理,幫助用戶快速解答相關(guān)專業(yè)問題。
在日常生活中,或許有很多書籍是我們沒辦法去仔細(xì)閱讀和學(xué)習(xí)的,但是只要有長文本大模型予以支持,那么基本上人人都能創(chuàng)造一個(gè)專業(yè)的垂直領(lǐng)域助理。
這或許會(huì)顛覆現(xiàn)在我們獲取信息、知識(shí)的渠道,去百度搜索或是去知乎提問、亦或是去小紅書討論這些路徑都將被替代。
在Kimi開放20萬字文本處理能力的時(shí)候,其做了一個(gè)簡單的對(duì)比,20萬字等于什么?答案是等于先秦的全部古籍。隨著長文本大模型進(jìn)入百萬量級(jí)的迭代,那么這些能力還能實(shí)現(xiàn)進(jìn)一步的進(jìn)化,對(duì)應(yīng)所賦予場景應(yīng)用的機(jī)會(huì)就是無限的。
如今,在AI領(lǐng)域,Agent的話題也很火,被認(rèn)為是下一個(gè)主流的應(yīng)用形態(tài)。那么,打造Agent的關(guān)鍵是什么?答案正是大模型的長文本處理能力。
比如,Kimi就在幫助元隆雅圖等公司進(jìn)行營銷升級(jí),基于長文本處理能力來提供爆品文案分析、文案寫作、市場分析、輔助營銷策劃等功能。
盡管現(xiàn)在很多相關(guān)的應(yīng)用還處在探索階段,但是誰又能確定下一個(gè)爆款應(yīng)用不是出自自家的大模型+某個(gè)C端用戶的想法/某個(gè)企業(yè)客戶的業(yè)務(wù)融合?正因如此,大模型廠商們才不顧一切的升級(jí)并開放長文本功能,為下一場應(yīng)用上的爆火做準(zhǔn)備。
目前,長本文的火爆還只是技術(shù)上的,接下來的爆點(diǎn)大概率將是應(yīng)用上的爆發(fā)。
03 寫在最后
2024年是大模型大規(guī)模走向商業(yè)化的關(guān)鍵一年。從Kimi的火爆程度來看,以長文本為代表的技術(shù)迭代走向C端引發(fā)了非常積極的反饋。同時(shí),在「智能相對(duì)論」的實(shí)踐中,也預(yù)感這一能力隨著技術(shù)的成熟和完善,必然會(huì)在C端用戶的手中被“玩出花來”。
只是目前很多的“玩法”還缺乏打磨,顯得比較粗糙。OpenAI在發(fā)布GPT商店時(shí),就期望要打造一個(gè)全新的生態(tài),人人都能創(chuàng)造自己的專屬GPTs。
現(xiàn)在,擺在大眾面前的長文本熱潮,其實(shí)就是一個(gè)全民時(shí)代到來的信號(hào)。只要用戶有書,會(huì)投喂,那么同樣可以在國內(nèi)的大模型平臺(tái)上打造出屬于自己想要的專業(yè)助理,進(jìn)而延伸到應(yīng)用端的火爆。
當(dāng)然,在這個(gè)過程中,書籍的版權(quán)問題、平臺(tái)的審核問題以及巨大的流量涌入所帶來的諸多挑戰(zhàn)和問題,也是大模型走向商業(yè)化的難點(diǎn)。但是,其根本的方向是清晰的,Long-LLM(長文本大模型)時(shí)代已經(jīng)拉開序幕,從技術(shù)到應(yīng)用,接下來大模型廠商們有得卷了。
說實(shí)在,就目前各大廠商公布的參數(shù),從500萬到1000萬,基本上也足夠用了。大模型在長文本技術(shù)層面或許不會(huì)再有什么值得卷了,哪怕是有也只是背地里正常迭代和發(fā)展。
接下來的爆點(diǎn)只能是往應(yīng)用層面來看。不管是To C還是To B,誰家的平臺(tái)最先把大眾化的應(yīng)用探索并驗(yàn)證出來,再加以打磨推向大眾市場,那么誰就有可能成為下一個(gè)市場的寵兒。
*本文圖片均來源于網(wǎng)絡(luò)
此內(nèi)容為【智能相對(duì)論】原創(chuàng),
僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
部分圖片來自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。
•AI產(chǎn)業(yè)新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個(gè)為什么》
•【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
“養(yǎng)龍蝦”到底要花多少錢?這個(gè)問題可能是大家最關(guān)心的。我們把成本拆成三部分:服務(wù)器租用費(fèi)+大模型API調(diào)用費(fèi)+雜項(xiàng)開銷。第一部分:服務(wù)器租用費(fèi)。最省錢的方案當(dāng)然是本地舊電腦自托管——零新增成本,電費(fèi)忽略不計(jì)。但如前所述,你需要接受“不是7×24小時(shí)在線”的局限性。如果選擇云服務(wù)器,成本差異就很大了。
不少朋友第一次接觸OpenClaw時(shí),都會(huì)有一個(gè)相同的困惑:這玩意兒到底該裝在哪里?OpenClaw(社區(qū)戲稱“養(yǎng)龍蝦”,因Logo為龍蝦鉗)不是普通的聊天機(jī)器人,而是一款本地優(yōu)先、可自主執(zhí)行、支持多Agent分工協(xié)作的AI執(zhí)行網(wǎng)關(guān)。說白了,它讓大模型從“只會(huì)說話”變成“會(huì)動(dòng)手做事”——幫你管理文件
01別相信“一鍵養(yǎng)蝦,躺平賺錢”的鬼話打開社交媒體,你可能會(huì)看到這樣的標(biāo)題:“養(yǎng)只龍蝦自動(dòng)炒股,零代碼養(yǎng)出數(shù)字巴菲特!”信了,你就輸了。真實(shí)情況是:一個(gè)做跨境電商的小哥花了200元租服務(wù)器、訂閱API,指望龍蝦幫他炒股暴富。結(jié)果龍蝦開始幾天還像模像樣,后來直接擺爛,生成個(gè)干癟的大綱就敷衍了事。AI是
一張證書引發(fā)的討論4月7日,北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書,感謝他捐贈(zèng)1000萬元。這事說起來挺曲折的。此前陳光標(biāo)高調(diào)說要贈(zèng)給張雪一臺(tái)價(jià)值1300萬元的勞斯萊斯,張雪回應(yīng)“收了,八折賣掉捐給嫣然”,一番拉扯之后,陳光標(biāo)把車變現(xiàn),1000萬元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書感謝,本來是
2026年4月7日,國家安全部就AI核心術(shù)語“詞元”(Token)發(fā)布安全警示,強(qiáng)調(diào)在日均調(diào)用量突破140萬億規(guī)模的市場背景下,需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì),截至今年3月,我國日均詞元調(diào)用量已超過140萬億,較2024年初增長1000多倍。詞元作為大模型處理信息的最小單元,兼具
如今出門,如果你還沒用過AI智能助手,可能真有點(diǎn)跟不上節(jié)奏了。無論是寫作文、查資料,還是規(guī)劃出行路線,越來越多的人已經(jīng)習(xí)慣隨手打開AI問一句。這股熱潮背后,中國AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績單。根據(jù)全球知名AI模型聚合平臺(tái)OpenRouter的最新數(shù)據(jù),在3月30日至4月5日這一周,中
01別在主電腦上養(yǎng)!這是最最重要的一條“保命”建議。很多小白心血來潮,直接在自己存著畢業(yè)論文、工作文件、銀行卡信息的主力電腦上部署OpenClaw。然后悲劇發(fā)生了:讓龍蝦幫忙整理一下桌面文件,結(jié)果它把整臺(tái)電腦的文件全刪了。這不是段子,是真事。OpenClaw一旦被授予高權(quán)限,就能執(zhí)行刪除、修改等不可
01免費(fèi)領(lǐng)養(yǎng),但飼料要錢很多人第一次聽說OpenClaw時(shí),腦子里冒出的第一個(gè)念頭是:開源軟件,那不免費(fèi)嗎?沒錯(cuò),OpenClaw本身確實(shí)是開源的,下載安裝一分錢不收。但你很快就會(huì)發(fā)現(xiàn),真正的開銷根本不在這里。養(yǎng)一只“龍蝦”,就像領(lǐng)養(yǎng)了一只寵物——領(lǐng)養(yǎng)免費(fèi),但“蝦缸”“蝦糧”“蝦保姆”都得自己掏錢。
一只“龍蝦”,火遍全網(wǎng)“今天你養(yǎng)龍蝦了嗎?”這句話在2026年初,迅速取代“吃了嗎”成為社交媒體上的新晉暗號(hào)。別誤會(huì),這不是什么水產(chǎn)養(yǎng)殖新風(fēng)口。這里說的“龍蝦”,是一款名為OpenClaw的開源AI智能體。因?yàn)樗膱D標(biāo)是一只紅色龍蝦,網(wǎng)友們便把部署、配置和使用它的過程,戲稱為“養(yǎng)龍蝦”。一個(gè)開源軟件
凌晨兩點(diǎn),小王合上筆記本,揉了揉酸脹的眼睛?;艘粋€(gè)月寫出來的10萬字短劇劇本躺在硬盤里,要真正把它拍成劇,得找演員、租場地、請(qǐng)攝像、做后期……粗算下來少說要幾十萬,他只能把劇本繼續(xù)鎖在抽屜里。不過,現(xiàn)在小王的劇本可以“見光”了。2026年3月19日,字節(jié)跳動(dòng)旗下的小云雀AI正式上線了短劇Agent