5月14日OpenAI搶跑發(fā)布GPT-4o,通過實(shí)時(shí)的語音、視頻和文本交互刷屏社交網(wǎng)絡(luò)。
但僅僅24小時(shí)后,谷歌毫不示弱,在一年一度的Google I/O 開發(fā)者大會(huì)上,展示了由升級(jí)后Gemini模型驅(qū)動(dòng)的AI助手項(xiàng)目Project Astra、對(duì)標(biāo)Sora的文生視頻模型Veo,以及在硬件方面發(fā)布的第六代Tensor處理器單元(TPU)Trillium芯片,并推出了徹底AI改造后的搜索。
谷歌首席執(zhí)行官桑達(dá)爾?皮查伊表示,谷歌所有的工作都圍繞生成式AI模型Gemini來做。
由此,多模態(tài)大模型 成為巨頭選定的未來方向,這讓人不由的發(fā)出疑問,中國大模型誰能扛起多模態(tài)的大旗?
多模態(tài)遙遙領(lǐng)先的中國大模型
谷歌發(fā)布會(huì)固然精彩,但總體上也談不上絕對(duì)領(lǐng)先,比如我們看到一個(gè)挺有意思的演示,就是給出一個(gè)三天的膳食計(jì)劃,最后得出的結(jié)果是圖文并茂的。這一點(diǎn)確實(shí)帶來了很大的體驗(yàn)提升,而目前國內(nèi)的大部分大模型的對(duì)話方式還是簡單的停留在文字交互上,多模態(tài)的混合內(nèi)容幾乎沒有。

不過比起國內(nèi)的多模態(tài)AI搜索領(lǐng)軍產(chǎn)品天工大模型(www.tiangong.cn)來說,谷歌這個(gè)多模態(tài)的搜索結(jié)果就有點(diǎn)花拳繡腿了,比如我提的一個(gè)問題是“特斯拉與小米的參數(shù)對(duì)比”,這里給出的答案應(yīng)該是所有大模型里唯一能夠用表格對(duì)比并配圖的了,在實(shí)用性和可用性上來說,真的是遙遙領(lǐng)先,根本不需要二次處理數(shù)據(jù)就可以直接輸出內(nèi)容了。
從這個(gè)角度來看的話,我覺得谷歌還是處于一個(gè)炫技的demo階段,而天工大模型在多模態(tài)這塊確實(shí)已經(jīng)進(jìn)入了一個(gè)實(shí)用階段。

從這里我們可以看出,早在4月17日發(fā)布的“天工3.0”在多模態(tài)領(lǐng)域的領(lǐng)先并不僅僅是在國內(nèi)范圍,而是全球范圍。“天工3.0”是采用4千億級(jí)參數(shù)MoE混合專家模型,也是全球模型參數(shù)最大、性能最強(qiáng)的MoE模型之一。
最為重要的一點(diǎn)則是,“天工3.0”也是全球首個(gè)多模態(tài)“超級(jí)模型”(Super Model),其最早集成了AI搜索、AI PPT、AI視頻轉(zhuǎn)繪、AI寫作、AI長文本閱讀、AI對(duì)話、AI語音合成、AI圖片生成、AI漫畫創(chuàng)作、AI圖片識(shí)別、AI音樂生成、AI代碼寫作、AI表格生成等多項(xiàng)能力。
這一路徑選擇,在一個(gè)月之后的今天,兩大巨頭的模型更新后,也被確認(rèn)為全球大模型未來的發(fā)展方向。
之所以天工能夠?qū)崿F(xiàn)這樣的領(lǐng)先,是因?yàn)樵缭谌ツ?月就發(fā)布了多模態(tài)大模型Skywork-MM然后一步一步迭代而來,這種對(duì)未來發(fā)展方向的遠(yuǎn)見和正確判斷,無疑是在AI這種創(chuàng)新領(lǐng)域?qū)崿F(xiàn)領(lǐng)先的關(guān)鍵。
反觀谷歌反而在摸索方向方面耗費(fèi)了太多的時(shí)間,現(xiàn)在才開始逐漸步入正軌。
多模態(tài)AI打破個(gè)人創(chuàng)作局限
如果說AI搜索是剛需的入口,那么多模態(tài)顯然就是應(yīng)用的未來。我曾向很多公務(wù)員朋友推薦使用天工AI,其中很多多模態(tài)功能在工作中都有很好的表現(xiàn)。比如說AI ppt功能可以一鍵生成大綱和PPT,大幅降低工作的繁瑣程度,只要簡單修改就可以直接應(yīng)用。
而AI視頻轉(zhuǎn)繪畫的功能則是我意想不到的一個(gè)受歡迎的功能,因?yàn)榇蠹叶家龆桃曨l,但又不方便露臉,一鍵轉(zhuǎn)成漫畫風(fēng)格就完全沒有問題了。


對(duì)于文案工作者來說,閱讀分析大量的材料和進(jìn)行范式文體的寫作是日常工作中最耗費(fèi)精力的部分,而AI能夠帶來的最大價(jià)值就在這里了。
天工的AI文檔解析支持無字?jǐn)?shù)限制的文檔閱讀,除了PDF和TXT、EXCEL等文檔形式外也支持網(wǎng)絡(luò)鏈接,文檔上傳后,能一鍵生成AI摘要和要點(diǎn)提煉,還貼心標(biāo)注提煉內(nèi)容的總計(jì)字?jǐn)?shù)及閱讀時(shí)間,方便參考。
而且AI閱讀的所有問答歷史、閱讀列表都將成為你的個(gè)人知識(shí)庫,避免重復(fù)學(xué)習(xí),也能隨時(shí)找到過去的工作成果。
然后再配合AI寫作、AI PPT,可以快速生成大綱、框架、文本或者PPT,大幅提升文字工作的效率。這就是AI輔助未來辦公的一個(gè)真實(shí)可用的場(chǎng)景。

值得一提到是,天工AI解析EXCEL這種復(fù)雜數(shù)據(jù)場(chǎng)景也是游刃有余,絕對(duì)是未來的硬核生產(chǎn)力工具。

文字工作是一切的基礎(chǔ),AI圖片、AI音樂、AI漫畫、AI代碼、AI數(shù)據(jù)分析等一系列AI多模態(tài)能力的誕生,則實(shí)現(xiàn)了全場(chǎng)景的生產(chǎn)效率提升,無論是我們想配一個(gè)無版權(quán)的插圖,還是想配一個(gè)合適的音樂,漫畫,現(xiàn)在都可以通過AI來生成完全具有知識(shí)產(chǎn)權(quán)的內(nèi)容,這一點(diǎn)不僅僅會(huì)為職場(chǎng)人士帶來效率提升的價(jià)值,也會(huì)為大量的內(nèi)容創(chuàng)業(yè)者打開創(chuàng)作的桎梏,生成更多的優(yōu)質(zhì)內(nèi)容。
從這一點(diǎn)來說,多模態(tài)的未來相關(guān)于每一個(gè)生產(chǎn)內(nèi)容的人,也勢(shì)必會(huì)為創(chuàng)造力插上最強(qiáng)的輔助翅膀。
除此之外,天工垂直領(lǐng)域的智能體對(duì)話的工具性也非常有實(shí)用價(jià)值,比如旅游在出行前問一問,就可以作出很好的推薦和路線規(guī)劃。

星座運(yùn)勢(shì)也可以隨時(shí)給出關(guān)于星座的運(yùn)勢(shì)走向和生活指南,也可以給枯燥的生活帶來幾分樂趣和期待。
這里尤其需要說明的是,能夠提供即時(shí)的信息內(nèi)容,且視覺感不輸傳統(tǒng)搜索引擎的體驗(yàn),也是天工大模型的獨(dú)家能力,如果是其他大模型,大部分都只能呈現(xiàn)文字效果,甚至還在分析過去的信息,是沒有辦法提供星座運(yùn)程這樣的即時(shí)的信息分析反饋的。

還有很多年輕的朋友會(huì)在二次元漫畫中樂此不疲的完成自己的作品創(chuàng)作。而隨著多模態(tài)能力的發(fā)展,我相信還會(huì)有更多垂直領(lǐng)域的垂直模型被開發(fā)出來,這些對(duì)于人們的工作生活都會(huì)帶來顛覆性的改變。
而最完美的場(chǎng)景自然是和語音助手的結(jié)合,讓每個(gè)人都能擁有一個(gè)類似鋼鐵俠的賈維斯那樣的AI助手,這樣大量的工作和娛樂需求只要一句話就會(huì)被AI滿足,這種完美的生活體驗(yàn)我相信距離我們已經(jīng)不遠(yuǎn)了。
AI搜索的開創(chuàng)者
值得一提的是,除了在多模態(tài)方面的領(lǐng)先,天工也是中國AI搜索的開創(chuàng)者,2023年8月就率先推出基于自研大語言模型的AI搜索產(chǎn)品——天工AI搜索,這也啟發(fā)了國內(nèi)的搜索巨頭,百度和360也相繼入局。
目前來看,搜索融入AI可以說是一個(gè)神來之筆,從全球范圍來看,谷歌最終也很有可能憑借搜索的優(yōu)勢(shì)來反超OpenAI。
因?yàn)樗阉骱虯I的結(jié)合是最為自然的,也是實(shí)用性提升最強(qiáng)的,它大大降低了搜索工具的使用門檻,同時(shí)篩掉了很多往往需要專業(yè)人士才能分辨的垃圾信息,而最終產(chǎn)生的搜索結(jié)果,就好像上面的對(duì)比表格一樣,直接利用率非常高,不再需要人們進(jìn)行更復(fù)雜的二次數(shù)據(jù)整理和編輯。
在這里需要強(qiáng)調(diào)的是,天工大模型和其他AI搜索的領(lǐng)先之處還有一點(diǎn)是支持簡潔、增強(qiáng)、研究3個(gè)模式,其中的簡潔模式的結(jié)果和其他大模型類似,而增強(qiáng)和研究兩個(gè)模式則能輸出更為豐富和復(fù)雜的結(jié)果來供更加專業(yè)的需求使用。
比如關(guān)于普通人有必要理財(cái)么這個(gè)問題,簡潔模式就回復(fù)了基本的理財(cái)?shù)哪康摹⒑锰?、風(fēng)險(xiǎn),而增強(qiáng)版搜索則更為細(xì)節(jié)的闡述了理財(cái)?shù)哪康摹⒗碡?cái)?shù)牟呗陨踔吝€有理財(cái)?shù)漠a(chǎn)品推薦。


而在研究模式下,我們就可以看到指定理財(cái)計(jì)劃的推薦,以及10種理財(cái)工具的介紹,真的對(duì)這個(gè)領(lǐng)域有興趣的用戶就可以針對(duì)這10種產(chǎn)品進(jìn)一步的進(jìn)行研究和采納了。這三個(gè)答案可以說是比較充分的體現(xiàn)出了天工AI搜索三種模式結(jié)果的不同。
對(duì)我本人的使用場(chǎng)景來說,大大解決了搜索中專業(yè)度不足的問題。之前我使用的大模型提供的素材很難在專業(yè)的稿件中用到,但天工AI搜索的增強(qiáng)尤其是研究模式下的結(jié)果,可用度就非常高了。

當(dāng)然天工在AI搜索方面的領(lǐng)先也不是憑空而來,很多人只知道天工的研發(fā)者昆侖萬維是國內(nèi)市值數(shù)百億的上市公司,但不知道的是,它之前曾收購并成功運(yùn)營海外主流瀏覽器Opera,所以在搜索方面不僅有很強(qiáng)的技術(shù)積累,同時(shí)也奠定了如今自研搜索引擎的能力,這種積累最終在AI領(lǐng)域?qū)崿F(xiàn)了爆發(fā),不能不說昆侖萬維在戰(zhàn)略和遠(yuǎn)見方面的優(yōu)勢(shì)。
要知道,在國內(nèi)同時(shí)具有大模型和搜索能力的公司屈指可數(shù),而從目前的發(fā)展趨勢(shì)來看,這兩種能力的齊備是最后還能留在一線的必要條件。
昆侖萬維在研發(fā)人員方面也是國內(nèi)的第一梯隊(duì),相較于國內(nèi)幾個(gè)創(chuàng)業(yè)團(tuán)隊(duì)百十人的規(guī)模,有數(shù)倍的優(yōu)勢(shì)。而且這些研發(fā)人員質(zhì)量也非常高,海內(nèi)外知名院校博士就超過百人,其他大部分也都來自于微軟、阿里、百度這樣的行業(yè)大廠,技術(shù)水準(zhǔn)有更好的保障。
AI發(fā)展如火如荼,這其中不僅僅需要技術(shù)能力的支撐,也需要對(duì)未來發(fā)展方向的準(zhǔn)確判斷和精準(zhǔn)投入。畢竟AI發(fā)展就像滾雪球,好處是越來越大,領(lǐng)先優(yōu)勢(shì)也越來越明顯,后來者很難追上。壞處就是一旦方向錯(cuò)了,很容易尾大不掉,難以轉(zhuǎn)向。
從目前的發(fā)展趨勢(shì)來看,多模態(tài)的方向已經(jīng)相當(dāng)確定,而天工在海內(nèi)外的領(lǐng)先優(yōu)勢(shì)也比較明顯。接下來就是要拉開差距和分勝負(fù)的時(shí)刻了。期待更強(qiáng)大的產(chǎn)品出現(xiàn),也期待AI改變世界早日到來。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
9月24日,2025云棲大會(huì)在杭州開幕,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘發(fā)表主旨演講,首次系統(tǒng)性地闡述通往ASI的三階段演進(jìn)路線,包括智能涌現(xiàn)、自主行動(dòng)以及自我迭代等,實(shí)現(xiàn)從學(xué)習(xí)人、輔助人到超越人的發(fā)展脈絡(luò)?;谏鲜龅陌l(fā)展路線,吳泳銘對(duì)外做出判斷,大模型是下一代的操作系統(tǒng)?!拔?/p>
文/二風(fēng)來源/節(jié)點(diǎn)財(cái)經(jīng)每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場(chǎng)硬仗——填報(bào)志愿。今年,這一領(lǐng)域迎來了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報(bào)產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報(bào)市場(chǎng)付費(fèi)規(guī)模約9.5億元,近九成考生愿意借助志愿填報(bào)服
崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國內(nèi)大模型
年初大模型行業(yè)上演“長文本”大戰(zhàn)時(shí),我們就萌生過做一個(gè)“讀書助理”的想法。測(cè)試了市面上主流的大模型后,發(fā)現(xiàn)普遍存在兩個(gè)不足:一種是可以處理的文本長度不夠,即使有些大模型將文本長度提升到了20萬字,像《紅樓夢(mèng)》這樣近百萬字的名著,還是需要多次才能“讀”完。另一種是語言理解和生成能力不足,經(jīng)常出現(xiàn)“幻覺
互聯(lián)網(wǎng)或許從未停止創(chuàng)新,只是對(duì)于創(chuàng)新的認(rèn)知下降了。
一張證書引發(fā)的討論4月7日,北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書,感謝他捐贈(zèng)1000萬元。這事說起來挺曲折的。此前陳光標(biāo)高調(diào)說要贈(zèng)給張雪一臺(tái)價(jià)值1300萬元的勞斯萊斯,張雪回應(yīng)“收了,八折賣掉捐給嫣然”,一番拉扯之后,陳光標(biāo)把車變現(xiàn),1000萬元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書感謝,本來是
2026年4月7日,國家安全部就AI核心術(shù)語“詞元”(Token)發(fā)布安全警示,強(qiáng)調(diào)在日均調(diào)用量突破140萬億規(guī)模的市場(chǎng)背景下,需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì),截至今年3月,我國日均詞元調(diào)用量已超過140萬億,較2024年初增長1000多倍。詞元作為大模型處理信息的最小單元,兼具
如今出門,如果你還沒用過AI智能助手,可能真有點(diǎn)跟不上節(jié)奏了。無論是寫作文、查資料,還是規(guī)劃出行路線,越來越多的人已經(jīng)習(xí)慣隨手打開AI問一句。這股熱潮背后,中國AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績單。根據(jù)全球知名AI模型聚合平臺(tái)OpenRouter的最新數(shù)據(jù),在3月30日至4月5日這一周,中
01別在主電腦上養(yǎng)!這是最最重要的一條“保命”建議。很多小白心血來潮,直接在自己存著畢業(yè)論文、工作文件、銀行卡信息的主力電腦上部署OpenClaw。然后悲劇發(fā)生了:讓龍蝦幫忙整理一下桌面文件,結(jié)果它把整臺(tái)電腦的文件全刪了。這不是段子,是真事。OpenClaw一旦被授予高權(quán)限,就能執(zhí)行刪除、修改等不可
01免費(fèi)領(lǐng)養(yǎng),但飼料要錢很多人第一次聽說OpenClaw時(shí),腦子里冒出的第一個(gè)念頭是:開源軟件,那不免費(fèi)嗎?沒錯(cuò),OpenClaw本身確實(shí)是開源的,下載安裝一分錢不收。但你很快就會(huì)發(fā)現(xiàn),真正的開銷根本不在這里。養(yǎng)一只“龍蝦”,就像領(lǐng)養(yǎng)了一只寵物——領(lǐng)養(yǎng)免費(fèi),但“蝦缸”“蝦糧”“蝦保姆”都得自己掏錢。
一只“龍蝦”,火遍全網(wǎng)“今天你養(yǎng)龍蝦了嗎?”這句話在2026年初,迅速取代“吃了嗎”成為社交媒體上的新晉暗號(hào)。別誤會(huì),這不是什么水產(chǎn)養(yǎng)殖新風(fēng)口。這里說的“龍蝦”,是一款名為OpenClaw的開源AI智能體。因?yàn)樗膱D標(biāo)是一只紅色龍蝦,網(wǎng)友們便把部署、配置和使用它的過程,戲稱為“養(yǎng)龍蝦”。一個(gè)開源軟件
凌晨兩點(diǎn),小王合上筆記本,揉了揉酸脹的眼睛。花了一個(gè)月寫出來的10萬字短劇劇本躺在硬盤里,要真正把它拍成劇,得找演員、租場(chǎng)地、請(qǐng)攝像、做后期……粗算下來少說要幾十萬,他只能把劇本繼續(xù)鎖在抽屜里。不過,現(xiàn)在小王的劇本可以“見光”了。2026年3月19日,字節(jié)跳動(dòng)旗下的小云雀AI正式上線了短劇Agent
你一定遇到過這樣的場(chǎng)景:明明剛和AI助手聊了半個(gè)小時(shí)的項(xiàng)目細(xì)節(jié),退出會(huì)話后重新打開,它卻像個(gè)失憶患者一樣,連你上一輪說過什么背景信息都忘得一干二凈,你又得從頭把需求講一遍。這種“聊完就忘”的體驗(yàn),讓無數(shù)使用AI智能體的用戶深感頭疼。為了解決這一普遍困擾,騰訊云在4月3日正式推出了名為“龍蝦”的記憶服
4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開發(fā)者免費(fèi)開放。這是自2025年3月發(fā)布Gemma3以來,谷歌時(shí)隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個(gè)不同規(guī)格的版本:E2B(有效20億參數(shù))、E4
AI龍蝦也會(huì)生病。別怕,大部分病不是什么絕癥,自己在家就能治。我養(yǎng)OpenClaw一年多,總結(jié)出五種最常見的毛病,附上我的“土方子”,希望對(duì)你有用。病一:不吃食(完全不執(zhí)行任何任務(wù))癥狀:你給了指令,它沒反應(yīng),日志里一片空白。就像龍蝦趴在塘底不動(dòng)彈,碰它也不理。病因:通常是進(jìn)程卡死了,或者依賴服務(wù)沒