1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

率先全面開(kāi)放,文心一言為何一騎絕塵?

 2023-09-01 13:48  來(lái)源:A5專(zhuān)欄  我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

連續(xù)兩天,半夜爆出大消息。先是華為新機(jī)深夜上線(xiàn),讓芯片國(guó)產(chǎn)替代的步伐更進(jìn)一步;次日晚,百度文心一言官宣向公眾全面開(kāi)放——兩大勁爆消息直接點(diǎn)燃科技圈。

8月31日凌晨,百度官方公眾賬號(hào)即發(fā)布推文,稱(chēng)“文心一言向全社會(huì)開(kāi)放”,用戶(hù)可以在應(yīng)用商店下載“文心一言APP”或登陸“文心一言官網(wǎng)”體驗(yàn)。包括百度文心一言在內(nèi),一共有8個(gè)企業(yè)/機(jī)構(gòu)的大模型位列第一批名單,可以正式上線(xiàn)面向公眾提供服務(wù),值得注意的是,被看作文心一言競(jìng)爭(zhēng)者的阿里通義千問(wèn)、360智腦、訊飛星火等,不在首批獲批名單中。

隨后“文心一言APP”在各大應(yīng)用商店沖上熱榜,在蘋(píng)果App Store上更是直接登頂免費(fèi)榜榜首,成為當(dāng)日熱門(mén)應(yīng)用,這無(wú)疑讓百度再一次占得了先機(jī)。

此前,在獲得備案審批之前,各家只能小范圍內(nèi)測(cè),用戶(hù)需要“排隊(duì)”申請(qǐng)內(nèi)測(cè)資格,由此大大限制了大模型在用戶(hù)層面的推廣,如今大模型備案獲批和全面開(kāi)放,大模型的步伐有望邁入下一階段。

秉持著技術(shù)自主的理念,將資金大規(guī)模傾斜到自主技術(shù)研發(fā)的百度和華為,可以說(shuō)是殊途同歸,而軟硬件領(lǐng)域的“雙子星”聯(lián)袂,共同推動(dòng)技術(shù)投入走向“開(kāi)花結(jié)果”。

技術(shù)堅(jiān)守,換來(lái)厚積薄發(fā)

大模型在國(guó)內(nèi)掀起新一代技術(shù)浪潮,迅速席卷了整個(gè)互聯(lián)網(wǎng),而百度在大模型賽道上的步伐一直領(lǐng)先。2019年第一個(gè)發(fā)布了文心大模型,2023年,大廠(chǎng)中最早推出大語(yǔ)言模型“文心一言”,如今又率先獲批、得到認(rèn)可,正式向全社會(huì)開(kāi)放。

百度之所以快速踩在了大模型的全球性技術(shù)風(fēng)口上,是建立在百度雄厚的技術(shù)基底之上。

早從2010年開(kāi)始,百度就已經(jīng)著手布局AI相關(guān)技術(shù)的研發(fā),近十年來(lái),累計(jì)研發(fā)投入超過(guò) 1400 億元。其中2022 年研發(fā)費(fèi)用高達(dá) 214.16 億元,占百度核心收入比例達(dá)到 22.4%。與全球其他大廠(chǎng)相比,這些投入也是數(shù)一數(shù)二。

在高研發(fā)成本的持續(xù)投入下,這些年從最初探索深度學(xué)習(xí)等基礎(chǔ)技術(shù),到推動(dòng)AI在互聯(lián)網(wǎng)等場(chǎng)景試點(diǎn)落地,再到如今扎根千行百業(yè)、大力推進(jìn)AI工業(yè)化大生產(chǎn)等,百度既完成了在芯片、框架、模型和應(yīng)用四層構(gòu)架對(duì)應(yīng)的自研技術(shù)積累,具備了做AI基礎(chǔ)設(shè)施供給者的前提條件,又成功引領(lǐng)了AI技術(shù)成果在產(chǎn)業(yè)層面的實(shí)踐,降低了人工智能的開(kāi)發(fā)和應(yīng)用門(mén)檻。

這也使得百度無(wú)論在技術(shù)專(zhuān)利、技術(shù)產(chǎn)品還是技術(shù)應(yīng)用上,都占據(jù)了領(lǐng)先地位。以專(zhuān)利來(lái)看,根據(jù)由國(guó)家工業(yè)信息安全發(fā)展研究中心、工信部電子知識(shí)產(chǎn)權(quán)中心發(fā)布的《中國(guó)人工智能專(zhuān)利技術(shù)分析報(bào)告(2022)》顯示,百度AI專(zhuān)利申請(qǐng)量1.68萬(wàn)件,連續(xù)五年保持中國(guó)第一;專(zhuān)利授權(quán)量上,百度仍以5705件專(zhuān)利授權(quán)量位列第一。

文心一言大模型,正是百度多年技術(shù)積累和產(chǎn)業(yè)實(shí)踐的水到渠成,而基于技術(shù)和實(shí)踐的領(lǐng)先優(yōu)勢(shì),文心一言問(wèn)世不到半年,在國(guó)內(nèi)外多家調(diào)研機(jī)構(gòu)、權(quán)威媒體和高校等發(fā)布的大模型評(píng)測(cè)報(bào)告中,表現(xiàn)優(yōu)異。

如IDC最新發(fā)布的《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》,報(bào)告顯示,百度文心大模型3.5拿下12項(xiàng)指標(biāo)的7個(gè)滿(mǎn)分,綜合評(píng)分第一,算法模型第一,行業(yè)覆蓋第一。其中算法模型是大模型能力最為核心的要素,百度文心大模型在這一維度獲得了唯一的滿(mǎn)分。

更令外界欣喜的是,從測(cè)評(píng)來(lái)看,百度文心一言大模型能力從5月至今不斷提升,正在逐漸趕上國(guó)外大模型。

百度「AI大底座」的全棧能力,助力文心一言進(jìn)化

31日凌晨全面開(kāi)放后,百度文心一言APP迅速飆升至蘋(píng)果商店免費(fèi)榜榜首,成為首個(gè)登頂應(yīng)用商店榜首的中文AI原生應(yīng)用。

用戶(hù)的反響,透露出他們對(duì)文心一言表現(xiàn)出的強(qiáng)勁進(jìn)化能力的期待。自今年3月發(fā)布至今,文心一言快速成長(zhǎng),熟練掌握的創(chuàng)作體裁超過(guò)200個(gè),內(nèi)容豐富度是發(fā)布初期的1.6倍,思維鏈長(zhǎng)度是初期的2.1倍,知識(shí)點(diǎn)覆蓋達(dá)到初期的8.3倍。在一些公開(kāi)測(cè)評(píng)中,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表現(xiàn)。

這很大程度上得益于百度飛槳,百度擁有自研的深度學(xué)習(xí)平臺(tái)飛槳,它有力支撐了大模型的高效訓(xùn)練和推理。通過(guò)飛槳端到端自適應(yīng)混合并行訓(xùn)練技術(shù)以及壓縮、推理、服務(wù)部署的協(xié)同優(yōu)化,文心大模型訓(xùn)練速度達(dá)到原來(lái)的3倍,推理速度達(dá)到原來(lái)的30多倍。

飛槳和文心一言,一個(gè)是框架平臺(tái),一個(gè)是大模型,這兩者之間正好處在人工智能技術(shù)體系里面很重要的兩層,它們之間有很強(qiáng)的協(xié)同優(yōu)化潛力,由此飛槳領(lǐng)先的訓(xùn)練技術(shù),能夠優(yōu)化大模型的訓(xùn)練效率。

百度不單單在框架層和模型層擁有關(guān)鍵技術(shù)。進(jìn)入人工智能時(shí)代,IT技術(shù)的技術(shù)棧發(fā)生了根本性變化,從過(guò)去三層轉(zhuǎn)變?yōu)?ldquo;芯片-框架-模型-應(yīng)用”四層,百度則是全球?yàn)閿?shù)不多、進(jìn)行全棧布局的人工智能公司。從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,及搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用,各層都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù)。

如框架層上,百度從2016年就開(kāi)源了飛槳深度學(xué)習(xí)框架,目前這一框架已經(jīng)集成了深度學(xué)習(xí)核心訓(xùn)練和推理框架、基礎(chǔ)模型庫(kù)、端到端開(kāi)發(fā)套件等工具組件,在中國(guó)市場(chǎng)份額中排行第一。

全棧布局的優(yōu)勢(shì)在于,可以在技術(shù)棧的四層架構(gòu)中,實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率,飛槳和文心一言的優(yōu)化,就是最典型的例子。另外,芯片、框架、大模型和終端應(yīng)用場(chǎng)景,也可以形成一個(gè)高效的反饋閉環(huán),幫助大模型不斷去調(diào)優(yōu)迭代,越做越好。

比如文心一言與搜索、信息流等應(yīng)用層的協(xié)同。百度的搜索服務(wù),每天響應(yīng)幾十億次真實(shí)的用戶(hù)使用需求,每天進(jìn)行1萬(wàn)億次深度語(yǔ)義推理與匹配,能夠提供最真實(shí)、最及時(shí)的反饋,從而倒逼大模型、深度學(xué)習(xí)框架和芯片的優(yōu)化。相對(duì)地,文心一言應(yīng)用于搜索,也將帶來(lái)搜索的變革。

除了全棧自研的「AI 大底座」,百度智能云推出的兩大AI工程平臺(tái)—「AI 中臺(tái)」和「百度百舸· AI 異構(gòu)計(jì)算平臺(tái)」,也分別在開(kāi)發(fā)和資源層面進(jìn)行提效,加速訓(xùn)練過(guò)程。這給文心一言的成長(zhǎng)提供了最堅(jiān)實(shí)的技術(shù)支撐,也成為其追趕國(guó)外大模型的底氣。

核心能力升級(jí),百度加速大模型落地時(shí)代到來(lái)

5月底舉行的2023萬(wàn)象·百度移動(dòng)生態(tài)大會(huì)上,百度搜索宣布“AI伙伴”開(kāi)始內(nèi)測(cè)。這款全能的“Al伙伴”能夠聽(tīng)懂用戶(hù)的任何問(wèn)題,并用語(yǔ)音進(jìn)行互動(dòng),還能幫助用戶(hù)標(biāo)記答案中的重點(diǎn),提供權(quán)威的來(lái)源。在演示中,“Al伙伴”完整地提供了一篇人工智能大會(huì)主持詞。

百度旗下各類(lèi)用戶(hù)側(cè)產(chǎn)品正在利用大模型進(jìn)行重構(gòu),而基于大模型基座和云平臺(tái)進(jìn)行開(kāi)發(fā)生態(tài)的建設(shè)也在同步推進(jìn)。前不久,百度承辦的2023 WAVE SUMMIT上,推出了“超級(jí)助理”和“Comate X智能編程助手”。

理解、生成、邏輯和記憶,構(gòu)成了一個(gè)人工智能或者通用人工智能系統(tǒng)最基本的能力,從文心一言在C端及B端應(yīng)用上的表現(xiàn)來(lái)看,這四大核心能力正在快速提升,而背后展示出的則是百度在知識(shí)增強(qiáng)、檢索增強(qiáng)、對(duì)話(huà)增強(qiáng)方面的關(guān)鍵技術(shù)能力和差異化優(yōu)勢(shì)。

龐大的知識(shí)圖譜和搜索基礎(chǔ)上對(duì)真實(shí)數(shù)據(jù)和用戶(hù)需求的理解,是百度多年來(lái)構(gòu)建技術(shù)護(hù)城河和打造內(nèi)容生態(tài)的基礎(chǔ),因而作為百度自主研制的知識(shí)增強(qiáng)大語(yǔ)言模型,文心一言在知識(shí)增強(qiáng)和檢索增強(qiáng)方面天然具有優(yōu)勢(shì)。

據(jù)悉,百度文心大模型擁有世界上最大規(guī)模知識(shí)圖譜,包含50億實(shí)體、5500 億級(jí)事實(shí),每天調(diào)用量超過(guò)400億次。

在對(duì)話(huà)增強(qiáng)方面,百度深耕對(duì)話(huà)技術(shù)多年,前不久,王海峰帶領(lǐng)團(tuán)隊(duì)完成的「知識(shí)與深度學(xué)習(xí)融合的通用對(duì)話(huà)技術(shù)及應(yīng)用」成果,榮獲了「2022 年度吳文俊人工智能科技進(jìn)步獎(jiǎng)特等獎(jiǎng)」,這是該獎(jiǎng)項(xiàng)設(shè)立以來(lái)頒發(fā)的首個(gè)特等獎(jiǎng)。對(duì)話(huà)技術(shù)所涉及的記憶機(jī)制、上下文理解和對(duì)話(huà)規(guī)劃能力,能夠幫助文心一言實(shí)現(xiàn)更好的對(duì)話(huà)連貫性、合理性和邏輯性。

百度已經(jīng)構(gòu)建了面向中文、服務(wù)應(yīng)用、富含知識(shí)的多樣化訓(xùn)練數(shù)據(jù),并建立起人類(lèi)反饋、獎(jiǎng)勵(lì)模型和策略?xún)?yōu)化之間的飛輪機(jī)制,隨著真實(shí)用戶(hù)的反饋越來(lái)越多,文心一言的效果會(huì)越來(lái)越好,能力也越來(lái)越強(qiáng)。

而今,文心一言率先面向用戶(hù)全面開(kāi)放,也就說(shuō)未來(lái)能獲得更海量的真實(shí)世界中的人工反饋,這將進(jìn)一步改進(jìn)基礎(chǔ)模型,助力文心一言加速迭代、提升能力。而且,對(duì)用戶(hù)層面的放開(kāi),會(huì)刺激大模型競(jìng)爭(zhēng)焦點(diǎn)轉(zhuǎn)向應(yīng)用層,激起應(yīng)用開(kāi)發(fā)的創(chuàng)造活力,基于文心一言的領(lǐng)先,百度未來(lái)或?qū)⒙氏葞?lái)殺手級(jí)應(yīng)用,真正引領(lǐng)大模型進(jìn)入落地時(shí)代。

這亦是用戶(hù)想從這場(chǎng)技術(shù)性浪潮看到的,彎道超車(chē),占領(lǐng)新一代技術(shù)變革的制高點(diǎn)。

道總有理,曾用名歪道道,互聯(lián)網(wǎng)與科技圈新媒體。同名微信公眾號(hào):道總有理(daotmt)。本文為原創(chuàng)文章,謝絕未保留作者相關(guān)信息的任何形式的轉(zhuǎn)載。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
文心一言

相關(guān)文章

  • 庫(kù)克已納投名狀:蘋(píng)果AI沒(méi)得選,只能選百度

    蘋(píng)果16弄了兩個(gè)版本,一個(gè)是專(zhuān)門(mén)給中國(guó)人用的,準(zhǔn)備用百度的AI,還要交錢(qián)。第二個(gè)是全世界都可以用的,用了ChatGPT,包括臺(tái)灣、香港、澳門(mén)都可以用。以后都這樣了。好,問(wèn)題就出在這,蘋(píng)果和百度的合作出現(xiàn)問(wèn)題了,新聞連起來(lái)看,才能明白其中含義。新聞一:蘋(píng)果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

  • AI加速時(shí)代的“進(jìn)度條”,我們撥動(dòng)了百分之幾?

    “技術(shù)日新月異,人類(lèi)生活方式正在快速轉(zhuǎn)變,這一切給人類(lèi)歷史帶來(lái)了一系列不可思議的奇點(diǎn)。我們?cè)?jīng)熟悉的一切,都開(kāi)始變得陌生?!庇?jì)算機(jī)之父約翰·馮·諾依曼曾這樣說(shuō)到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說(shuō)《三體》里用來(lái)形容人類(lèi)與三體人之間的戰(zhàn)爭(zhēng)的一句話(huà)。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場(chǎng)”與“算法進(jìn)化”,中美AI競(jìng)速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀(guān)點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無(wú)法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門(mén)檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂(yōu);消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒(méi)錄你,錄了個(gè)數(shù)字人。圖片來(lái)源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來(lái)越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開(kāi)始用上了“數(shù)字員工”。甚至很多中國(guó)人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡(jiǎn)單翻看一下全國(guó)各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來(lái)到IPO關(guān)口,地平線(xiàn)離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門(mén)口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線(xiàn)已通過(guò)中國(guó)證監(jiān)會(huì)IPO備案,擬發(fā)行不超過(guò)11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車(chē)高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會(huì)引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無(wú)人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬(wàn)眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國(guó)際會(huì)展中心盛大開(kāi)幕。這場(chǎng)為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場(chǎng)逛展觀(guān)眾高達(dá)25萬(wàn)人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知

編輯推薦