1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型,哪家更適合您?

 2024-05-11 11:01  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  一鍵部署OpenClaw

隨著人工智能技術(shù)的飛速發(fā)展,大語(yǔ)言模型(Large Language Models, LLMs)在各行各業(yè)的應(yīng)用日益廣泛,尤其是在軟件開發(fā)、數(shù)據(jù)分析、客戶服務(wù)等領(lǐng)域。蘑菇云創(chuàng)客空間[445期開放夜] 就以“ChatGPT、Gemini、通義千問(wèn)等一眾大語(yǔ)言模型,哪家更適合您”這樣的主題,開展了一次深度的大語(yǔ)言模型的測(cè)評(píng)。開放夜現(xiàn)場(chǎng)測(cè)評(píng)了十幾個(gè)國(guó)內(nèi)外大語(yǔ)言模型,測(cè)評(píng)角度從邏輯、數(shù)學(xué)、翻譯、倫理等方面,深入探討和體驗(yàn)了這些大語(yǔ)言模型的實(shí)際效能。

測(cè)評(píng)的大語(yǔ)言模型:

1.Kimi 智能助手:由月之暗面科技有限公司開發(fā)的先進(jìn)AI。

2.智譜清言:由智言科技開發(fā)的大語(yǔ)言模型,以深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù)見(jiàn)長(zhǎng)。

3.訊飛星火:科大訊飛推出的創(chuàng)新語(yǔ)言模型。

4.文心一言:百度的前沿語(yǔ)言模型,致力于理解和生成自然語(yǔ)言。

5.豆包:專注于提供個(gè)性化的智能對(duì)話服務(wù)。

6.通義千問(wèn):以廣泛的知識(shí)庫(kù)和靈活的對(duì)話能力著稱。

7.海螺AI:新興的語(yǔ)言模型,擅長(zhǎng)處理復(fù)雜的語(yǔ)言任務(wù)。

8.騰訊混元助手:騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開發(fā)的大語(yǔ)言模型。

10.ChatGPT:由OpenAI開發(fā),國(guó)際上廣受認(rèn)可的更大規(guī)模、功能更全面的語(yǔ)言模型。

11.Claude:Anthropic開發(fā)的先進(jìn)語(yǔ)言模型,注重安全性和可靠性。

12.groq:以其專為AI設(shè)計(jì)的硬件加速器而聞名。

13.Gemini: OpenAI 開發(fā)的較小規(guī)模的語(yǔ)言模型,旨在提供更高效的計(jì)算和資源利用。

14.Mixtral:開源人工智能初創(chuàng)公司 Mistral AI 開發(fā)的超越GPT-3.5的AI模型

測(cè)評(píng)問(wèn)題一: 雞兔同籠的數(shù)學(xué)問(wèn)題

雞兔同籠是一個(gè)經(jīng)典的數(shù)學(xué)問(wèn)題,通過(guò)觀察雞兔的頭和腳的數(shù)量關(guān)系,可以利用代數(shù)方程來(lái)解決問(wèn)題,從而確定籠子里雞和兔子的數(shù)量。這個(gè)問(wèn)題常常展示了代數(shù)方程組的應(yīng)用。

針對(duì)雞兔同籠的問(wèn)題,除了Gemini Pro沒(méi)有得出正確的結(jié)果,其余的大語(yǔ)言模型都可以給出正確結(jié)果。

測(cè)評(píng)問(wèn)題二:翻譯(詩(shī)句中翻英)

詩(shī)人馬致遠(yuǎn)的詩(shī)句“斷腸人在天涯”,描寫了“夕陽(yáng)向西緩緩落下,只有孤獨(dú)的旅人漂泊在遙遠(yuǎn)的地方。”詩(shī)句的翻譯涉及到文化差異和詩(shī)人獨(dú)特情感。Mixtral 的語(yǔ)言模型正確的解釋了詩(shī)句本身的含義,幫助翻譯者很好地理解這句詩(shī)句。 Claude的語(yǔ)言模型對(duì)于詩(shī)句的本身理解是不正確的。

這句詩(shī)翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見(jiàn),大語(yǔ)言模型可以幫助翻譯者分析這句詩(shī)基本的意思,但是涉及文化層面的深層含義,還是做不到意譯的。

開放夜也探討了如下涉及生活、工作的一些問(wèn)題,比如:

過(guò)年福字要倒著貼,那為什么不直接生產(chǎn)倒過(guò)來(lái)的福字呢?

收到公司的裁員通知郵件,你應(yīng)該怎么回復(fù)郵件來(lái)保住工作?

一個(gè)烏龜?shù)暨M(jìn)了井里,井里有30米深。烏龜白天爬3米,晚上滑下2米。問(wèn)這只烏龜需要多長(zhǎng)時(shí)間才能爬出井口?

DFRobot AIGC小組主理人夏青在開放夜的現(xiàn)場(chǎng)測(cè)評(píng)了十幾個(gè)國(guó)內(nèi)外大語(yǔ)言模型,通過(guò)多維度問(wèn)題的測(cè)評(píng),他認(rèn)為:對(duì)于處理綜合性問(wèn)題,OpenAI的ChatGPT 4.0邏輯清楚,能提供非常有用的信息。盡管在回答一些較為復(fù)雜的問(wèn)題上略顯不足,但在大多數(shù)場(chǎng)合下,其性能仍然令人滿意。然而,ChatGPT 4.0在國(guó)內(nèi)的使用成本是一個(gè)不容忽視的問(wèn)題,不僅涉及訂閱費(fèi)用,也包括使用的技術(shù)門檻。

與此同時(shí),Gemini和Claude等海外語(yǔ)言模型,盡管在遵循指令方面略顯不足,但已達(dá)到了實(shí)用水平。令人驚喜的是,國(guó)內(nèi)的Qwen1.5 72b開源模型在中文理解和特定任務(wù),幾乎能與ChatGPT4.0匹敵此外,其他開源模型如Mixtral和新發(fā)布的LLaMA3雖在邏輯性上略遜于商業(yè)模型如ChatGPT,但總體表現(xiàn)已超越了ChatGPT 3.5。

綜合分析來(lái)看,盡管ChatGPT 4.0仍然是目前市場(chǎng)上最優(yōu)秀的大語(yǔ)言模型,但不可忽視的是,無(wú)論是國(guó)際市場(chǎng)還是國(guó)內(nèi)市場(chǎng),其他廠商的模型均顯示出迅速的進(jìn)步。開源模型的崛起也證明了開源社區(qū)在AI時(shí)代的巨大潛力。當(dāng)前的大語(yǔ)言模型在處理理性問(wèn)題方面表現(xiàn)一致,但通常無(wú)法提供情緒價(jià)值回應(yīng)。例如,一些國(guó)內(nèi)模型如“豆包”將展現(xiàn)其在情緒回應(yīng)方面的潛力。這種能力的發(fā)展可能為未來(lái)陪伴型機(jī)器人的商業(yè)模型提供新的方向。

蘑菇云創(chuàng)客空間

蘑菇云創(chuàng)客空間是上海浦東的一家創(chuàng)客空間,是科技部授牌的首批國(guó)家級(jí)創(chuàng)客空間,由浦軟孵化器提供場(chǎng)地支持、上海智位機(jī)器人提供硬件及技術(shù)支持的一家為創(chuàng)客服務(wù)的開放式創(chuàng)客空間。擁有獨(dú)立的加工室、公共協(xié)作區(qū)域以及儲(chǔ)物、耗材商店,為硬件愛(ài)好者、程序員、設(shè)計(jì)師、DIY 發(fā)燒友等各類創(chuàng)客,甚至包括進(jìn)行創(chuàng)新研發(fā)的科創(chuàng)團(tuán)隊(duì)提供一個(gè)開放式的社區(qū)化會(huì)員空間。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 養(yǎng)openclaw小龍蝦,每月要花多少錢才能養(yǎng)好?

    “養(yǎng)龍蝦”到底要花多少錢?這個(gè)問(wèn)題可能是大家最關(guān)心的。我們把成本拆成三部分:服務(wù)器租用費(fèi)+大模型API調(diào)用費(fèi)+雜項(xiàng)開銷。第一部分:服務(wù)器租用費(fèi)。最省錢的方案當(dāng)然是本地舊電腦自托管——零新增成本,電費(fèi)忽略不計(jì)。但如前所述,你需要接受“不是7×24小時(shí)在線”的局限性。如果選擇云服務(wù)器,成本差異就很大了。

  • 養(yǎng)小龍蝦用個(gè)人電腦還是云服務(wù)器?先搞清楚OpenClaw到底是什么

    不少朋友第一次接觸OpenClaw時(shí),都會(huì)有一個(gè)相同的困惑:這玩意兒到底該裝在哪里?OpenClaw(社區(qū)戲稱“養(yǎng)龍蝦”,因Logo為龍蝦鉗)不是普通的聊天機(jī)器人,而是一款本地優(yōu)先、可自主執(zhí)行、支持多Agent分工協(xié)作的AI執(zhí)行網(wǎng)關(guān)。說(shuō)白了,它讓大模型從“只會(huì)說(shuō)話”變成“會(huì)動(dòng)手做事”——幫你管理文件

  • AI龍蝦養(yǎng)了這么久,這8個(gè)建議你一定要聽

    01別相信“一鍵養(yǎng)蝦,躺平賺錢”的鬼話打開社交媒體,你可能會(huì)看到這樣的標(biāo)題:“養(yǎng)只龍蝦自動(dòng)炒股,零代碼養(yǎng)出數(shù)字巴菲特!”信了,你就輸了。真實(shí)情況是:一個(gè)做跨境電商的小哥花了200元租服務(wù)器、訂閱API,指望龍蝦幫他炒股暴富。結(jié)果龍蝦開始幾天還像模像樣,后來(lái)直接擺爛,生成個(gè)干癟的大綱就敷衍了事。AI是

  • “養(yǎng)龍蝦”火了,可你養(yǎng)的“蝦”要是闖了禍,責(zé)任到底算誰(shuí)的?

    一張證書引發(fā)的討論4月7日,北京嫣然天使兒童醫(yī)院給陳光標(biāo)發(fā)了一張感謝證書,感謝他捐贈(zèng)1000萬(wàn)元。這事說(shuō)起來(lái)挺曲折的。此前陳光標(biāo)高調(diào)說(shuō)要贈(zèng)給張雪一臺(tái)價(jià)值1300萬(wàn)元的勞斯萊斯,張雪回應(yīng)“收了,八折賣掉捐給嫣然”,一番拉扯之后,陳光標(biāo)把車變現(xiàn),1000萬(wàn)元直接打到了嫣然醫(yī)院賬上。醫(yī)院發(fā)證書感謝,本來(lái)是

  • 國(guó)家安全部發(fā)布Token安全警示:需高度警惕數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)

    2026年4月7日,國(guó)家安全部就AI核心術(shù)語(yǔ)“詞元”(Token)發(fā)布安全警示,強(qiáng)調(diào)在日均調(diào)用量突破140萬(wàn)億規(guī)模的市場(chǎng)背景下,需高度警惕由此引發(fā)的數(shù)據(jù)泄露與金融詐騙風(fēng)險(xiǎn)。據(jù)統(tǒng)計(jì),截至今年3月,我國(guó)日均詞元調(diào)用量已超過(guò)140萬(wàn)億,較2024年初增長(zhǎng)1000多倍。詞元作為大模型處理信息的最小單元,兼具

  • 中國(guó)AI大模型連續(xù)五周領(lǐng)跑全球,調(diào)用量大幅增長(zhǎng)

    如今出門,如果你還沒(méi)用過(guò)AI智能助手,可能真有點(diǎn)跟不上節(jié)奏了。無(wú)論是寫作文、查資料,還是規(guī)劃出行路線,越來(lái)越多的人已經(jīng)習(xí)慣隨手打開AI問(wèn)一句。這股熱潮背后,中國(guó)AI大模型用實(shí)打?qū)嵉臄?shù)據(jù)交出了一份亮眼的成績(jī)單。根據(jù)全球知名AI模型聚合平臺(tái)OpenRouter的最新數(shù)據(jù),在3月30日至4月5日這一周,中

    標(biāo)簽:
    大模型

熱門排行

編輯推薦