1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?

 2024-05-11 11:01  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

隨著人工智能技術(shù)的飛速發(fā)展,大語言模型(Large Language Models, LLMs)在各行各業(yè)的應(yīng)用日益廣泛,尤其是在軟件開發(fā)、數(shù)據(jù)分析、客戶服務(wù)等領(lǐng)域。蘑菇云創(chuàng)客空間[445期開放夜] 就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語言模型的測評。開放夜現(xiàn)場測評了十幾個(gè)國內(nèi)外大語言模型,測評角度從邏輯、數(shù)學(xué)、翻譯、倫理等方面,深入探討和體驗(yàn)了這些大語言模型的實(shí)際效能。

測評的大語言模型:

1.Kimi 智能助手:由月之暗面科技有限公司開發(fā)的先進(jìn)AI。

2.智譜清言:由智言科技開發(fā)的大語言模型,以深度學(xué)習(xí)和自然語言處理技術(shù)見長。

3.訊飛星火:科大訊飛推出的創(chuàng)新語言模型。

4.文心一言:百度的前沿語言模型,致力于理解和生成自然語言。

5.豆包:專注于提供個(gè)性化的智能對話服務(wù)。

6.通義千問:以廣泛的知識庫和靈活的對話能力著稱。

7.海螺AI:新興的語言模型,擅長處理復(fù)雜的語言任務(wù)。

8.騰訊混元助手:騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開發(fā)的大語言模型。

10.ChatGPT:由OpenAI開發(fā),國際上廣受認(rèn)可的更大規(guī)模、功能更全面的語言模型。

11.Claude:Anthropic開發(fā)的先進(jìn)語言模型,注重安全性和可靠性。

12.groq:以其專為AI設(shè)計(jì)的硬件加速器而聞名。

13.Gemini: OpenAI 開發(fā)的較小規(guī)模的語言模型,旨在提供更高效的計(jì)算和資源利用。

14.Mixtral:開源人工智能初創(chuàng)公司 Mistral AI 開發(fā)的超越GPT-3.5的AI模型

測評問題一: 雞兔同籠的數(shù)學(xué)問題

雞兔同籠是一個(gè)經(jīng)典的數(shù)學(xué)問題,通過觀察雞兔的頭和腳的數(shù)量關(guān)系,可以利用代數(shù)方程來解決問題,從而確定籠子里雞和兔子的數(shù)量。這個(gè)問題常常展示了代數(shù)方程組的應(yīng)用。

針對雞兔同籠的問題,除了Gemini Pro沒有得出正確的結(jié)果,其余的大語言模型都可以給出正確結(jié)果。

測評問題二:翻譯(詩句中翻英)

詩人馬致遠(yuǎn)的詩句“斷腸人在天涯”,描寫了“夕陽向西緩緩落下,只有孤獨(dú)的旅人漂泊在遙遠(yuǎn)的地方。”詩句的翻譯涉及到文化差異和詩人獨(dú)特情感。Mixtral 的語言模型正確的解釋了詩句本身的含義,幫助翻譯者很好地理解這句詩句。 Claude的語言模型對于詩句的本身理解是不正確的。

這句詩翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見,大語言模型可以幫助翻譯者分析這句詩基本的意思,但是涉及文化層面的深層含義,還是做不到意譯的。

開放夜也探討了如下涉及生活、工作的一些問題,比如:

過年福字要倒著貼,那為什么不直接生產(chǎn)倒過來的福字呢?

收到公司的裁員通知郵件,你應(yīng)該怎么回復(fù)郵件來保住工作?

一個(gè)烏龜?shù)暨M(jìn)了井里,井里有30米深。烏龜白天爬3米,晚上滑下2米。問這只烏龜需要多長時(shí)間才能爬出井口?

DFRobot AIGC小組主理人夏青在開放夜的現(xiàn)場測評了十幾個(gè)國內(nèi)外大語言模型,通過多維度問題的測評,他認(rèn)為:對于處理綜合性問題,OpenAI的ChatGPT 4.0邏輯清楚,能提供非常有用的信息。盡管在回答一些較為復(fù)雜的問題上略顯不足,但在大多數(shù)場合下,其性能仍然令人滿意。然而,ChatGPT 4.0在國內(nèi)的使用成本是一個(gè)不容忽視的問題,不僅涉及訂閱費(fèi)用,也包括使用的技術(shù)門檻。

與此同時(shí),Gemini和Claude等海外語言模型,盡管在遵循指令方面略顯不足,但已達(dá)到了實(shí)用水平。令人驚喜的是,國內(nèi)的Qwen1.5 72b開源模型在中文理解和特定任務(wù),幾乎能與ChatGPT4.0匹敵此外,其他開源模型如Mixtral和新發(fā)布的LLaMA3雖在邏輯性上略遜于商業(yè)模型如ChatGPT,但總體表現(xiàn)已超越了ChatGPT 3.5。

綜合分析來看,盡管ChatGPT 4.0仍然是目前市場上最優(yōu)秀的大語言模型,但不可忽視的是,無論是國際市場還是國內(nèi)市場,其他廠商的模型均顯示出迅速的進(jìn)步。開源模型的崛起也證明了開源社區(qū)在AI時(shí)代的巨大潛力。當(dāng)前的大語言模型在處理理性問題方面表現(xiàn)一致,但通常無法提供情緒價(jià)值回應(yīng)。例如,一些國內(nèi)模型如“豆包”將展現(xiàn)其在情緒回應(yīng)方面的潛力。這種能力的發(fā)展可能為未來陪伴型機(jī)器人的商業(yè)模型提供新的方向。

蘑菇云創(chuàng)客空間

蘑菇云創(chuàng)客空間是上海浦東的一家創(chuàng)客空間,是科技部授牌的首批國家級創(chuàng)客空間,由浦軟孵化器提供場地支持、上海智位機(jī)器人提供硬件及技術(shù)支持的一家為創(chuàng)客服務(wù)的開放式創(chuàng)客空間。擁有獨(dú)立的加工室、公共協(xié)作區(qū)域以及儲(chǔ)物、耗材商店,為硬件愛好者、程序員、設(shè)計(jì)師、DIY 發(fā)燒友等各類創(chuàng)客,甚至包括進(jìn)行創(chuàng)新研發(fā)的科創(chuàng)團(tuán)隊(duì)提供一個(gè)開放式的社區(qū)化會(huì)員空間。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運(yùn)賽項(xiàng)桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會(huì)暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會(huì)堂舉行,大會(huì)以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗(yàn),為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機(jī)器人有限公司(以下簡稱"開普勒機(jī)器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動(dòng) Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會(huì)在京召開

    在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動(dòng)
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會(huì)在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)