當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

2025大模型服務(wù)性能排行榜:PPIO吞吐測試排名第一

 2025-09-15 18:37  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

9 月 13 日,在 GOSIM2025 大會上,清華大學(xué)攜手中國軟件評測中心聯(lián)合發(fā)布了《2025 大模型服務(wù)性能排行榜》,PPIO 在 DeepSeek-R1-0528的吞吐測試中排名第一。

該榜單從延遲、吞吐、可靠性等關(guān)鍵指標(biāo)切入,由專業(yè)團(tuán)隊(duì)通過長周期、高頻率、多時(shí)段的數(shù)據(jù)評測,直觀呈現(xiàn)不同MaaS供應(yīng)商的服務(wù)表現(xiàn)。而且,平臺以匿名用戶身份對 MaaS(Model as a Service)平臺開展產(chǎn)品端到端的性能測評,從評測主體與流程上雙重保障了客觀公正性。

本次評測覆蓋多個(gè)代表性模型,包括DeepSeek-R1-0528、DeepSeek-V3.1、Kimi-K2-Instruct等。PPIO 在 20 余家 MaaS 供應(yīng)商中表現(xiàn)突出。

其中,在 DeepSeek-R1-0528 的吞吐測試中,PPIO 以45.17 tokens/s的成績位列第一。在 DeepSeek V3.1、Kimi-K2-Instruct 等模型測試中,PPIO 在吞吐與延遲性能上也取得了前五名的成績。

吞吐 (Throughput)延遲(Latency)與是評測模型表現(xiàn)的兩個(gè)重要維度。吞吐(Throughput)衡量在單位時(shí)間內(nèi)可處理的 Token 數(shù)量,高吞吐代表平臺能支撐更多用戶同時(shí)使用,尤其適合大規(guī)模應(yīng)用場景;延遲(Latency)衡量用戶從輸入到獲得首個(gè)回復(fù)所需的時(shí)間,低延遲意味著更快的響應(yīng)速度,直接影響用戶體驗(yàn)。

PPIO 在這兩個(gè)維度都表現(xiàn)優(yōu)秀,不僅能提供流暢的實(shí)時(shí)交互,也能在高并發(fā)和大規(guī)模任務(wù)處理中保持穩(wěn)定。這意味著 PPIO 的算力調(diào)度、模型部署、系統(tǒng)優(yōu)化等推理優(yōu)化的核心技術(shù),已獲得行業(yè)的權(quán)威認(rèn)可。

作為國內(nèi)領(lǐng)先的獨(dú)立分布式云計(jì)算服務(wù)商,PPIO 將持續(xù)優(yōu)化 AI 基礎(chǔ)設(shè)施,致力于為人工智能、智能體、實(shí)時(shí)音視頻處理、具身智能等新一代場景,提供極致?性價(jià)?、超彈性、低延遲的?站式智算、模型及邊緣計(jì)算服務(wù)。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
PPIO

相關(guān)文章

熱門排行

信息推薦