8月22日,騰訊云上線DeepSeek-V3.1版本,企業(yè)和開(kāi)發(fā)者可以通過(guò)騰訊云直接調(diào)用新版模型的API接口,獲得穩(wěn)定優(yōu)質(zhì)的服務(wù)。同時(shí),騰訊云智能體開(kāi)發(fā)平臺(tái)(ADP)也接入了新版模型,通過(guò)平臺(tái)內(nèi)置的RAG、工作流和智能體開(kāi)發(fā)的能力,用戶可以快速搭建專屬智能體應(yīng)用。新模型在騰訊云TI平臺(tái)上也第一時(shí)間上架,用戶可以基于TI平臺(tái),快速部署專屬DeepSeek-V3.1服務(wù)。
用戶可以登陸騰訊云官網(wǎng)調(diào)用新模型的接口
也可以基于騰訊云智能體開(kāi)發(fā)平臺(tái)內(nèi)置的DeepSeek-V3.1新模型快速搭建智能體。
騰訊云智能體開(kāi)發(fā)平臺(tái)內(nèi)置行業(yè)實(shí)踐流程、領(lǐng)先的 RAG 算法,只需導(dǎo)入文檔/問(wèn)答對(duì),即可讓智能體對(duì)接企業(yè)多模態(tài)知識(shí),達(dá)到穩(wěn)定精確的知識(shí)問(wèn)答效果。支持畫布式靈活編排工作流,可快速將企業(yè)系統(tǒng) API 接入智能體,智能體輸出更穩(wěn)定可控。同時(shí),提供 LLM+RAG 、Multi-agent、Workflow 等多種智能體開(kāi)發(fā)框架,支持應(yīng)用配置-應(yīng)用調(diào)試-應(yīng)用評(píng)測(cè)-應(yīng)用發(fā)布一站式工具鏈,助力企業(yè)降低智能體構(gòu)建門檻。
騰訊云智能體開(kāi)發(fā)平臺(tái)ADP
此外,DeepSeek新版模型在騰訊云TI平臺(tái)上也第一時(shí)間上架,用戶可一鍵部署DeepSeek-V3.1專屬服務(wù),滿足企業(yè)的個(gè)性化需求。TI平臺(tái)在業(yè)內(nèi)率先支持DeepSeek全系模型的企業(yè)級(jí)精調(diào)與推理全鏈路功能,為金融、醫(yī)療、制造、零售等多個(gè)行業(yè)提供了更高效、便捷的AI模型構(gòu)建及應(yīng)用方案,進(jìn)一步降低企業(yè)在大模型應(yīng)用中的技術(shù)門檻和研發(fā)成本。
騰訊云TI平臺(tái)
DeepSeek-V3.1在工具調(diào)用和智能體支持上進(jìn)一步增強(qiáng),思考效率也進(jìn)一步提升,具體體現(xiàn)在:
混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案。其測(cè)試結(jié)果顯示,經(jīng)過(guò)思維鏈壓縮訓(xùn)練后,V3.1-Think 在輸出 token數(shù)減少20%-50%的情況下,各項(xiàng)任務(wù)的平均表現(xiàn)與R1-0528持平;同時(shí),V3.1 在非思考模式下的輸出長(zhǎng)度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能夠在輸出長(zhǎng)度明顯減少的情況下保持相同的模型性能。
更強(qiáng)的 Agent 能力:通過(guò) Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。比如,在編程智能體上,在代碼修復(fù)測(cè)評(píng) SWE 與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測(cè)試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。
騰訊云是國(guó)內(nèi)率先支持DeepSeek API+聯(lián)網(wǎng)搜索的云廠商。為了提供更優(yōu)質(zhì)的DeepSeek模型服務(wù),騰訊云在推理加速層面不斷優(yōu)化,通過(guò)深挖內(nèi)核和架構(gòu)延展,以及PD分離、NIXL傳輸技術(shù),在精度幾乎無(wú)損的前提下,實(shí)現(xiàn)服務(wù)時(shí)延的大幅降低,以及吞吐能力的大幅提升。比如用戶使用DeepSeek R1,在3.5K輸入、1K輸出的典型場(chǎng)景下, 保障首Token延時(shí)不高于2秒,吐字速率不低于每秒15Tokens的同時(shí),2機(jī)16卡的QPM超過(guò)200;使用DeepSeek V3-0324,在3.5K輸入、0.67K輸出的典型場(chǎng)景下,2機(jī)16卡的QPM達(dá)到260。
通過(guò)持續(xù)的技術(shù)優(yōu)化和產(chǎn)品打磨,騰訊云DeepSeek API以及智能體開(kāi)發(fā)平臺(tái)、TI平臺(tái)已經(jīng)服務(wù)了眾多客戶,覆蓋互聯(lián)網(wǎng)、金融、零售、政務(wù)、出行等眾多領(lǐng)域。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!