當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

Check Point旗下公司Lakera推出面向AI代理的大型語言模型開源安全基準測試

 2025-11-04 10:59  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

Check Point旗下公司Lakera推出面向AI代理的大型語言模型開源安全基準測試

2025年11月, 網(wǎng)絡安全解決方案的先驅與全球領導者Check Point軟件技術有限公司(納斯達克股票代碼:CHKP)與行業(yè)領先、專注于AI代理應用安全的AI原生安全平臺Lakera,聯(lián)合英國人工智能安全研究所(AISI)的研究人員,近日發(fā)布專為AI智能體中大型語言模型(LLM)安全設計的開源安全評估工具——骨干破壞基準測試(backbone breaker benchmark )b3。

b3 基于“威脅快照”的新理念構建,不再模擬人工智能代理從始至終的完整過程,而是聚焦于大語言模型最易暴露漏洞的關鍵節(jié)點。通過在這些精確時刻測試模型,開發(fā)者和模型供應商無需構建復雜的完整代理工作流,即可評估其系統(tǒng)在更真實對抗挑戰(zhàn)中的抗壓能力。

“我們創(chuàng)造b3基準測試,是因為當今人工智能代理的安全性完全取決于其背后的LLM模型,”Check Point旗下公司Lakera的聯(lián)合創(chuàng)始人兼首席科學家Mateo Rojas-Carulla表示。“威脅快照功能讓我們能夠系統(tǒng)性地揭示那些至今仍隱藏在復雜代理工作流中的漏洞。通過向全球開放該基準測試,我們希望為開發(fā)者和模型供應商提供一種切實可行的方法,來衡量并提升其安全態(tài)勢。”

該基準測試結合了10個具有代表性的代理“威脅快照”,以及通過紅隊對抗測試Gandalf: Agent Breaker收集的19,433個高質量眾包對抗攻擊數(shù)據(jù)集。它評估了系統(tǒng)對各類攻擊的易受攻擊性,包括系統(tǒng)提示泄露、釣魚鏈接植入、惡意代碼注入、拒絕服務攻擊以及未授權工具調用等。

該項目現(xiàn)已通過開源許可證發(fā)布,地址為https://arxiv.org/abs/2510.22620

Gandalf: Agent Breaker是一款黑客模擬游戲,挑戰(zhàn)玩家在真實場景中破解并利用AI代理的能力。游戲內置的十款通用人工智能應用程序模擬了現(xiàn)實世界中AI代理的行為模式。每款應用均設有不同難度等級、分層防御機制及創(chuàng)新攻擊面,旨在考驗從提示工程到紅隊對抗等全方位技能。部分應用基于聊天交互,其余則需運用代碼級思維、文件處理、內存操作或外部工具使用等能力。

Gandalf: Agent Breaker的初始版本誕生于Lakera內部的黑客馬拉松競賽,當時藍隊與紅隊試圖為持有秘密密碼的大型語言模型構建最強大的防御與攻擊體系。自2023年發(fā)布以來,它已成為全球規(guī)模最大的紅隊對抗社區(qū),累計生成逾8000萬條數(shù)據(jù)點。這款最初作為趣味游戲開發(fā)的工具,通過揭示生成式AI應用中的現(xiàn)實漏洞,有效提升了人們對“AI優(yōu)先安全”重要性的認知。

關于 Check Point 軟件技術有限公司

Check Point 軟件技術有限公司是數(shù)字信任領域的領先保護者,通過 AI 驅動的網(wǎng)絡安全解決方案,保護全球超過 100,000 家組織與機構免受網(wǎng)絡威脅。Check Point 通過其 Infinity 平臺與開放生態(tài)系統(tǒng),堅持“預防為先”的理念,在提升安全效能的同時降低企業(yè)風險。依托以 SASE 為核心的混合網(wǎng)格架構,Infinity 平臺實現(xiàn)了本地、云端及辦公環(huán)境的統(tǒng)一管理,為企業(yè)及服務提供商帶來靈活、簡潔、可擴展的網(wǎng)絡安全能力。

關于Lakera

Lakera是面向智能代理AI應用的領先原生AI安全平臺,致力于保護《財富》500強企業(yè)及頂尖科技公司免受新興AI網(wǎng)絡風險威脅。依托全球頂尖紅隊社區(qū)Gandalf及其專有AI技術,Lakera的防御體系能實時進化,為企業(yè)抵御新興威脅。Lakera由David Haber、Mateo Rojas-Carulla博士與Matthias Kraft博士于2021年聯(lián)合創(chuàng)立,總部位于蘇黎世與舊金山雙城。了解更多信息,請訪問Lakera.ai,體驗Gandalf及Gandalf:Agent Breaker,并通過領英關注我們。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
Check
Point

相關文章

  • Check Point收購Lakera,GenAI 防護體系全面升級

    CheckPoint收購Lakera,GenAI防護體系全面升級最近一兩年,生成式AI正迅速成為企業(yè)業(yè)務發(fā)展的新引擎。從內容生成、客戶支持到自動分析與輔助決策,越來越多的企業(yè)將大型語言模型(LLM)與GenAI應用嵌入核心流程。然而,當企業(yè)加速推動智能化時,一個愈發(fā)突出的現(xiàn)實問題正在出現(xiàn):AI的創(chuàng)新

    標簽:
    Check
    Point
  • Check Point研究報告顯示,10月全球生成式人工智能數(shù)據(jù)風險加劇

    CheckPoint研究報告顯示,10月全球勒索軟件激增48%,生成式人工智能數(shù)據(jù)風險加劇商業(yè)服務、消費品及制造業(yè)成為勒索軟件最嚴重影響的領域,每44條生成式人工智能提示語中就有1條存在數(shù)據(jù)泄露風險。2025年11月–網(wǎng)絡安全解決方案的先驅與全球領導者CheckPoint軟件技術有限公司(納斯達克股

    標簽:
    Check
    Point
  • Check Point攜手NVIDIA BlueField,重新定義企業(yè)人工智能安全防護

    CheckPoint攜手NVIDIABlueField,重新定義企業(yè)人工智能安全防護AICloudProtect保護人工智能模型、工作負載和智能代理應用免受最新網(wǎng)絡威脅2025年11月,網(wǎng)絡安全解決方案的先驅與全球領導者CheckPoint軟件技術有限公司.(納斯達克代碼:CHKP)近日宣布,正與英

    標簽:
    Check
    Point
  • Check Point:制造業(yè)面臨的網(wǎng)絡威脅持續(xù)升級,管理者需主動應對

    CheckPoint最新發(fā)布的《制造業(yè)安全報告》顯示,制造業(yè)正成為網(wǎng)絡攻擊者的主要目標。隨著智能制造和數(shù)字化工廠的普及,網(wǎng)絡風險從IT系統(tǒng)蔓延至生產設備、供應鏈與運營環(huán)節(jié)。對企業(yè)而言,網(wǎng)絡安全已不再只是技術問題,而是影響生產、營收與品牌聲譽的關鍵業(yè)務風險。攻擊激增,代價高昂根據(jù)CheckPointR

    標簽:
    Check
    Point
  • Check Point 公司憑借公有區(qū)塊鏈安全創(chuàng)新入選《Fast Company》“Next Big Things in Tech”榜單

    CheckPoint公司憑借公有區(qū)塊鏈安全創(chuàng)新入選《FastCompany》2025年度“NextBigThingsinTech”榜單2025年10月,全球網(wǎng)絡安全解決方案的領先廠商CheckPoint軟件技術有限公司(納斯達克代碼:CHKP)今日宣布,憑借在保護公有區(qū)塊鏈免受新興網(wǎng)絡威脅方面的創(chuàng)新

    標簽:
    Check
    Point
    公司

熱門排行

信息推薦