阅读视图

发现新文章,点击刷新页面。

國外安全研究員砸 1,500 美元實測 13 款 AI 駭客能力:GPT-5.5 奪冠,Gemini 幾乎直接放棄

隨著 AI 越來越強大,很多人一定會好奇,如果是用在資安的場景,能不能真的找出漏洞?國外資安研究員 Kasra Rahjerdi 最近就做了這項實驗,故意設計一款有漏洞的假 App,然後花了 1,500 美元,測試 GPT-5.5、Claude、Gemini、DeepSeek、Qwen、Kimi 等多款模型能不能找出真正漏洞。沒想到,原本以為 Claude 在這塊應該會領先,結果是 GPT-5.5 奪冠,在 10 次測試中成功 7 次,是這次成功率最高的模型,而且這次數還遙遙領先其他對手。而看成本效率的話,DeepSeek V4 Pro 相當不錯,每次成功平均只花 0.62 美元。至於 Gemini,這次表現就有點慘,跑很多幾乎一開始就因為安全理由拒絕繼續,完全不想嘗試。

The post 國外安全研究員砸 1,500 美元實測 13 款 AI 駭客能力:GPT-5.5 奪冠,Gemini 幾乎直接放棄 appeared first on 電腦王阿達.

❌