OpenClaw代理任務評測:​​Gemini 3 Flash成功率95.1%,GPT-4o為85.2%

PANews 3月8日消息,慢霧CISO 23pads 在X 平台發文表示,PinchBench 基準測試評估AI 大語言模型在OpenClaw 代理任務中的表現,結果顯示Gemini 3 Flash 處理OpenClaw 任務成功率以95.1% 領先,minimax-m2.1、kimi-325% 3.5% 3.5% 分列。 Claude Sonnet 4.5 則為92.7%,GPT-4o 為85.2%。

分享至:

作者:PA一线

本內容只為提供市場資訊,不構成投資建議。

關注PANews官方賬號,一起穿越牛熊