OpenClaw代理任务评测：Gemini 3 Flash成功率95.1%，GPT-4o为85.2% | PANews

OpenClaw代理任务评测：Gemini 3 Flash成功率95.1%，GPT-4o为85.2%

PANews 3月8日消息，慢雾 CISO 23pads 在 X 平台发文表示，PinchBench 基准测试评估 AI 大语言模型在 OpenClaw 代理任务中的表现，结果显示 Gemini 3 Flash 处理 OpenClaw 任务成功率以 95.1% 领先，minimax-m2.1、kimi-k2.5 则分别以 93.6%、93.4% 分列 2、3 位。Claude Sonnet 4.5 则为 92.7%，GPT-4o 为 85.2%。

分享至：

作者：PA一线

本内容只为提供市场信息，不构成投资建议。

关注PANews官方账号，一起穿越牛熊

PANews微信群

Telegram交流群

Telegram资讯频道

推荐阅读

PA一线

9分钟前

OpenClaw发布3.7测试版本，新增支持GPT-5.4与Gemini Flash 3.1

PA一线

28分钟前

Hyperliquid早期贡献者Loracle开设2倍杠杆WTI原油期货空单

PA一线

40分钟前

某神秘巨鲸从CEX提取总计8.535亿枚PUMP，现持仓增至87.1亿枚

PA一线

42分钟前

香港财政司司长：香港将构建黄金和大宗商品交易生态圈

PA一线

55分钟前

链上担保去中心化协议OmniPact完成5000万美元私募融资

PA一线

2小时前

Paradex低调发币：DIME总供应10亿枚，当前FDV约4300万美元