PANews 5月15日消息,根據OpenAI官方公告,為提高模型安全透明度,OpenAI宣布上線「安全評估中心」(Safety Evaluations Hub),用於持續發布旗下模型在有害內容、越獄攻擊、幻覺生成、指令優先級等方面的安全表現結果。相較於系統卡片只在模型發佈時披露一次性數據,該中心將隨模型更新周期性更新,支持不同模型間橫向比較,旨在提升社區對AI安全性的理解與監管透明度。目前,GPT-4.5與GPT-4o在越獄攻擊抵抗與事實準確度方面表現最為出色。