PANewsは5月13日、OpenAIがAI医療システムの新たな評価ベンチマークであるHealthBenchの立ち上げを発表したと報じた。HealthBenchは60か国の医師262人によって設計され、5,000件の実際の模擬会話をカバーしている。 HealthBench は、医師が確立した採点基準を使用して、モデル応答の正確性、完全性、臨床実用性をテストしており、現在はオープンコードとデータセットを備えています。
さらに、OpenAIは今朝、Plus、Team、Proの全ユーザーが、表、画像、引用、ソースリンクを含む、フォーマットされたPDFファイルとして詳細な研究レポートをエクスポートできるようになったと発表した。この機能は新旧両方のレポートに適用され、後日 Enterprise および Edu バージョンのユーザーにも利用可能になります。