OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 糖果派对在线试玩

OpenAI 于 6 月 27 日正式公布了其最新的 GPT-5.6 系列模型。应美国政府的要求,目前该系列模型仅提供给少数“可信合作伙伴”进行预览,尚未全面开放。

此次发布的模型系列包含三个版本:

  • 旗舰版 Sol:输入费用为每 100 万 Tokens 5 美元(约合人民币 34 元),输出费用为每 100 万 Tokens 30 美元(约合人民币 204.3 元)。
  • 均衡版 Terra:输入费用为每 100 万 Tokens 2.5 美元(约合人民币 17 元),输出费用为每 100 万 Tokens 15 美元(约合人民币 102.1 元)。
  • Luna:该版本专注于速度和成本效益,输入费用为每 100 万 Tokens 1 美元(约合人民币 6.8 元),输出费用为每 100 万 Tokens 6 美元(约合人民币 40.9 元)。

OpenAI 还宣布,将优化提示词缓存机制,以降低重复提示词调用的成本并提高可预测性。

在能力方面,OpenAI 将 GPT-5.6 Sol 定位为其最强大的模型,引入了新的 Max 推理强度,并配备了通过子智能体加速复杂任务的 Ultra 模式。在编程能力测试中,Sol 在 Terminal-Bench 2.1 基准测试中取得了 88.8% 的标准模式得分,超越了 Claude Mythos 5 的 88.0%;在启用 Ultra 模式后,得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中,GPT-5.6 系列模型在消耗更少 token 的情况下,性能优于 GPT-5.5。

在网络安全领域,GPT-5.6 Sol 在漏洞研究和利用等复杂的安全任务上表现出显著的进步。在 ExploitBench 测试中,该模型仅使用约三分之一的输出 token 即可达到与 Mythos Preview 相近的效果。

关于安全设计,OpenAI 强调 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系,包括内置的拒答机制、实时生成过程分类器、账户级别的风险审查、差异化访问控制以及监控和执法措施。对于高风险情况,系统能够暂停生成过程,由更强大的推理模型进行复核,并能在内容展示前拦截违规信息。

OpenAI 计划在未来几周内公开发布 GPT-5.6 Sol、Terra 和 Luna。此外,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,届时其处理速度最高可达每秒 750 token,初期仅对部分客户开放。

糖果派对专注热门玩法介绍,点燃游戏激情,为用户提供专业可靠的体验。

围绕活跃社区互动,结识游戏伙伴,糖果派对持续打磨更优质的服务。

糖果派对深耕糖果派对在线试玩领域,用心服务每一位用户。

在糖果派对娱乐平台方面,糖果派对提供贴心周到的支持。