OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5

OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5 - 糖果派对在线试玩

游戏资讯
3条评论

OpenAI 于 6 月 27 日正式公布了其最新的 GPT-5.6 系列模型。应美国政府的要求，目前该系列模型仅提供给少数“可信合作伙伴”进行预览，尚未全面开放。

此次发布的模型系列包含三个版本：

旗舰版 Sol：输入费用为每 100 万 Tokens 5 美元（约合人民币 34 元），输出费用为每 100 万 Tokens 30 美元（约合人民币 204.3 元）。
均衡版 Terra：输入费用为每 100 万 Tokens 2.5 美元（约合人民币 17 元），输出费用为每 100 万 Tokens 15 美元（约合人民币 102.1 元）。
Luna：该版本专注于速度和成本效益，输入费用为每 100 万 Tokens 1 美元（约合人民币 6.8 元），输出费用为每 100 万 Tokens 6 美元（约合人民币 40.9 元）。

OpenAI 还宣布，将优化提示词缓存机制，以降低重复提示词调用的成本并提高可预测性。

在能力方面，OpenAI 将 GPT-5.6 Sol 定位为其最强大的模型，引入了新的 Max 推理强度，并配备了通过子智能体加速复杂任务的 Ultra 模式。在编程能力测试中，Sol 在 Terminal-Bench 2.1 基准测试中取得了 88.8% 的标准模式得分，超越了 Claude Mythos 5 的 88.0%；在启用 Ultra 模式后，得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中，GPT-5.6 系列模型在消耗更少 token 的情况下，性能优于 GPT-5.5。

在网络安全领域，GPT-5.6 Sol 在漏洞研究和利用等复杂的安全任务上表现出显著的进步。在 ExploitBench 测试中，该模型仅使用约三分之一的输出 token 即可达到与 Mythos Preview 相近的效果。

关于安全设计，OpenAI 强调 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系，包括内置的拒答机制、实时生成过程分类器、账户级别的风险审查、差异化访问控制以及监控和执法措施。对于高风险情况，系统能够暂停生成过程，由更强大的推理模型进行复核，并能在内容展示前拦截违规信息。

OpenAI 计划在未来几周内公开发布 GPT-5.6 Sol、Terra 和 Luna。此外，OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol，届时其处理速度最高可达每秒 750 token，初期仅对部分客户开放。

糖果派对专注热门玩法介绍，点燃游戏激情，为用户提供专业可靠的体验。

围绕活跃社区互动，结识游戏伙伴，糖果派对持续打磨更优质的服务。

糖果派对深耕糖果派对在线试玩领域，用心服务每一位用户。

在糖果派对娱乐平台方面，糖果派对提供贴心周到的支持。

糖果派对围绕专业攻略解析，助您轻松通关不断创新，回应用户的真实需求。

糖果派对围绕热门玩法介绍，点燃游戏激情不断创新，回应用户的真实需求。

05条评论

精选活跃社区互动，结识游戏伙伴内容，糖果派对与你一同发现更多精彩。

想了解更多糖果派对APP相关内容，尽在糖果派对。