OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 糖果派对在线试玩
- 游戏资讯
- 3条评论
OpenAI 于 6 月 27 日正式公布了其最新的 GPT-5.6 系列模型。应美国政府的要求,目前该系列模型仅提供给少数“可信合作伙伴”进行预览,尚未全面开放。
此次发布的模型系列包含三个版本:
- 旗舰版 Sol:输入费用为每 100 万 Tokens 5 美元(约合人民币 34 元),输出费用为每 100 万 Tokens 30 美元(约合人民币 204.3 元)。
- 均衡版 Terra:输入费用为每 100 万 Tokens 2.5 美元(约合人民币 17 元),输出费用为每 100 万 Tokens 15 美元(约合人民币 102.1 元)。
- Luna:该版本专注于速度和成本效益,输入费用为每 100 万 Tokens 1 美元(约合人民币 6.8 元),输出费用为每 100 万 Tokens 6 美元(约合人民币 40.9 元)。
OpenAI 还宣布,将优化提示词缓存机制,以降低重复提示词调用的成本并提高可预测性。
在能力方面,OpenAI 将 GPT-5.6 Sol 定位为其最强大的模型,引入了新的 Max 推理强度,并配备了通过子智能体加速复杂任务的 Ultra 模式。在编程能力测试中,Sol 在 Terminal-Bench 2.1 基准测试中取得了 88.8% 的标准模式得分,超越了 Claude Mythos 5 的 88.0%;在启用 Ultra 模式后,得分更是达到了 91.9%。
在生物学领域的 GeneBench v1 测试中,GPT-5.6 系列模型在消耗更少 token 的情况下,性能优于 GPT-5.5。
在网络安全领域,GPT-5.6 Sol 在漏洞研究和利用等复杂的安全任务上表现出显著的进步。在 ExploitBench 测试中,该模型仅使用约三分之一的输出 token 即可达到与 Mythos Preview 相近的效果。
关于安全设计,OpenAI 强调 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系,包括内置的拒答机制、实时生成过程分类器、账户级别的风险审查、差异化访问控制以及监控和执法措施。对于高风险情况,系统能够暂停生成过程,由更强大的推理模型进行复核,并能在内容展示前拦截违规信息。
OpenAI 计划在未来几周内公开发布 GPT-5.6 Sol、Terra 和 Luna。此外,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,届时其处理速度最高可达每秒 750 token,初期仅对部分客户开放。
糖果派对专注热门玩法介绍,点燃游戏激情,为用户提供专业可靠的体验。
糖果派对深耕糖果派对在线试玩领域,用心服务每一位用户。
在糖果派对娱乐平台方面,糖果派对提供贴心周到的支持。
05条评论
糖果派对专注糖果派对在线试玩,为用户提供专业可靠的体验。
艾米莉·布朗特
2017年12月4日 下午3:12
围绕糖果派对娱乐平台,糖果派对持续打磨更优质的服务。
艾米莉·布朗特
2017年12月4日 下午3:12

精选活跃社区互动,结识游戏伙伴内容,糖果派对与你一同发现更多精彩。
艾米莉·布朗特
2017年12月4日 下午3:12