OpenAI o1-preview AI 推理模型：国际象棋中的非常规胜利，打破规则的“作弊”策略

2025-01-01 17:59

科技

科技圈最近有个挺有意思的发现，燃点网12月31号分享了一篇The Decoder的文章。文章里提到，Palisade Research这家公司测试了OpenAI的o1-preview模型，结果有点出人意料。他们让这个AI模型和国际象棋界的老大哥Stockfish来了5场对决，结果AI用了一些不太常规的手段赢了比赛，听起来像是在棋盘上“作弊”似的。

在和 Stockfish 的 5 场国际象棋对弈中，OpenAI 的 o1-preview 模型并非通过正面较量取胜，均通过修改记录棋局数据的文本文件（FEN 表示法）迫使 Stockfish 认输。

燃点网援引新闻稿，研究人员仅在提示中提及 Stockfish 是“强大的”对手，o1-preview 就自行采取了这种“作弊”行为。而 GPT-4o 和 Claude 3.5 并无这种“作弊”行为，只有在研究人员特别建议后才尝试破解系统。

该公司称 o1-preview 的行为，与 Anthropic 发现的“对齐伪造”（alignment faking）现象相符，即 AI 系统表面遵循指令，暗地里却执行其它操作。

Anthropic 的研究表明，AI 模型 Claude 有时会故意给出错误答案以避免不想要的结果，发展出自身隐藏的策略。

研究人员计划公开实验代码、完整记录和详细分析，并表示确保 AI 系统真正符合人类价值观和需求，而非仅仅表面顺从，仍是 AI 行业面临的重大挑战。

AI OpenAI

个人收藏收藏

最新资讯

宜宾凯翼汽车获汽车灯具减震固定装置专利，解决灯具异响问题

国家知识产权局的信息显示，宜宾凯翼汽车有限公司成功获得了一项名为“一种汽车灯具减震固定装置”的专利。这项专利的

宜宾凯翼汽车取得汽车灯具减震固定装置专利不会出现灯具异响的现象汽车
2026年石化行业将迎来上行拐点，焕然一新的行业新貌

现在，中国的石化行业正在经历一场深刻的结构调整，站在周期复苏的起点。行业基本面展现出供给优化、需求回暖、盈利修

焕然一新！石化行业在2026年迎来上行拐点？基金
工信部透露国产光刻胶进展，2026年相关行业国产替代有望提速

最近工信部部长在一个访谈中提到，国产光刻胶有了新进展。他展示了一个装光刻胶的玻璃瓶，说这是重大科技攻关的成果之

工信部透露“国产光刻胶最新进展” 2026年相关行业国产替代或大提速股市
首次破万亿，半导体财报亮眼，设备ETF规模创新高

昨天台积电发布了2025年第四季度的财报，单季度营收达336.7亿美元，首次突破10460.9亿新台币。净利润同比增长了35%，成功实

首次破万亿！半导体炸裂财报公布半导体设备ETF（561980）规模再创历史新高！基金
天津提车汽车销售服务有限公司正式成立，注册资本达1000万人民币，蓄势待发

根据天眼查的信息，天津提车汽车销售服务有限公司最近成立了，法定代表人是姜正明，注册资本为1000万人民币，由上海醍

天津提车汽车销售服务有限公司成立注册资本1000万人民币汽车
黄金与战略金属迎来百年一遇的价值重估时刻

大家有没有注意到，世界的基本运作逻辑正在悄然改变？最近我深入研究了一份重要的行业报告，惊奇地发现黄金、钨、锡这

黄金和战略金属正迎来百年一遇的价值重估基金
新能源汽车废旧动力电池回收利用，全生命周期监管即将开启

工业和信息化部等6部门16日联合发布《新能源汽车废旧动力电池回收和综合利用管理暂行办法》，遵循“全渠道、全链条、全

新能源汽车废旧动力电池回收利用将开启全生命周期监管汽车
中国航天重磅计划，2026年全力攻克可复用火箭技术

根据中国航天的重磅计划，2026年将全力攻克可复用火箭技术。近期，卫星产业经过近两个月的上涨后，出现了一些调整。1月

中国航天重磅表态！2026全力突破可复用火箭基金
委内瑞拉计划设立石油收入基金，修订能源法案

委内瑞拉代总统德尔西·罗德里格斯提出了修改碳氢化合物法的计划，并宣布将设立两个基金，用于管理石油销售所得的美元

委内瑞拉将设立石油收入基金并修订能源法基金
农药原药出口退税取消，行业结构升级提速

财政部和税务总局最近发布了一个新公告，提到从2026年4月1日起，要取消光伏等部分产品的出口退税，里面包括了一些农药原

农药原药出口退税取消行业结构升级加速推进股市