AI玩《超级马力欧兄弟》：Claude模型操作最溜，推理模型表现不佳

时间：2025-03-04 16:24:16 来源：24直播网

加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室（Hao AI Lab）上周五开展了一项独特的研究，将人工智能（AI）引入经典游戏《超级马力欧兄弟》中，以测试其性能表现。研究结果显示，在参与测试的 AI 模型中，Anthropic 的 Claude 3.7 表现最为出色，紧随其后的是 Claude 3.5。相比之下，谷歌的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4o 则表现不佳。

需要明确的是，此次实验所使用的并非 1985 年最初发布的《超级马力欧兄弟》版本。游戏运行在一个模拟器中，并通过一个名为 GamingAgent 的框架与 AI 进行连接，从而让 AI 能够控制马力欧。GamingAgent 由 Hao 人工智能实验室自主研发，其向 AI 提供基本指令，例如“如果附近有障碍物或敌人，向左移动或跳跃以躲避”，同时还提供游戏内的截图。随后，AI 通过生成 Python 代码的形式来操控马力欧。

据实验室介绍，该游戏环境迫使每个 AI 模型“学习”如何规划复杂的操作并制定游戏策略。有趣的是，实验发现像 OpenAI 的 o1 这样的推理模型（它们通过逐步思考问题来得出解决方案）表现不如“非推理”模型，尽管它们在大多数基准测试中通常表现更强。研究人员指出，推理模型在实时游戏中表现不佳的主要原因之一是它们通常需要花费数秒时间来决定行动。而在《超级马力欧兄弟》中，时机至关重要，一秒钟的差别可能意味着安全跳过和坠落死亡的不同结果。

数十年来，游戏一直是衡量 AI 性能的重要工具。然而，一些专家对将 AI 在游戏中的表现与技术进步直接挂钩的做法提出了质疑。与现实世界相比，游戏往往是抽象且相对简单的，并且能够为 AI 训练提供理论上无限的数据。

IT之家注意到，最近一些引人注目的游戏基准测试结果引发了 OpenAI 研究科学家、创始成员安德烈・卡帕西（Andrej Karpathy）所说的“评估危机”。他在 X 平台上发表的一篇帖子中写道：“我目前真的不知道该关注哪些 AI 指标。”他总结道：“我的反应是，我目前真的不知道这些模型到底有多好。”

标签模型推理操作马力超级兄弟

上一篇：新华社采访多位国内游戏制作人：国产单机游戏未来拥有无限的可能！

下一篇： mayumi更博晒照：一周内就抵达中国

AI玩《超级马力欧兄弟》：Claude模型操作最溜，推理模型表现不佳

热门数据

相关信息

合理韩网投票目前LOL战队排名：Gen.G第一！iG第三！TES第四

Chovy：加里奥5人嘲讽最印象深刻会研究对线知识

国产自研6nmGPU性能超RTX4060！东芯股份：砺算科技已向部分客户进行送样

Kiin：代表英雄卢锡安或瑞兹，对线时补刀换血和看打野位置最重要

Ti14Tidebound战队出征片：唯有热爱，可平山海，目标是冠军！

LOL官方发帖讨论最伟大的打野网友回复讨论bengicanyonOner

妥协了LCK今日公布年度最佳荣誉此前韩媒曾爆料要在年底公布

毛毛分享最佳阵容投票：MVP阿水一阵TSKanavi左手JKLMeiko

Angel谈WASD键位：感觉不好按技能啊虽然走A很好！

Canyon：中野联动实力最重要，最喜欢DWG豹女皮肤

08月30日男篮欧锦赛小组赛英国男篮瑞典男篮全场录像

08月30日NBL季后赛半决赛G1石家庄翔蓝香港金牛全场录像

08月30日WNBA常规赛印第安纳狂热洛杉矶火花全场录像

08月29日男篮美洲杯14决赛上半区加拿大男篮哥伦比亚男篮全场录像

08月29日WNBA常规赛芝加哥天空菲尼克斯水星全场录像

08月29日男篮美洲杯14决赛上半区波多黎各男篮阿根廷男篮全场录像

08月29日WNBA常规赛西雅图风暴明尼苏达山猫全场录像

08月29日WNBA常规赛华盛顿神秘人纽约自由人全场录像

08月27日NBL常规赛长沙勇胜江西鲸裕清酒全场录像

08月27日NBL常规赛合肥狂风峻茂石家庄翔蓝全场录像

相关集锦

申京28+13+8+关键抢断约基奇22+9+4土耳其胜塞尔维亚A组第1

小瓦23+7施罗德16+7+9马卡15中4德国轻取芬兰小组赛全胜

波津16+7贝尔坦斯兄弟40分克雷伊奇11分拉脱维亚大胜捷克

男篮欧锦赛瓦兰18+9拉松18+5瑞典憾负立陶宛无碍小组出线

科塔15分&2T驱逐科农楚克20分葡萄牙险胜爱沙尼亚晋级

WNBA常规赛纽约自由人5866金州女武神全场集锦

WNBA常规赛印第安纳狂热7985菲尼克斯水星全场集锦

丰泰基奥11中2阿尔达马空砍19+10意大利逆转西班牙

亚布塞莱36+6奥科博14+10劳埃德18分法国送波兰首败

申格利亚27分比塔泽21+13格鲁吉亚轻取塞浦路斯

热门TAG