行业动态

开云网站：不会打游戏的大模型不是好AI？甲骨文最强模型用《宝可梦》当“期末考”

发布时间：2025-02-25 17:39人气：

　　周一发布了其最强模型Claude 3.7 Sonnet，据甲骨文称，该模型同时具备推理能力和传统实时生成文本的能力，是市面上唯一的混合模型。

　　Claude 3.7 Sonnet的一个独特功能是其能够进行拓展思考，与OpenAI的o3-mini和Deepseek R1一样，它可以在增加计算和时间成本的基础上来推理更具挑战性的问题。

　　而测试Claude 3.7 Sonnet推理能力的一项重要测试就是打游戏。

　　据甲骨文周一的博客文章显示，该公司在《精灵宝可梦（红）》测试了Claude 3.7 Sonnet，为模型配备了基本内存、屏幕像素输入和功能调用，以便模型可以连续闯关并不受模型的上下文限制。

　　好消息是，3.7版本的模型与3.0版本相比“大有出息”。上一个版本3.0连离开游戏新手村都做不到，而3.7已经成功走到宝可梦道馆Boss身前，并击败道馆领袖赢得了徽章。

开云网站：不会打游戏的大模型不是好AI？甲骨文最强模型用《宝可梦》当“期末考”(图1)

　　不过，甲骨文并未公布3.7花费了多少计算能力才做到这一步，以及每闯完一关所耗费的时间。甲骨文只透露，3.7 Sonnet执行了35000次操作才打到最后一位道馆馆主Surge处。

　　利用游戏作为人工智能模型的基准测试实际上在业内也并不罕见，加州理工大学和英伟达的一支团队此前就推出过Voyager组件，与GPT-4交互来攻略另一款热门游戏《我的世界》。

开云网站：不会打游戏的大模型不是好AI？甲骨文最强模型用《宝可梦》当“期末考”(图2)

　　Voyager据介绍包括三个关键模块：最大化探索的自动课程；用于存储和检索复杂行为的技能库与生成可执行代码的新迭代提示机制。据研究团队介绍，Voyager表现出强大的情境学习能力，获得的独特物品、行近距Kaiyun官方中国离以及解锁成就的速度都优于基准人工智能模型。

　　上周，微软也官宣加入了AI打游戏的潮流之中。微软推出了一款模型Muse可以生成游戏视觉效果和控制器输入，称其可以支持人们在设计游戏时的创造力，并已经在多人竞技战斗游戏《Bleeding Edge》中进行训练。

　　Gaming AI公司副总裁Fatima Kardar Kaiyun官方中国表示，Muse的突破之处在于它对3D游戏的详细了解，包括游戏物理以及游戏如何对玩家的控制操作做出反应。这意味着该模型能够创建一致且多样化的游戏玩法，进一步帮助到游戏创作者。

　　特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

　　传新希望养猪基地裁3000人，换成机械臂成本直线开云网站下降，失业的农民该怎么办？

　　抢票堪比明星演唱会：贵阳一影城被“哪吒”带成顶流，创始人苦恼的却是这件事⋯⋯

　　续命16-0！森林狼加时25分逆转雷霆亚历山大39+10+8丢绝平三分

　　国补遇上开学焕新季！nova 13系列与nova Flip成为你的新学期时尚拍档

　　泄露CAD渲染图中的三星Galaxy Z Fold7看起来与Z Fold6非常相似

　　机票价格大跳水！多个城市热门航线元卖上海迪士尼山寨VIP套餐！被判部分退款

KAIYUN中国·官方网站-开云中国门户入口