
这些天的目标已经经常移动。同时,小酋长直接到达现场,花了1亿美元来寻找人们。同时,我的智能家具研究也包括在一份40页的大型文章的报告中。除了世界陈词滥调模型外,最引人注目的是,该报告将人类精神状态的推断与物理世界模型相同,并将其概念化为心理世界模型。与传统的世界模型(例如Lecun的JAPA)相比,该模型仅着眼于物理方法(物体运动,机械因果关系),心理世界模型将心理方法(意图,情感,社会关系)纳入了世界模型的框架中,以执行“双重跟踪模型”。我不得不说,目标仍然太先进了!从世界物理模型到世界模型,目标对莱肯领导下的伟大模式有许多抱怨,而本报告没有例外。最大的模型功能强大,但它们太肿了,缺乏效率和缺乏抽象的推理能力。当他回家并打开门时,他不会预测下一秒钟的每个像素,而是会创建相应的动作,例如专注于门的状态(开关)和锁眼的位置,并完成找到钥匙并进入门的任务。因此,要建立人类类型的化身代理,世界模型必须抽象有关感知的有用信息,以了解环境并采取原因,计划和行动。问题是,什么是有用的信息?在这里,该报告将世界模型的必要信息分为两类。类别是世界物理模型所需的信息。其中包括对象及其属性之间的空间关系(形状,大小,颜色等),以及对象之间空间关系的动态变化(for示例,接近度,距离)和环境(运动,时间)以及基于物理定律结果之间因果关系的变化。另一个类别是精神世界模型的必要信息。这意味着了解用户和情感状态的情绪,包括用户的情绪和情绪状态,以及这些情绪如何影响其行为,这些行为受到个人,群体,机构和文化规范,习惯和非语言视觉而不是视觉的影响。并捕捉社会动态,包括文化规范,习俗和期望,以了解肢体语言的作用。我们都熟悉物理模型的作用。例如,了解牛顿定律可以使aencarious人民预测对象在未来环境中的运动。例如,从桌子边缘掉下来的一支笔会引起自由的秋天运动,而代理必须在地面掉落之前抓住笔。那我们为什么要st我需要心理世界模型?对于人类而言,心理世界模型是世界的心理代表过程,包括对象,事件和人际关系的代表。这使得人类可以模拟情况,预测结果,实施落后和因果推理以做出更明智的决定。例如,小明在汉堡餐厅收到了一个烤汉堡,说他很生气,离开了汉堡餐厅,没有付款。然后,根据Mental Mundo模型,我们可以合理地推断小米没有吃那种汉堡包。因此,为了更好地支持人类,代理人必须了解人类心理状态,并了解人类行为和文化实践的模式。为了实现这一目标,需要一种精神世界模型来表征人类用户或其他AI代理商的心理状态。通过表达和理解这些心理状态,化身可以预测用户的目标和意图,提供积极的帮助和指导,帮助用户实现目标,猜测信念上的差异,并预测具有虚假信念的人如何在情感上做出反应,从而调整其策略以更好地满足用户需求。这大大提高了人类计算机相互作用的效率和舒适性和多种互动。那么,您怎么知道这不会犯错,会导致问题或给您更多帮助?作为响应,Meta设计了一组参考点,以证明构建代理的性能。不幸的是,以LTO对目标的推测为例,在推理多模式目标的首个参考视图中,视觉语言模型的成功率仅为55%,远非使用水平。是的,这条路仍然很长。世界的未来模型是“忧郁”,但是身体(心理)世界模型仍然是一个有希望的方向。为了实现这一目标,Meta在报告中指出:允许AI具有真正独立的学习能力,这是必要的将观察性学习与系统B的学习结合在一起的动作B的研究。系统A学习了大量感知数据的抽象表示(例如自我控制,而不是监督学习)。优势在于它使您能够有效地学习一般和抽象的表达方式。这对于后续任务将很有用。但是给您带来的不便是它需要许多干净的数据。我不知道该学习什么。您所学的是困难与实际动作相结合的。在许多情况下,它只能“理解”,而不一定会“使用它”。 System B是关于通过探索,证明和错误(例如增强学习)来学习做事。优势在于它可以与真实行为直接相关,该行为适应动态环境并发现全新的发现形式。但是缺点是它非常低效,需要许多实验来学习简单的任务。陷入复杂的情况很容易。他们还特别信任明确的奖励信号,通常没有真正的Reaisas。简而言之,系统A可以提取大数据知识,但这不是“实用”。系统B在探索和行为方面非常出色,但学习效率低。通过有效整合两者,系统A提供了抽象结构,以前的表示和压缩,从而使B系统有效地计划。系统B提供了积极的搜索和系统A的实际验证,以收集更好的数据。他意识到,感知驱动的行动丰富了感知并促进了人工智能系统中的自主进步。另一种心理世界模型的当前表现仍然不成熟,但是它在多种代理的协作中的潜力不能低估。在多个代理商中建立“共识思维”是一种理论。它提供了一个支持点。每个代理人不仅可以看到外界,而且可以推断他人的信念和意图,比单一的感知形成更大的理解。当几个登陆代理人一起执行任务时,心理模型有助于协调目标,协调行动并在不确定的环境中找到冲突的平衡。这也是允许机械相互作用从移情和情境机械执行转变的重要步骤。从这个意义上讲,心理世界模型可能不是一条简单的途径,但它为化身智力打开了更复杂的社会形式。报告链接:https://arxiv.org/abs/2506.22355本文来自微信公共帐户:量子位(ID:QBITAI),作者:亨利:亨利:亨利: