Tuesday, December 23, 2025

RL加持3D生成模型登场

其他

RL加持的3D生成大模型AR3D-R1发布;盛大AI东京研究院展示数字人和世界模型成果;摩尔线程展示国产GPU实力;OpenAI讨论AI浏览器安全问题;特朗普政府暂停部分海上风电项目;ChatGPT更新功能介绍;深圳Ebike公司低调成功;日本计划对电动车加征新税;Uber与百度合作无人驾驶出租车;清闲智能旗舰店开业;IPO加速营上海开营;2025年科技圈押注玻璃技术;多智能体可信标准在ITU立项...

行业新闻

RL加持的3D生成时代来了!首个「R1 式」文本到3D推理大模型AR3D-R1登场

强化学习(RL)在大语言模型和2D图像生成中大获成功后,首次被系统性拓展到文本到3D生成领域!研究者首次系统研究了RL在3D自回归生成中的应用,并提出AR3D-R1,这是首个强化学习增强的文本到3D自回归模型。该工作系统研究了奖励设计、RL算法和评估基准,并提出Hi-GRPO——一种层次化强化学习范式,通过分离全局结构推理与局部纹理精修来优化3D生成。同时引入全新基准MME-3DR,用于评估3D生成模型的隐式推理能力。实验证明AR3D-R1在Kernel Distance和CLIP Score上均取得显著提升,达到0.156和29.3的优异成绩。

来源: 机器之心 阅读更多
AR3D-R1模型

自适应AI决策接口,协助自主实验室在材料性能上实现150%提升

美国阿贡国家实验室与芝加哥大学提出了一种AI顾问决策模型,允许AI与人类专家共同主导「自主实验室」的发现流程。AI顾问持续分析自主实验室运行数据,识别性能变化,并提示研究者调整策略。这种协作模型强调「人机共有主控权」,AI负责数据处理,人类负责综合判断与策略调整。AI顾问在MIECP探索中表现出高效性能监测与策略提示机制。

来源: 机器之心 阅读更多
AI顾问决策模型

盛大AI东京研究院于SIGGRAPH Asia正式亮相,揭晓数字人和世界模型成果

盛大AI东京研究院在SIGGRAPH Asia 2025期间完成首次公开亮相,标志着盛大在数字人的“交互智能”与世界模型的“时空智能”等两大方向的研究登上国际顶级学术与产业舞台。盛大集团创始人陈天桥强调智能体认知基底的重要性,推动了盛大AI技术的系统化研究。然而,行业仍面临长期记忆与人格一致性、多模态情感表达缺失等系统性挑战。

来源: 机器之心 阅读更多
盛大AI东京研究院

摩尔线程上演国产GPU硬核实力路演

摩尔线程最新AI计算卡S5000刷新了国产GPU的推理性能记录,单卡跑满血DeepSeek大模型成绩出色。摩尔线程首次完整揭幕其新一代统一计算架构MUSA的路线图,涵盖芯片设计、AI基础设施、基础软件到生态。MUSA架构旨在为各种形态的AI与图形计算需求提供支持。这是摩尔线程的首届MUSA开发者大会,密集发布了一系列新产品。

来源: 机器之心 阅读更多
摩尔线程S5000

热门开源项目

OpenAI:AI浏览器可能永远存在注入攻击风险

OpenAI表示,尽管AI浏览器具备自主能力,但注入攻击风险始终存在。为了应对这一问题,OpenAI正在增强其网络安全性,引入基于LLM的自动化攻击者。这表明AI浏览器的安全性仍需加强。

来源: TechCrunch 阅读更多

特朗普政府再次暂停6GW海上风电租赁

特朗普政府暂停了6GW海上风电租赁,这是其试图推迟建设靠近数据中心热点地区的海上风电项目的一部分努力。这一举措引发争议,可能影响能源转型进程。

来源: TechCrunch 阅读更多

ChatGPT:你需要了解的所有ChatGPT信息

TechCrunch提供了关于ChatGPT的更新和发布时间线,包括最新动态。ChatGPT是基于AI的强大聊天机器人,提供了专业、坦诚和幽默的语气选项。

来源: TechCrunch 阅读更多

OpenAI允许用户直接调整ChatGPT的热情水平

OpenAI允许用户直接调整ChatGPT的语气热情,这进一步定制了ChatGPT的交流风格。OpenAI添加了专业、坦诚和风趣的语气选项,用户可以根据需要选择。

来源: TechCrunch AI 阅读更多

学术论文

Are We Ready for RL in Text-to-3D Generation? A Progressive Investigation

该研究系统研究了奖励设计、RL算法和评估基准,提出一种层次化强化学习范式Hi-GRPO,通过分离全局结构推理与局部纹理精修来优化3D生成。同时引入全新基准MME-3DR,用于评估3D生成模型的隐式推理能力。实验表明AR3D-R1在Kernel Distance和CLIP Score上均取得显著提升,达到0.156和29.3的优异成绩。

来源: 机器之心 阅读更多
AR3D-R1模型

Memory in the Age of AI Agents: A Survey

该综述提出一个统一的分析框架(Forms–Functions–Dynamics),分别回答记忆以什么形式存在、解决什么问题、如何运转与演化等核心问题。该框架试图为快速扩张、却日益碎片化的“Agent Memory”重新梳理技术路径。

来源: 机器之心 阅读更多
记忆分析框架

从室内到开放世界:揭示多模态在MLLMs中的空间推理差距

现有基准无法诊断多模态语言模型(MLLMs)的空间智能不足:它们要么关注简化质性推理,要么依赖于受限的室内数据。本文介绍了一个新的大规模基准,基于行人视角视频和同步立体相机、LiDAR和IMU/GPS传感器数据构建。该基准提供了精确的3D信息,用于自动生成从质性关系推理到定量度量和动力学理解的多层次空间推理问题。

来源: ArXiv 阅读更多

技术趋势

多智能体可信标准在ITU立项

由蚂蚁集团牵头,联合中国信息通信研究院泰尔终端实验室、中国电信等单位提出的《终端多智能体系统可信要求》国际标准项目在ITU成功立项。该标准围绕“可信连接、可信身份、可信意图、可信授权”四大核心维度,为智能体间从建立连接、身份识别、意图传递到授权执行的各个环节提供明确安全指引与技术依据。

来源: 机器之心 阅读更多
多智能体标准

旧金山大停电,Waymo自动驾驶汽车瘫痪,特斯拉赢麻了

旧金山大规模停电导致Waymo自动驾驶汽车停止服务,而特斯拉自动驾驶汽车依然行驶正常。Waymo自动驾驶系统在评估十字路口时停留时间过长,而特斯拉基于真实数据的处理方式更能应对混乱。这一事件证明了国内车企智能辅助驾驶逐渐脱离高精地图和强约束的发展理念的优越性。

来源: 机器之心 阅读更多
Waymo与特斯拉对比

从室内到开放世界:揭示多模态在MLLMs中的空间推理差距

现有的基准无法诊断多模态语言模型(MLLMs)的空间智能不足:它们要么关注简化质性推理,要么依赖于受限的室内数据。本文介绍了一个新的大规模基准,基于行人视角视频和同步立体相机、LiDAR和IMU/GPS传感器数据构建。该基准提供了精确的3D信息,用于自动生成从质性关系推理到定量度量和动力学理解的多层次空间推理问题。

来源: ArXiv 阅读更多

GenEnv:难度对齐的LLM代理与环境模拟器统一演化

GenEnv框架通过建立代理与生成性环境模拟器之间的难度对齐的统一演化关系,解决大型语言模型训练瓶颈。不同于传统方法在静态数据集上进化模型,GenEnv不断生成任务,这些任务根据代理当前的能力进行调整。该方法在五个基准任务上均提高了代理性能。

来源: ArXiv 阅读更多

自底向上策略优化:你的语言模型策略秘密包含内部策略

现有的强化学习(RL)方法将大型语言模型(LLMs)视为单一统一策略,忽视了其内部机制。本文通过利用Transformer残差流的内在分割,以及隐藏状态与未嵌入矩阵组成的可采样策略之间的等价性,对语言模型策略进行分解。这种分解揭示了内部层策略和内部模块策略,对应于各个层的贡献。通过对内部策略熵的分析,发现早期层保持高熵用于探索,顶层收敛到接近零的熵用于细化,这些模式根据模型不同而变化。

来源: ArXiv 阅读更多

探索零样本ACSA中的统一意义表示

方面-类别情感分析(ACSA)通过识别评论中的特定主题及其相关情感提供了详细的见解。然而,缺乏新领域的标注数据限制了其应用。我们提出了一种新的链式推理(CoT)提示技术,利用统一意义表示(UMR)来结构化ACSA任务的推理过程。UMR方法在三个模型(Qwen3-4B、Qwen3-8B、Gemini-2.5-Pro)和四个不同数据集上进行了评估,结果显示UMR在某些模型上的效果与标准CoT基线相当。

来源: ArXiv 阅读更多

其他

GPT-5疑似独立解决开放数学问题

GPT-5首次独立解决了一个开放的数学问题,相关论文作者展示了AI生成的具体代码行。这引发了科学界是否需要这种透明度的讨论。

来源: The Decoder 阅读更多

谷歌通过收购扩大其AI基础设施

谷歌通过收购清洁能...

Views: 429Updated: Jan 15, 2026 16:13