Sunday, November 30, 2025

AI驱动淘金热:大模型、行业应用与政策新风向

新闻

AI驱动的行情里,AI成为淘金工具;NeurIPS 2025提出DynaAct和OWL,探索大模型推理新路径;世界模型接近ChatGPT时刻;AI在航空、快递、货运、医疗等领域应用广泛;ICLR清零rebuttal事件引发争议;NeurIPS提出REG让Diffusion训练更快;AI监管竞赛引发联邦与州之争;OpenAI和Google预测AI改变市场策略;特斯拉计划在数据中心旁建设小型太阳能农场...

行业新闻(重要新闻、公司动态)

AI驱动的行情里,AI终于成了淘金的铲子

AI的股票,最终还是让AI炒了。AI 这一波,会上升到什么高度?最近,一张资本内循环的示意图在硅谷疯传,箭头从投资者指向 OpenAI,从 OpenAI 指向英伟达,再从英伟达绕回 OpenAI 的股东名单。钱在几家科技巨头之间画了一个圈,成为了 AI 繁荣在市场层面的写照。一系列交易与合作,撑起了万亿美元的市值。这个圈子看上去很复杂?公司都是我们耳熟能详的公司,但在推动人工智能技术前进的过程中,它们不断合作,有着复杂的内在联系。复杂精密的资金网络...阅读更多

AI驱动的行情里,AI终于成了淘金的铲子

热门开源项目(GitHub项目、工具推荐)

DynaAct:大模型推理的新思路

来自蚂蚁和香港大学自然语言组的研究团队提出了 DynaAct,该工作已经被 NeurIPS 2025 接收。DynaAct 提出以 Action Space Optimization 为核心的 TTS 范式,即在每一步推理中动态构建可选动作集合,并通过学习算法从中选择最优动作,从而让推理路径更高效、更具结构化。这种方法与传统 token-by-token 式的 CoT 不同,旨在解决当前主流 TTS 方法通过「更长的思维链」来提升性能时伴随而来的搜索空间爆炸与冗余思考的问题。DynaAct 的核心思想是将动作空间学习问题转化为集合选择问题,并通过子模优化(Submodular Optimization)来实现线性复杂度的算法。...阅读更多

学术论文(最新研究、论文摘要)

OWL:双路径注意力干预缓解多模态大模型物体幻觉

该论文提出 Owl,一种基于因果关系的双路径注意力干预框架,用于缓解视觉语言大模型中的物体幻觉。首先,该论文提出一个结构因果模型,将分解后的视觉与文本注意力形式化为关键的中介变量,模型清晰地表明,视觉与文本先验这两个混杂因子,会通过扭曲对应的注意力来影响输出,最终导致幻觉。其次,该论文提出了 VTACR 指标,通过计算当前生成 token 对所有视觉 token 的平均注意力与对所有文本 token 的平均注意力之比,...阅读更多

OWL:双路径注意力干预缓解多模态大模型物体幻觉

技术趋势(技术突破、创新应用)

REG加速生成模型训练收敛

REG 是一种简单而有效的方法,仅通过引入一个 class token 便能大幅加速生成模型的训练收敛。其将基础视觉模型(如 DINOv2)的 class token 与 latent 在空间维度拼接后共同加噪训练,从而显著提升 Diffusion 的收敛速度与性能上限。在 ImageNet 256×256 上,REG 相比 SiT 和 REPA 分别实现了 63 倍和 23 倍的收敛加速,如下图所示。REG 方法的核心在于将 low-level latent 与预训练视觉模型的 high-level class token 纠缠,并在训练中对二者同时加噪、联合去噪优化,...阅读更多

REG加速生成模型训练收敛
Views: 49Updated: Nov 30, 2025 18:28