AI巨头动作频仍:从ChatGPT到GPT-5.2
AI新时代5个信号:10倍增长、全球最贵公司、近4亿用户;AAAI 2026革新电影配音;谷歌AI同传入耳机;Deep Think开源新框架;地产AI智能化;ChatGPT成人模式;罗马仕公司被罚;脉脉高聘;GPT-5.2上线;AdaMCoT大模型;万达电影影像社交;西交大博士自主水下作业;鸿蒙元服务;RL可控实验;通用子空间;4D重建方案;Adobe ChatGPT;OpenAI GPT-5.2...
行业新闻
10倍增长、全球最贵公司和近4亿用户:AI新时代的5个信号
36氪制图,2025年的AI进程呈现出一种罕见的清晰度:它不再是一项技术,不再是一条赛道,而是一种力量迁移,就像当初的互联网、移动互联网时代一样。最具象征意义的事件来自市场:英伟达跃升为全球首个市值5万亿美元的公司。使用侧同样出现了罕见加速度。全球Token消耗在两年内增长近十倍;在中国,百度AI搜索月活达到3.82亿,首条结果的富媒体覆盖率已经达到70%。AI基建正迎来史无前例的高潮。微软、亚马逊、谷歌两年投入2000亿美元扩建算力与数据中心,这是数字经济史上最大规模的基础设施工程。这些变化指向同一个结论:AI不再是技术周期,而是全球经济的结构性拐点。2025年标志着一个新时代的起点。
热门开源项目
.Authentic Movie Dubbing with Retrieve-Augmented Director-Actor Interaction Learning
研究团队提出了一种全新的检索增强导演 - 演员交互学习框架 ——Authentic-Dubber,首次在 AI 配音中引入 “导演” 角色,系统模拟了真实配音流程中的情感传递机制。他们不再满足于让 AI 模仿发音,而是首次将真实的 “导演 - 演员” 交互工作流引入 AI 配音框架,让模型学会了 “先理解,再表达”。
Disco: AI浏览器
Google 正在加速将其 Gemini 模型的能力融入核心产品线,推出了一款名为「Disco」的实验性浏览器。该浏览器试图用 AI 重构网页浏览体验,包括实时语音翻译、文本翻译的语境理解能力、以及语言学习工具的扩展等。
学术论文
AdaMCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Multilingual Chain-of-Thought
该工作提出了一种新的框架——AdaMCoT,其核心在于自适应地在多种语言间路由并组合链式思考,再将推理结果映射回目标语言,从而显著提升跨语言的事实推理准确性与一致性。研究团队设计了一个多模态参考素材库,整合了场景氛围、面部表情、台词文本等多种模态的情感信息,并巧妙利用大语言模型(LLM)进行深度语义理解,提取出细腻的情感表征。
技术趋势
PaCoRe: Parallel Coordinated Reasoning
PaCoRe 是一个全新的并行协同推理框架,让大模型的能力不再受限于线性思维链的上下文窗口大小,而是基于大规模并行协同的方式,让模型进行前所未有的广度和深度思考。它通过对系统进行大规模、基于结果的强化学习训练,让小模型解锁百万级 Token 测试时计算。在 HMMT 2025 数学基准测试中,PaCoRe-8B 模型取得了 94.5 的高分,超越了 GPT-5 的 93.2 分。
鸿蒙元服务研究报告
鸿蒙生态内,元服务依托分布式技术架构与AI底层能力,以场景化、轻量化、跨端化为抓手,为开发者提供智慧服务分发解决...鸿蒙元服务应运而生,基于AI能力,以智慧服务分发模式,实现轻量化、场景化的服务触达,为开发者提供从开发、拉新、留存到变现的全流程赋能。伴随移动互联网逐渐步入存量竞争时代,流量增长放缓与获客成本高企的双重压力,成为制约开发者提升商业化表现的重要瓶颈。