Thursday, December 18, 2025

腾讯大模型团队调整

其他

腾讯大模型团队调整,姚顺雨出任首席AI科学家;MOMOTOY布局1000+IP矩阵,计划以“情感+AI”冲刺百亿营收;LoFA框架上线,秒级适配大模型;Adobe面临AI版权纠纷;亚马逊投资OpenAI,Databricks融资4B美元;北大系可控核聚变公司完成超5000万天使轮融资;地平线生态联盟扩张;SpaceX员工进入IPO静默期;Meta开源SAM Audio分割声音;SIGGRAPH A...

行业新闻(重要新闻、公司动态)

腾讯大模型团队架构调整,前OpenAI研究员姚顺雨出任要职

腾讯近期完成了一次组织调整,正式新成立AI Infra部、AI Data部、数据计算平台部。Vinces Yao将出任“CEO/总裁办公室”首席 AI 科学家,向腾讯总裁刘炽平汇报;他同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。此前,混元大模型团队虽是腾讯的公司级项目,但经过调整后,模型团队内部力量会更加统一。新成立的 AI Data 部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学习的数据智能融合平台建设工作。腾讯整合了原来腾讯内部原有团队,并且大幅调整了模型训练...腾讯此次调整也是在今年紧锣密鼓的AI布局中,颇为重磅的一步。

来源: 36氪 阅读更多
腾讯大模型团队架构调整

爱诗科技与阿里云达成全栈AI合作 AI视频全球化再启航

12月17日,爱诗科技与阿里云在北京阿里朝阳科技园正式签署全面合作协议。双方将围绕AI全栈能力与全球化布局,在模型、算力、产品、生态和商业层面建立深度协同,共同打造AI视频生成领域的先进实践。阿里云将为爱诗科技提供涵盖基础设施及大模型服务在内的全栈AI支持,通过全球化部署及安全合规能力,将全面支撑PixVerse自研视频生成大模型的训练与推理任务。目前,阿里云正式成为爱诗科技“全球云合作伙伴”,服务已覆盖美西、美东等多个区域。依托阿里云全球基础设施,双方将加速AI视频服务全球化。爱诗科技成立于2023年4月,两年来保持高频迭代节奏。自研视频生成大模型进行了五次迭代,在极速生成、视频编辑、多镜头音画同步和首尾帧多帧等能力上不断突破,推动AI视频从专业工具走向大众化应用,帮助每个人成为自己生活的导演。目前,PixVerse的全球用户已突破1亿。今年9月,PixVerse V5在Artificial Analysis全球AI视频模型榜单中,荣登“图生视频”类别第一;同时,PixVerse也跻身a16z“全球Top 50生成式AI消费移动应用”榜单,排名第25位。凭借模型和产品的快速发展,爱诗科技成功推动了全球用户增长的飞轮效应。此次战略合作,标志着爱诗科技携手阿里云在AI视频全球化进程中迈出新征程,也为AI视频生成行业的规模化发展提供了实践样本。

来源: 机器之心 阅读更多
爱诗科技与阿里云达成全栈AI合作

腾讯姚顺雨出任首席AI科学家,带队大语言模型、AI Infra

姚顺雨是人工智能领域,特别是「智能体(Agent)」方向备受瞩目的青年研究者。在加入 OpenAI 之前,他就已经在语言智能体领域做出了一系列开创性的工作:使 AI 通过多路径推理解决复杂问题的 ToT(思维树);让 AI 在推理中动态行动的 ReAct;为 AI 智能体提供模块化的认知架构的 CoALA。此外,他还参与构建了著名软件工程基准 SWE-Bench 和模拟电子商务网站环境 WebShop,推动了 AI 智能体的发展。截至目前,姚顺雨的论文总引用量已经超过了 1.9 万。此次腾讯升级大模型研发架构,新成立 AI Infra 部、AI Data 部、数据计算平台部,全面强化其大模型的研发体系与核心能力。姚顺雨出任「CEO / 总裁办公室」首席 AI 科学家,向腾讯总裁刘炽平汇报;同时兼任 AI Infra 部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。架构升级后的 AI Data 部、数据计算平台部,将分别负责大模型数据及评测体系建设、大数据和机器学习的数据智能融合平台建设工作。

来源: 机器之心 阅读更多
腾讯姚顺雨出任首席AI科学家

Instacart的AI定价工具引起关注,FTC介入调查

Instacart的AI定价工具引起了广泛关注,引发FTC的介入调查。该工具在厨房必需品价格测试方面引起了关注,尤其是在当前经济环境下,消费者对价格敏感度增加。FTC正在调查该工具是否违反了联邦贸易法,包括是否利用AI进行不正当的价格比较和操纵价格。

来源: TechCrunch 阅读更多

热门开源项目(GitHub项目、工具推荐)

SAM Audio:Meta开源音频分割模型

Meta发布了音频分割模型SAM Audio,其通过多模态提示(无论是文本、视觉,还是标注时间片段),让人们能够轻松地从复杂的音频混合中分离出任意声音,从而彻底改变音频处理方式。SAM Audio的核心是Perception Encoder Audiovisual(PE-AV),这是推动其实现业界领先性能的技术引擎。PE-AV基于Meta今年早些时候开源发布的Perception Encoder模型,能够支持更先进的计算机视觉系统,帮助人们完成日常任务,其中就包括声音检测。人们可以通过在画面中点击任意对象来分离相应的声音,或者通过文本提示进行音频分离。此外,Meta还推出了SAM Audio-Bench和SAM Audio Judge,分别为首个真实环境的音频分割基准和首个用于音频分割的自动评测模型。Meta将上述所有成果整合进Segment Anything Playground,这是用户可以体验SAM Audio能力的一个全新平台。从即日起,用户可以从平台提供的音频和视频素材库中进行选择,或上传自己的内容,以探索SAM Audio的能力。

来源: 机器之心 阅读更多
SAM Audio

学术论文(最新研究、论文摘要)

FrontierScience:评估专家级科学能力的新基准

OpenAI发布了一个专为评估专家级科学能力构建的新基准,名为FrontierScience。该基准由物理学、化学和生物学领域的专家编写验证,包含数百道兼具难度、原创性与实质意义的题目。FrontierScience包括两个赛道:衡量奥林匹克式科学推理能力的奥赛赛道(FrontierScience-Olympiad)和评估真实世界科研能力的研究赛道(FrontierScience-Research)。在初步评估中,GPT-5.2在两个赛道均领先于其他前沿模型。通过引入文本化经验记忆和自适应奖励塑造机制,LightSearcher框架在保持与SOTA基线相当准确率的同时,显著提高了搜索工具调用效率和推理速度。

来源: 机器之心 阅读更多
FrontierScience

技术趋势(技术突破、创新应用)

Wan 2.6发布:普通人也能当导演

阿里千问APP发布了新一代万相2.6系列模型,该系列涵盖文生视频、图生视频和参考生视频,图像生成和文生图共5款模型。它具备声画一致性角色定制能力,这意味着你不仅能通过「角色参考」固定住视频中人或物的IP形象,还能参考输入视频中的音色,实现从画面到声音的完美复刻,无论是单人独白还是双人对手戏都能轻松拿捏。更重要的是,此次发布的版本进一步提升了画质、音效和指令遵循能力,单次视频生成时长实现了国内最高的15秒(参考生视频为10秒)。万相2.6系列是目前全球功能覆盖最全面的视频生成模型家族之一。

来源: 机器之心 阅读更多
Wan 2.6发布

SpaceX员工进入IPO前静默期

SpaceX已通知员工进入IPO前的静默期。此外,浙江省创新投资集团开启了社会招聘,招聘包括管理岗位和专业技术岗位,涉及产业投研、赋能运营、金融管理、风险合规、财务管理、综合文字等方向。空客中国总装第800架A320系列飞机于12月17日交付,该飞机由中国国际航空公司接收运营,共设12个公务舱座位和186个经济舱座位。小米全球月活跃用户数达到7.42亿,硬件生态方面,小米AIoT平台连接设备数达到10.4亿,硬件合作伙伴数量突破15000家;软件生态方面,小米全球开发者规模达到120万。

来源: 36氪 阅读更多
Views: 467Updated: Jan 15, 2026 17:41