氪星晚报|MiniMax+快看漫画AI互动漫画上线
MiniMax与快看漫画达成“AI+IP”合作;联想将推出超级AI智能体;国家创业投资引导基金支持新兴产业;256G内存比RTX5090还贵;MOVA攻入AI智能硬件市场;GPT-5.2准确率创纪录;VLM发布首个微观空间智能基准;DeepSeek开源框架提速200倍;SCOPE提升HLE成功率;MeViSv2发布;RLinf支持真机强化学习;Waymo测试Gemini;OpenAI允许调整Cha...
行业新闻(重要新闻、公司动态)
美丽废物还是年轻人潮品?一款迷你AI手机靠情绪价值众筹千万|焦点分析
看上去,10年前,手机行业就对创业公司关上了大门。但2025年,一款来自香港、毫无名气的迷你AI手机,在kickstarter上众筹突破1150万港元。它没有主流手机的大屏幕设计,反而采用了一块4.02英寸的正方形AMOLED显示屏,整体尺寸仅相当于传统手机的一半。此外,它的摄像头可以实现前后翻转,还能安装全键盘保护壳。显然,这是一款轻配置、重巧思的产品。IKKO的切入点,很符合当下的时代潮流——从做通用品转向挖掘利基用户。一些营销触觉敏锐的年轻团队,反而在点状爆发。
热门开源项目(GitHub项目、工具推荐)
视频生成DeepSeek时刻!清华&生数开源框架提速200倍,一周斩获2k Star
在2025年的最后时刻,一个全新视频生成加速框架的开源宣告了:「等待数分钟才能生成一个视频」的时代已经终结!这个框架正是清华大学TSAIL团队与生数科技联合发布的TurboDiffusion。加速效果有多夸张呢?在几乎不影响生成质量的前提下,主流视频生成模型在单张RTX 5090上生成5秒720p视频的速度可以提升约200倍,同时一个5秒480p视频的生成时长可以压缩到不到2秒。
学术论文(最新研究、论文摘要)
MeViSv2发布:多模态视频理解领域重磅数据更新
近日,多模态视频理解领域迎来重磅更新!由复旦大学、上海财经大学、南洋理工大学联合打造的MeViSv2数据集正式发布,并已被顶刊IEEE TPAMI录用。该数据集包含2,006个视频、8,171个目标及33,072条文本/音频表达,通过新增15万秒音频数据实现了向原生多模态的进化。目前,数据集、代码及评测平台均已开放。
技术趋势(技术突破、创新应用)
全异构、全异步的RLinf v0.2尝鲜版发布,支持真机强化学习,像使用GPU一样使用你的机器人!
在具身智能领域,特别是如何构造一个高泛化性的VLA,数据之争一直存在:仿真数据vs真机数据。数据来源不同,导致算法设计迥然不同,进一步对系统设计提出了更多的要求。做infra的目标是做好服务,支持不同技术路线的探索。RLinf v0.2面向采用真机路线的用户,用户可以像使用GPU一样使用机器人。
其他
Waymo explains why its robotaxis got stuck during the SF blackout
The company also said its robotaxis navigated more than 7,000 dark stoplights successfully on Saturday. Waymo has been working on improving the performance of its robotaxis in various conditions, including low-light environments and power outages. The company stated that the robotaxis used its advanced sensors and algorithms to adapt to the situation and continue operating safely.