本文作者:访客

小米两篇论文入选ICCV2025 创新技术引领未来

访客 2025-07-09 07:58:43 11926
小米公司备受瞩目,其两篇论文成功入选ICCV 2025会议,展现了其在创新技术领域的卓越实力,这些论文引领未来科技趋势,预示着小米在人工智能和计算机视觉等领域将取得更多重要突破,小米的成就彰显了其在科技创新方面的领先地位,也预示着未来科技发展的更多可能性。

计算机视觉国际大会 ICCV 2025 论文录用结果公布,小米两篇论文成功入选。这两篇论文分别是视频理解大模型核心技术 Q-Frame 和持续学习框架 Analytic Subspace Routing (Any-SSR)。ICCV 与 CVPR、ECCV 并称为计算机领域世界三大顶级学术会议,每两年举办一次。ICCV 2025 年投稿量达 11239 篇,录用率为 24%。

小米两篇论文入选ICCV2025 创新技术引领未来

Q-Frame 是小米 AI 团队自研的技术,解决了传统“均匀帧采样”处理方式中时间碎片化信息丢失、盲目采样及算力浪费等问题。Q-Frame 是行业首个动态帧选择与分辨率自适应框架,无需训练即可即插即用。其三大创新包括跨模态查询检索、查询感知帧选择和多分辨率自适应。在 MLVU 评测集上,Q-Frame 使 Qwen2-VL 的理解准确率从 55.5% 提升至 65.4%;在 LongVideoBench 上,GPT-4o 的准确率从 53.3% 提升到 58.6%。此外,Q-Frame 可以根据内容重要性和查询需求动态调整帧分辨率,避免算力浪费。Q-Frame 具有广泛的适用性,可与市场上现有的各类视频理解大模型兼容,无论是开源还是闭源模型。在小米“人车家全生态”战略中,Q-Frame 有着多元的应用场景,如哨兵模式、智能家居监控和小爱视频问答等。

Any-SSR 框架是小米 AI 团队联合华南理工大学研发的成果,用于解决大语言模型在持续学习中的灾难性遗忘问题。Any-SSR 将递归最小二乘法引入大语言模型持续学习,通过分析路由机制将不同任务分配到独立子空间学习,避免了任务间知识干扰。同时,结合低秩适应技术,实现了新旧知识的无缝整合与动态学习。实验表明,Any-SSR 在 TRACE 基准测试上的表现显著优于其他方法,不仅在整体性能上取得了优异成绩,还实现了零反向知识转移。

小米集团在过去五年投入约 1020 亿元用于研发,其中 2025 年的 300 亿研发投入中,约四分之一将被用于 AI 相关方向。未来五年(2026-2030 年),小米还将在核心技术赛道再投入 2000 亿元。

阅读
分享