> 技术文档 > CVPR 2025 最佳论文候选出炉!AIGC、SLAM、3D 视觉齐飞!论文大合集整理,含代码!_cvpr2025

CVPR 2025 最佳论文候选出炉!AIGC、SLAM、3D 视觉齐飞!论文大合集整理,含代码!_cvpr2025

CV方向的硕博士一定要看啊,作为计算机视觉领域的顶级盛会,CVPR堪称论文界的“奥斯卡”,每一篇被录用的论文都代表着行业前沿的方向,CVPR 2025收到了创新高的13008份论文,比CVPR 2024增加了12.8%,共录用了2878篇论文,接收率为22.1%。

目前 CVPR 2025 录用的全部论文已正式公开,研究者和爱好者们可以提前一睹为快,这些论文涵盖了从图像识别、目标检测、三维重建,到视觉语言模型、生成模型等前沿方向,内容丰富、干货满满。

📃1.Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models

📃2.Descriptor-In-Pixel : Point-Feature Tracking for Pixel Processor Arrays

📃3.The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition

📃4.FoundationStereo: Zero-Shot Stereo Matching

📃5.VGGT: Visual Geometry Grounded Transformer

📃6.MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos

📃7.TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion

📃8.Navigation World Models

📃9.GlobustVP:Convex Relaxation for Robust Vanishing Point Estimation in Manhattan World

📃10.UniAP: Unifying Inter- and Intra-Layer Automatic Parallelism by Mixed Integer Quadratic Programming

【为了方便大家查阅与学习,主包已第一时间将2025论文下载整理,包含2025年论文综述、WACV、CVPR】

2025年CVPR可复现论文合集,含代码https://docs.qq.com/doc/DQ25HbWt6WmdOZEta?u=7f01826fa3f140bb8e36e875087997e8&nlc=1

 

今年CVPR依然是被genAI, 3D和多模态霸榜。相较于前两年,一个明显的trend是有更多工作做更可控、更符合视觉系统的架构。

 

此外,模型效率, 鲁棒性和embodiedAI也有更多的关注,Benchmark的文章多了很多,虽然是个好事,但很多组做这个是因为算力不足,质量参差不齐。下面具体总结一下

方向一:Diffusion Model 2.0

主要发展方向是高效、可控、多模态。

包括:

▪️3D和视频:长视频生成、一致性生成、3D场景生成。

▪️编辑:高精度编辑,语义编辑。

▪️对下游任务的数据增广

🔹相关论文:FlexiDiT,LinGen,StreamingT2V,Scene Splatter,Fine-Grained Erasure,AeroGen,GenDeg等

 

方向二:3DGS

NeRF虽然没凉,3DGS基本快成了3D视觉的新标配。

更高效、低算力需求、和很好的泛化性,全面接管了从novel view synthesis到城市级scene rendering等多个任务。

包括:

▪️高效可扩展,低渲染时间

▪️动态物体建模

▪️稀疏视角与镜面反射等问题

🔹相关论文:FlashGS, DashGaussian,AniGS, RigGS,DeSplat等

 

方向三:多模态和video agent

Video-grounded multimodal,做理解、生成和交互一体,VLM as the system。

包括:

▪️增强的推理与交互能力

▪️缓解幻觉

▪️Eval

🔹相关论文:InteractVLM,Insight-V,CoT-VLA,Antidote,Nullu,MLLM-as-a-Judge等

方向四:公平、可信AI,AI4science

更多的工作应用在了各行各业,生物、认知科学等。

虽然大厂都能通过data driven在这些任务上做得很好,还是有很多benchmark和用knowledge injection的工作也做得不错。比如NSD-Imagery, UniPhy,Science-T2I等。

 

【纯干货】深度学习目标检测研究生如何用一个月快速水一篇二区论文?基础理论+数据集处理+实验设计一口气说清楚!

研究生不会写SCI论文?直接套用这些模式就行了!保姆级CCF/SCI论文写作思路+创新点方案+文献整理套路+实验数据分析!硕博士皆适用,建议收藏!

发论文别太老实!研究生“水”论文最实用方法是网络缝合模块!套用这200+即插即用模块代码,大论文小论文轻松涨点!

 

十堰科技信息网