视觉 - 第2页|程序员档案馆

用计算机视觉玩转乐高：积木识别与自动组装

用计算机视觉玩转乐高：积木识别与自动组装一、前言二、基础知识储备：计算机视觉与乐高积木的技术交叉 2.1 计算机视觉核心概念 2.2 乐高积木的特征...

Bloger 09-02 0 767 技术文档

计算机视觉的下一站：通用视觉模型（GVM）？前言一、引言二、什么是通用视觉模型 2.1 定义与概念 2.2 与传统计算机视觉模型的差异 2.3 通用视觉模型...

Bloger 09-02 0 178 技术文档

开源社区如何推动计算机视觉发展？一、前言二、开源社区对计算机视觉发展的重要性 2.1 降低技术门槛 2.2 促进知识共享与交流 2.3 加速技术创新与迭代 ...

Bloger 09-02 0 85 技术文档

dots.ocr 是一款功能强大、支持多语言的文档解析模型，它在单一的视觉语言模型中统一了布局检测和内容识别，同时能保持良好的阅读顺序。 dots.ocr 是一款功...

Bloger 09-02 0 775 技术文档

计算机视觉必读论文：从经典到前沿一、前言二、经典论文解读 2.1 图像分类 2.1.1 《ImageNet Classification with Deep Convolutional Neural Ne...

Bloger 09-02 0 48 技术文档

系列篇章💥 No. 文章 1 【AI大模型前沿】深度剖析瑞智病理大模型 RuiPath：如何革新癌症病理诊断技术 2 【AI大模型前沿】清华大学 CLAMP-3：多模...

Bloger 09-02 0 209 技术文档

通义万相2.2与DeepSeek协同创作：AI生成高质量长视频的完整指南一、技术架构与协同原理 1.1 双模型协同工作框架通义万相2.2（Wan 2.2）作为阿里巴巴的多...

Bloger 09-02 0 326 技术文档

计算机视觉：CVPR/ICCV最新论文解读系列一、前言二、VGGT: 开创高效 3D 视觉新范式 2.1 研究背景与目标 2.2 核心方法 2.2.1 纯前馈设计 2.2.2 注意...

Bloger 09-02 0 286 技术文档

Kaggle视觉竞赛实战：金牌方案解析前言一、图像基础操作与算法 1.1 图像的读取、显示与保存 1.2 图像的缩放、旋转与裁剪二、特征检测与匹配算法 ...

Bloger 09-02 0 772 技术文档

引言 2024年，中国图象图形学学会青年科学家会议上，上海合合信息科技股份有限公司的图像算法研发总监郭丰俊博士围绕“视觉内容安全技术的前沿进展与应用”进...

Bloger 09-02 0 382 技术文档