工业缺陷检测的计算机视觉方法总结

技术文档

工业缺陷检测的计算机视觉方法总结

传统方法

特征提取方式：

颜色：基于HSV/RGB空间分析，如颜色直方图、颜色矩等
纹理：采用LBP、Haar、Gabor滤波器等算子提取纹理模式
形状：基于Hu矩、Zernike矩等数学描述符刻画几何特性
尺寸：通过连通域分析计算物体像素面积、周长等参数

典型处理流程：

手动设计特征提取算法
建立规则分类器（如SVM、决策树）
基于阈值分割目标区域

深度学习方法

核心特点：

端到端学习：自动提取多层次特征（低层边缘→高层语义）
数据驱动：模型性能依赖标注数据规模和质量
通用性强：同一架构可适配不同任务

关键技术：

卷积神经网络（CNN）的特征提取机制
注意力机制增强关键特征

常用方法

1. 二值处理

将图像转换为黑白二值图像的过程，通过设定阈值将灰度图像分成前景和背景两部分，突出关注点。
实现方式：

全局阈值法（Otsu算法等）
局部自适应阈值
形态学操作优化（膨胀/腐蚀）

应用场景：

文档图像处理
简单物体分割

2. 频域/空域增强+阈值+滤波+边缘检测

结合频域变换（如傅里叶变换）和空域操作（如直方图均衡化）的图像增强技术，配合边缘检测算子提取特征。
处理步骤：

频域变换（傅里叶/小波变换去噪）
空域增强（直方图均衡化）
边缘检测（Canny/Sobel算子）

技术优势：

计算效率高
适合规则纹理目标

局限性：

对阈值敏感，一般都要添加阈值的自适应方法

3. 模板匹配

通过滑动窗口在图像中搜索与预定模板最相似的区域，采用相似度度量（如归一化互相关）进行比对。适用于已知目标形态且变化较小的定位场景。

局限性：

对形变敏感
计算复杂度高

4. 实例分割

实例分割技术能够精确识别并定位缺陷区域，其中UNet擅长处理小样本医疗和工业图像，而Mask R-CNN则适用于复杂场景的多目标检测任务，两者通过不同的网络架构实现高精度缺陷分割。

特征 UNet Mask R-CNN 架构设计 对称编码器-解码器结构两阶段检测框架（RPN+ROI） 核心优势 跳跃连接保留细节特征 ROI Align提升定位精度 训练数据 小样本表现优异（100+图像）需要较大训练集（1000+图像） 输出结果 直接输出分割掩膜同时输出检测框和分割掩膜 应用场景 简单工业缺陷复杂工业场景多缺陷检测 推理速度 较快（~15 FPS）较慢（~5 FPS）

适用建议：

选择UNet的情况：小样本、高分辨率、需要保留细节特征的缺陷检测
选择Mask R-CNN的情况：多类别、多实例、需要同时获取位置信息的复杂质检场景

工业缺陷检测的计算机视觉方法总结