> 技术文档 > 机器视觉opencv教程(二):二值化、自适应二值化

机器视觉opencv教程(二):二值化、自适应二值化


文章目录

  • 机器视觉opencv教程(二):二值化、自适应二值化
    • 一、二值化图基础概念
    • 二、传统二值化方法(基于全局固定阈值
      • 1. 阈值法(THRESH_BINARY)
      • 2. 反阈值法(THRESH_BINARY_INV)
      • 3. 截断阈值法(THRESH_TRUNC)
      • 4. 低阈值零处理(THRESH_TOZERO)
      • 5. 超阈值零处理(THRESH_TOZERO_INV)
    • 三、OTSU 阈值法(自动找最优阈值)
      • 1. 核心原理
      • 2. 代码实现(需与传统二值化方法结合)
      • 3. 特点与适用场景
    • 四、自适应二值化(局部动态阈值)
      • 1. 核心问题(传统方法的缺陷)
      • 2. 自适应二值化原理
      • 4. 关键参数说明
    • 五、补充:常见问题与注意事项

机器视觉opencv教程(二):二值化、自适应二值化

一、二值化图基础概念

  • 定义:二值化图是仅含两种像素值的图像,通常为 0(纯黑色)255(纯白色)
  • 操作前提:二值化的处理对象必须是灰度(无法直接对彩色图进行二值化),本质是通过 “阈值判断” 将灰度图的连续亮度值(0~255)映射为两种离散值,突出前景与背景的边界。
  • 核心目的:简化图像数据(仅 1 个通道 + 2 种值)、消除灰度噪声、强化目标区域(如文字识别中突出文字、工业检测中突出缺陷)。

机器视觉opencv教程(二):二值化、自适应二值化

二、传统二值化方法(基于全局固定阈值)

传统二值化通过设定全局唯一阈值(thresh)最大值(maxval,通常为 255),对灰度图所有像素统一判断,常见 5 种方法:

1. 阈值法(THRESH_BINARY)

  • 原理:像素值与阈值比较
    • 若像素值 ≤ thresh → 设为 0(黑)
    • 若像素值 > thresh → 设为 maxval(白)
  • 特点:亮部(> 阈值)保留为白色,暗部(≤阈值)转为黑色,适合前景比背景亮的场景(如白底黑字)。
import cv2import numpy as np# 1. 读取彩色图→转为灰度图(二值化前提)image_np = cv2.imread(\'./gogogo.png\')# 【补充】检查图片读取状态if image_np is None: raise ValueError(\"图片读取失败,请确认路径正确!\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数thresh = 150 # 全局阈值(需手动调整,根据图像明暗度适配)maxval = 255 # 二值化后的最大值(通常为255,纯白)# 3. OpenCV接口实现(推荐,高效)# ret:返回的阈值(与设定的thresh一致,传统方法中无实际作用)# image_thresh:二值化结果(单通道图)ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY)# # 4. 手动实现(理解原理用)# image_shape = image_gray.shape# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)# for i in range(image_shape[0]): # 遍历高度(行)# for j in range(image_shape[1]): # 遍历宽度(列)# if image_gray[i, j] > thresh:# image_thresh[i, j] = maxval# else:# image_thresh[i, j] = 0# 5. 显示结果cv2.imshow(\'灰度图\', image_gray)cv2.imshow(\'THRESH_BINARY二值化图\', image_thresh)cv2.waitKey(0) # 按任意键关闭窗口cv2.destroyAllWindows() # 释放资源

2. 反阈值法(THRESH_BINARY_INV)

  • 原理:与阈值法完全相反
    • 若像素值 > thresh → 设为 0(黑)
    • 若像素值 ≤ thresh → 设为 maxval(白)
  • 特点:暗部保留为白色,亮部转为黑色,适合前景比背景暗的场景(如黑底白字)。
import cv2import numpy as np# 1. 彩色图→灰度图image_np = cv2.imread(\'./gogogo.png\')if image_np is None: raise ValueError(\"图片读取失败!\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数thresh = 127 # 常用默认阈值(可根据图像调整)maxval = 255# 3. OpenCV接口实现(核心参数:cv2.THRESH_BINARY_INV)ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY_INV)# # 4. 手动实现(原理参考阈值法,判断条件反转)# image_shape = image_gray.shape# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)# for i in range(image_shape[0]):# for j in range(image_shape[1]):# if image_gray[i, j] > thresh:# image_thresh[i, j] = 0# else:# image_thresh[i, j] = maxval# 5. 显示cv2.imshow(\'THRESH_BINARY_INV二值化图\', image_thresh)cv2.waitKey(0)cv2.destroyAllWindows()
  • 特点:暗部保留为白色,亮部转为黑色,适合前景比背景暗的场景(如黑底白字)。

3. 截断阈值法(THRESH_TRUNC)

  • 原理:限制像素值上限
    • 若像素值 > thresh → 设为 thresh(截断为阈值)
    • 若像素值 ≤ thresh → 保持原值不变
  • 特点:图像最大亮度为阈值,可抑制过亮区域(如强光噪声),但不是严格 “二值图”(仍含多个灰度值)。
import cv2import numpy as np# 1. 彩色图→灰度图image_np = cv2.imread(\'./gogogo.png\')if image_np is None: raise ValueError(\"图片读取失败!\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数thresh = 150 # 截断阈值(超过该值的亮度会被“压平”)maxval = 255 # 此方法中maxval无实际作用(可设任意值)# 3. OpenCV接口实现(核心参数:cv2.THRESH_TRUNC)ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_TRUNC)# # 4. 手动实现# image_shape = image_gray.shape# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)# for i in range(image_shape[0]):# for j in range(image_shape[1]):# if image_gray[i, j] > thresh:# image_thresh[i, j] = thresh# else:# image_thresh[i, j] = image_gray[i, j]# 5. 显示(对比灰度图,亮部会明显变暗)cv2.imshow(\'原灰度图\', image_gray)cv2.imshow(\'THRESH_TRUNC截断图\', image_thresh)cv2.waitKey(0)cv2.destroyAllWindows()

4. 低阈值零处理(THRESH_TOZERO)

  • 原理:暗部置零,亮部保留
    • 若像素值 ≤ thresh → 设为 0(黑)
    • 若像素值 > thresh → 保持原值不变
  • 特点:仅保留亮部细节,暗部直接变黑,适合突出高亮度目标(如金属表面的反光缺陷)。

5. 超阈值零处理(THRESH_TOZERO_INV)

  • 原理:亮部置零,暗部保留
    • 若像素值 > thresh → 设为 0(黑)
    • 若像素值 ≤ thresh → 保持原值不变
  • 特点:仅保留暗部细节,亮部直接变黑,适合突出低亮度目标(如暗背景中的深色物体)。

三、OTSU 阈值法(自动找最优阈值)

1. 核心原理

  • OTSU(大津法)是自动阈值选择算法,无需手动调参:
    1. 将灰度图像素分为 “前景”(> 阈值)和 “背景”(≤阈值)两类;
    2. 遍历所有可能阈值(从灰度最小值 + 1 到最大值 - 1),计算 “类间方差”;
    3. 类间方差最大时的阈值即为 “最优阈值”(此时前景与背景区分最明显)。

2. 代码实现(需与传统二值化方法结合)

import cv2import numpy as np# 1. 彩色图→灰度图image_np = cv2.imread(\'./flower.png\')if image_np is None: raise ValueError(\"图片读取失败!\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数(thresh仅为初始值,OTSU会自动覆盖)thresh = 127 # 初始值无意义,OTSU会计算最优阈值maxval = 255# 3. OpenCV接口实现(核心:cv2.THRESH_OTSU + 传统方法)# ret:返回OTSU计算出的最优阈值(不再是初始值127)ret, image_thresh = cv2.threshold( image_gray, thresh, maxval, cv2.THRESH_BINARY + cv2.THRESH_OTSU # 结合阈值法,也可结合其他方法)print(f\"OTSU自动计算的最优阈值:{ret}\") # 输出最优阈值,便于后续参考# # 4. 手动实现(理解OTSU算法逻辑,实际用OpenCV接口即可)# min_val = image_gray.min()# max_val = image_gray.max()# var_dict = {} # 存储“阈值→类间方差”# # for t in range(min_val + 1, max_val):# # 分割前景(>t)和背景(≤t)# foreground = image_gray[image_gray > t]# background = image_gray[image_gray ≤ t]# # 计算类间方差(公式:w0*(u0-u)^2 + w1*(u1-u),w为权重,u为均值)# w0 = len(foreground) / (image_gray.size)# w1 = len(background) / (image_gray.size)# u0 = foreground.mean() if len(foreground) > 0 else 0# u1 = background.mean() if len(background) > 0 else 0# u = (w0*u0) + (w1*u1)# class_var = w0 * (u0 - u)**2 + w1 * (u1 - u)**2# var_dict[t] = class_var# # 找类间方差最大的阈值# best_thresh = max(var_dict, key=var_dict.get)# print(f\"手动计算的最优阈值:{best_thresh}\")# 5. 保存+显示结果cv2.imwrite(\'OTSU二值化图.png\', image_thresh) # 保存结果cv2.imshow(\'OTSU二值化图\', image_thresh)cv2.waitKey(0)cv2.destroyAllWindows()

3. 特点与适用场景

  • 优势:自动适配图像明暗,无需手动调阈值,比固定阈值更鲁棒;
  • 适用:前景与背景灰度差异明显的图像(如文档扫描图、简单目标检测);
  • 注意:仅适用于 “双峰灰度分布”(灰度直方图有两个明显峰值,分别对应前景和背景),若图像灰度分布均匀,效果较差。

四、自适应二值化(局部动态阈值)

1. 核心问题(传统方法的缺陷)

传统二值化(含 OTSU)用全局固定阈值,若图像明暗分布不均(如左侧亮、右侧暗),会导致部分区域二值化过度(亮区暗部变黑)或不足(暗区亮部变白)。

2. 自适应二值化原理

  • 对图像每个像素,用其局部邻域(如 3×3、5×5 窗口)的亮度计算 “局部阈值”,而非全局统一阈值;
  • 每个像素的阈值由自身周围像素决定,能自适应不同区域的明暗差异。
import cv2import numpy as np# 1. 读取彩色图→转为灰度图image_np = cv2.imread(\'./gogogo.png\') # 建议用明暗不均的图测试(如逆光拍摄的图)if image_np is None: raise ValueError(\"图片读取失败!\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 自适应二值化(核心函数:cv2.adaptiveThreshold)image_binary = cv2.adaptiveThreshold( image_gray, # 输入:单通道灰度图 255, # 二值化最大值(通常为255) cv2.ADAPTIVE_THRESH_GAUSSIAN_C, # 局部阈值计算方法:高斯加权平均(推荐,更平滑) # cv2.ADAPTIVE_THRESH_MEAN_C, # 备选:局部邻域均值(计算更快,可能有噪声) cv2.THRESH_BINARY, # 二值化方法(可换为THRESH_BINARY_INV) blockSize=7,  # 局部邻域大小(必须为奇数,如3、5、7,越大越平滑) C=5 # 从局部阈值中减去的常数(正数:降低二值化严格度,减少黑块))# 3. 显示对比(与全局阈值法对比,明暗不均区域效果更优)# 全局阈值法(对比用)ret_global, image_global = cv2.threshold(image_gray, 127, 255, cv2.THRESH_BINARY)cv2.imshow(\'原灰度图\', image_gray)cv2.imshow(\'全局阈值二值化\', image_global)cv2.imshow(\'自适应二值化\', image_binary)cv2.waitKey(0)cv2.destroyAllWindows()

4. 关键参数说明

参数 作用 blockSize 局部邻域大小(奇数),越大对明暗不均的适应能力越强,但细节保留越少; C 阈值修正常数,正数→局部阈值降低(更多像素变白),负数→局部阈值升高(更多像素变黑); 阈值计算方法 ADAPTIVE_THRESH_GAUSSIAN_C(高斯加权,效果好) vs ADAPTIVE_THRESH_MEAN_C(均值,速度快);

五、补充:常见问题与注意事项

  1. 图片读取失败:确保路径正确(相对路径需与代码文件同级,绝对路径需写全),格式支持(JPG、PNG、BMP 等);
  2. 二值化结果过暗 / 过亮:
    • 全局阈值法:调整thresh(暗→降低阈值,亮→升高阈值);
    • 自适应法:调整C(暗→增大C,亮→减小C)或blockSize
  3. OTSU 效果差:检查图像灰度直方图是否为 “单峰”(明暗分布均匀),此类图需用自适应二值化;
  4. 代码效率:手动实现仅用于理解原理,实际项目用 OpenCV 接口(C++ 优化,速度远快于 Python 循环)。