机器视觉opencv教程（二）：二值化、自适应二值化

技术文档

文章目录

机器视觉opencv教程（二）：二值化、自适应二值化
- 一、二值化图基础概念
- 二、传统二值化方法（基于全局固定阈值）
- - 1. 阈值法（THRESH_BINARY）
  - 2. 反阈值法（THRESH_BINARY_INV）
  - 3. 截断阈值法（THRESH_TRUNC）
  - 4. 低阈值零处理（THRESH_TOZERO）
  - 5. 超阈值零处理（THRESH_TOZERO_INV）
- 三、OTSU 阈值法（自动找最优阈值）
- - 1. 核心原理
  - 2. 代码实现（需与传统二值化方法结合）
  - 3. 特点与适用场景
- 四、自适应二值化（局部动态阈值）
- - 1. 核心问题（传统方法的缺陷）
  - 2. 自适应二值化原理
  - 4. 关键参数说明
- 五、补充：常见问题与注意事项

机器视觉opencv教程（二）：二值化、自适应二值化

一、二值化图基础概念

定义：二值化图是仅含两种像素值的图像，通常为 0（纯黑色） 和 255（纯白色）。
操作前提：二值化的处理对象必须是灰度图（无法直接对彩色图进行二值化），本质是通过 “阈值判断” 将灰度图的连续亮度值（0~255）映射为两种离散值，突出前景与背景的边界。
核心目的：简化图像数据（仅 1 个通道 + 2 种值）、消除灰度噪声、强化目标区域（如文字识别中突出文字、工业检测中突出缺陷）。

机器视觉opencv教程（二）：二值化、自适应二值化

二、传统二值化方法（基于全局固定阈值）

传统二值化通过设定全局唯一阈值（thresh） 和最大值（maxval，通常为 255），对灰度图所有像素统一判断，常见 5 种方法：

1. 阈值法（THRESH_BINARY）

原理：像素值与阈值比较
- 若像素值 ≤ thresh → 设为 0（黑）
- 若像素值 > thresh → 设为 maxval（白）
特点：亮部（> 阈值）保留为白色，暗部（≤阈值）转为黑色，适合前景比背景亮的场景（如白底黑字）。

import cv2import numpy as np# 1. 读取彩色图→转为灰度图（二值化前提）image_np = cv2.imread(\'./gogogo.png\')# 【补充】检查图片读取状态if image_np is None: raise ValueError(\"图片读取失败，请确认路径正确！\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数thresh = 150 # 全局阈值（需手动调整，根据图像明暗度适配）maxval = 255 # 二值化后的最大值（通常为255，纯白）# 3. OpenCV接口实现（推荐，高效）# ret：返回的阈值（与设定的thresh一致，传统方法中无实际作用）# image_thresh：二值化结果（单通道图）ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY)# # 4. 手动实现（理解原理用）# image_shape = image_gray.shape# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)# for i in range(image_shape[0]): # 遍历高度（行）# for j in range(image_shape[1]): # 遍历宽度（列）# if image_gray[i, j] > thresh:# image_thresh[i, j] = maxval# else:# image_thresh[i, j] = 0# 5. 显示结果cv2.imshow(\'灰度图\', image_gray)cv2.imshow(\'THRESH_BINARY二值化图\', image_thresh)cv2.waitKey(0) # 按任意键关闭窗口cv2.destroyAllWindows() # 释放资源

2. 反阈值法（THRESH_BINARY_INV）

原理：与阈值法完全相反
- 若像素值 > thresh → 设为 0（黑）
- 若像素值 ≤ thresh → 设为 maxval（白）
特点：暗部保留为白色，亮部转为黑色，适合前景比背景暗的场景（如黑底白字）。

import cv2import numpy as np# 1. 彩色图→灰度图image_np = cv2.imread(\'./gogogo.png\')if image_np is None: raise ValueError(\"图片读取失败！\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数thresh = 127 # 常用默认阈值（可根据图像调整）maxval = 255# 3. OpenCV接口实现（核心参数：cv2.THRESH_BINARY_INV）ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_BINARY_INV)# # 4. 手动实现（原理参考阈值法，判断条件反转）# image_shape = image_gray.shape# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)# for i in range(image_shape[0]):# for j in range(image_shape[1]):# if image_gray[i, j] > thresh:# image_thresh[i, j] = 0# else:# image_thresh[i, j] = maxval# 5. 显示cv2.imshow(\'THRESH_BINARY_INV二值化图\', image_thresh)cv2.waitKey(0)cv2.destroyAllWindows()

特点：暗部保留为白色，亮部转为黑色，适合前景比背景暗的场景（如黑底白字）。

3. 截断阈值法（THRESH_TRUNC）

原理：限制像素值上限
- 若像素值 > thresh → 设为 thresh（截断为阈值）
- 若像素值 ≤ thresh → 保持原值不变
特点：图像最大亮度为阈值，可抑制过亮区域（如强光噪声），但不是严格 “二值图”（仍含多个灰度值）。

import cv2import numpy as np# 1. 彩色图→灰度图image_np = cv2.imread(\'./gogogo.png\')if image_np is None: raise ValueError(\"图片读取失败！\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数thresh = 150 # 截断阈值（超过该值的亮度会被“压平”）maxval = 255 # 此方法中maxval无实际作用（可设任意值）# 3. OpenCV接口实现（核心参数：cv2.THRESH_TRUNC）ret, image_thresh = cv2.threshold(image_gray, thresh, maxval, cv2.THRESH_TRUNC)# # 4. 手动实现# image_shape = image_gray.shape# image_thresh = np.zeros((image_shape[0], image_shape[1]), dtype=np.uint8)# for i in range(image_shape[0]):# for j in range(image_shape[1]):# if image_gray[i, j] > thresh:# image_thresh[i, j] = thresh# else:# image_thresh[i, j] = image_gray[i, j]# 5. 显示（对比灰度图，亮部会明显变暗）cv2.imshow(\'原灰度图\', image_gray)cv2.imshow(\'THRESH_TRUNC截断图\', image_thresh)cv2.waitKey(0)cv2.destroyAllWindows()

4. 低阈值零处理（THRESH_TOZERO）

原理：暗部置零，亮部保留
- 若像素值 ≤ thresh → 设为 0（黑）
- 若像素值 > thresh → 保持原值不变
特点：仅保留亮部细节，暗部直接变黑，适合突出高亮度目标（如金属表面的反光缺陷）。

5. 超阈值零处理（THRESH_TOZERO_INV）

原理：亮部置零，暗部保留
- 若像素值 > thresh → 设为 0（黑）
- 若像素值 ≤ thresh → 保持原值不变
特点：仅保留暗部细节，亮部直接变黑，适合突出低亮度目标（如暗背景中的深色物体）。

三、OTSU 阈值法（自动找最优阈值）

1. 核心原理

OTSU（大津法）是自动阈值选择算法，无需手动调参：
1. 将灰度图像素分为 “前景”（> 阈值）和 “背景”（≤阈值）两类；
2. 遍历所有可能阈值（从灰度最小值 + 1 到最大值 - 1），计算 “类间方差”；
3. 类间方差最大时的阈值即为 “最优阈值”（此时前景与背景区分最明显）。

2. 代码实现（需与传统二值化方法结合）

import cv2import numpy as np# 1. 彩色图→灰度图image_np = cv2.imread(\'./flower.png\')if image_np is None: raise ValueError(\"图片读取失败！\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 设定参数（thresh仅为初始值，OTSU会自动覆盖）thresh = 127 # 初始值无意义，OTSU会计算最优阈值maxval = 255# 3. OpenCV接口实现（核心：cv2.THRESH_OTSU + 传统方法）# ret：返回OTSU计算出的最优阈值（不再是初始值127）ret, image_thresh = cv2.threshold( image_gray, thresh, maxval, cv2.THRESH_BINARY + cv2.THRESH_OTSU # 结合阈值法，也可结合其他方法)print(f\"OTSU自动计算的最优阈值：{ret}\") # 输出最优阈值，便于后续参考# # 4. 手动实现（理解OTSU算法逻辑，实际用OpenCV接口即可）# min_val = image_gray.min()# max_val = image_gray.max()# var_dict = {} # 存储“阈值→类间方差”# # for t in range(min_val + 1, max_val):# # 分割前景（>t）和背景（≤t）# foreground = image_gray[image_gray > t]# background = image_gray[image_gray ≤ t]# # 计算类间方差（公式：w0*(u0-u)^2 + w1*(u1-u)，w为权重，u为均值）# w0 = len(foreground) / (image_gray.size)# w1 = len(background) / (image_gray.size)# u0 = foreground.mean() if len(foreground) > 0 else 0# u1 = background.mean() if len(background) > 0 else 0# u = (w0*u0) + (w1*u1)# class_var = w0 * (u0 - u)**2 + w1 * (u1 - u)**2# var_dict[t] = class_var# # 找类间方差最大的阈值# best_thresh = max(var_dict, key=var_dict.get)# print(f\"手动计算的最优阈值：{best_thresh}\")# 5. 保存+显示结果cv2.imwrite(\'OTSU二值化图.png\', image_thresh) # 保存结果cv2.imshow(\'OTSU二值化图\', image_thresh)cv2.waitKey(0)cv2.destroyAllWindows()

3. 特点与适用场景

优势：自动适配图像明暗，无需手动调阈值，比固定阈值更鲁棒；
适用：前景与背景灰度差异明显的图像（如文档扫描图、简单目标检测）；
注意：仅适用于 “双峰灰度分布”（灰度直方图有两个明显峰值，分别对应前景和背景），若图像灰度分布均匀，效果较差。

四、自适应二值化（局部动态阈值）

1. 核心问题（传统方法的缺陷）

传统二值化（含 OTSU）用全局固定阈值，若图像明暗分布不均（如左侧亮、右侧暗），会导致部分区域二值化过度（亮区暗部变黑）或不足（暗区亮部变白）。

2. 自适应二值化原理

对图像每个像素，用其局部邻域（如 3×3、5×5 窗口）的亮度计算 “局部阈值”，而非全局统一阈值；
每个像素的阈值由自身周围像素决定，能自适应不同区域的明暗差异。

import cv2import numpy as np# 1. 读取彩色图→转为灰度图image_np = cv2.imread(\'./gogogo.png\') # 建议用明暗不均的图测试（如逆光拍摄的图）if image_np is None: raise ValueError(\"图片读取失败！\")image_gray = cv2.cvtColor(image_np, cv2.COLOR_BGR2GRAY)# 2. 自适应二值化（核心函数：cv2.adaptiveThreshold）image_binary = cv2.adaptiveThreshold( image_gray, # 输入：单通道灰度图 255, # 二值化最大值（通常为255） cv2.ADAPTIVE_THRESH_GAUSSIAN_C, # 局部阈值计算方法：高斯加权平均（推荐，更平滑） # cv2.ADAPTIVE_THRESH_MEAN_C, # 备选：局部邻域均值（计算更快，可能有噪声） cv2.THRESH_BINARY, # 二值化方法（可换为THRESH_BINARY_INV） blockSize=7,  # 局部邻域大小（必须为奇数，如3、5、7，越大越平滑） C=5 # 从局部阈值中减去的常数（正数：降低二值化严格度，减少黑块）)# 3. 显示对比（与全局阈值法对比，明暗不均区域效果更优）# 全局阈值法（对比用）ret_global, image_global = cv2.threshold(image_gray, 127, 255, cv2.THRESH_BINARY)cv2.imshow(\'原灰度图\', image_gray)cv2.imshow(\'全局阈值二值化\', image_global)cv2.imshow(\'自适应二值化\', image_binary)cv2.waitKey(0)cv2.destroyAllWindows()

4. 关键参数说明

参数作用 blockSize 局部邻域大小（奇数），越大对明暗不均的适应能力越强，但细节保留越少； C 阈值修正常数，正数→局部阈值降低（更多像素变白），负数→局部阈值升高（更多像素变黑）；阈值计算方法 ADAPTIVE_THRESH_GAUSSIAN_C（高斯加权，效果好） vs ADAPTIVE_THRESH_MEAN_C（均值，速度快）；

五、补充：常见问题与注意事项

图片读取失败：确保路径正确（相对路径需与代码文件同级，绝对路径需写全），格式支持（JPG、PNG、BMP 等）；
二值化结果过暗 / 过亮：
- 全局阈值法：调整thresh（暗→降低阈值，亮→升高阈值）；
- 自适应法：调整C（暗→增大C，亮→减小C）或blockSize；
OTSU 效果差：检查图像灰度直方图是否为 “单峰”（明暗分布均匀），此类图需用自适应二值化；
代码效率：手动实现仅用于理解原理，实际项目用 OpenCV 接口（C++ 优化，速度远快于 Python 循环）。

机器视觉opencv教程（二）：二值化、自适应二值化

文章目录

机器视觉opencv教程（二）：二值化、自适应二值化

一、二值化图基础概念

二、传统二值化方法（基于全局固定阈值）

1. 阈值法（THRESH_BINARY）

2. 反阈值法（THRESH_BINARY_INV）

3. 截断阈值法（THRESH_TRUNC）

4. 低阈值零处理（THRESH_TOZERO）

5. 超阈值零处理（THRESH_TOZERO_INV）

三、OTSU 阈值法（自动找最优阈值）

1. 核心原理

2. 代码实现（需与传统二值化方法结合）

3. 特点与适用场景

四、自适应二值化（局部动态阈值）

1. 核心问题（传统方法的缺陷）

2. 自适应二值化原理

4. 关键参数说明

五、补充：常见问题与注意事项

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

机器视觉opencv教程（二）：二值化、自适应二值化

文章目录

机器视觉opencv教程（二）：二值化、自适应二值化

一、二值化图基础概念

二、传统二值化方法（基于全局固定阈值）

1. 阈值法（THRESH_BINARY）

2. 反阈值法（THRESH_BINARY_INV）

3. 截断阈值法（THRESH_TRUNC）

4. 低阈值零处理（THRESH_TOZERO）

5. 超阈值零处理（THRESH_TOZERO_INV）

三、OTSU 阈值法（自动找最优阈值）

1. 核心原理

2. 代码实现（需与传统二值化方法结合）

3. 特点与适用场景

四、自适应二值化（局部动态阈值）

1. 核心问题（传统方法的缺陷）

2. 自适应二值化原理

4. 关键参数说明

五、补充：常见问题与注意事项

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签