保姆级教程：用OpenCV和Python从零搭建双目测距系统（附完整代码与避坑指南）-开发者社区

从零搭建双目测距系统：OpenCV+Python实战指南

1. 双目视觉测距基础与环境准备

双目视觉测距的核心在于利用两个摄像头模拟人眼视差原理。当我们在Python中实现这一技术时，OpenCV提供了完整的工具链。在开始编码前，需要确保开发环境正确配置。

硬件准备清单：

双目摄像头（推荐使用已校准的USB双目模组）
标定棋盘（建议使用7x9的黑白棋盘）
计算性能足够的开发电脑

软件依赖安装：

pip install opencv-contrib-python numpy matplotlib

对于Linux用户，可能需要额外安装视频采集驱动：

sudo apt-get install v4l-utils

注意：建议使用Python 3.8+版本以避免兼容性问题。如果遇到权限问题，尝试将用户加入video组：sudo usermod -aG video $USER

2. 相机标定与极线校正实战

相机标定是双目测距中最关键的步骤之一，直接影响最终测距精度。我们将使用OpenCV的findChessboardCorners函数进行标定。

标定流程步骤：

采集15-20组不同角度的棋盘图像
检测角点并计算相机参数
保存标定结果供后续使用

import cv2 import numpy as np # 标定板参数 pattern_size = (7, 9) # 内角点数量 square_size = 2.5 # 棋盘格边长(cm) # 准备对象点 objp = np.zeros((pattern_size[0]*pattern_size[1], 3), np.float32) objp[:,:2] = np.mgrid[0:pattern_size[0], 0:pattern_size[1]].T.reshape(-1,2) * square_size # 存储对象点和图像点 objpoints = [] # 3D点 imgpoints_l = [] # 左图像点 imgpoints_r = [] # 右图像点 # 标定图像处理 images = glob.glob('calib_images/*.jpg') for fname in images: img = cv2.imread(fname) gray_l = cv2.cvtColor(img[:,:640], cv2.COLOR_BGR2GRAY) gray_r = cv2.cvtColor(img[:,640:], cv2.COLOR_BGR2GRAY) # 查找角点 ret_l, corners_l = cv2.findChessboardCorners(gray_l, pattern_size) ret_r, corners_r = cv2.findChessboardCorners(gray_r, pattern_size) if ret_l and ret_r: objpoints.append(objp) imgpoints_l.append(corners_l) imgpoints_r.append(corners_r)

标定结果验证表格：

参数	左相机	右相机
焦距(fx,fy)	856.3,855.7	853.9,854.2
主点(cx,cy)	318.2,245.6	315.8,242.3
径向畸变k1,k2	-0.12,0.24	-0.11,0.22
切向畸变p1,p2	0.001,-0.003	0.002,-0.002

3. 立体匹配算法选择与调优

OpenCV提供了两种主要的立体匹配算法：BM（Block Matching）和SGBM（Semi-Global Block Matching）。我们将重点分析SGBM的参数调优。

SGBM关键参数解析：

minDisparity: 最小视差，通常设为0
numDisparities: 视差搜索范围，必须是16的整数倍
blockSize: 匹配块大小，奇数且在3-11之间
P1,P2: 控制视差平滑度的参数

def create_sgbm_matcher(): window_size = 5 min_disp = 0 num_disp = 112 - min_disp stereo = cv2.StereoSGBM_create( minDisparity=min_disp, numDisparities=num_disp, blockSize=window_size, P1=8*3*window_size**2, P2=32*3*window_size**2, disp12MaxDiff=1, uniquenessRatio=10, speckleWindowSize=100, speckleRange=32, mode=cv2.STEREO_SGBM_MODE_SGBM_3WAY ) return stereo

算法性能对比：

指标	BM算法	SGBM算法
计算速度	快(15ms)	慢(45ms)
纹理区域精度	一般	优秀
弱纹理区域表现	差	较好
适用场景	实时应用	高精度需求

4. 三维重建与距离测量实现

获得视差图后，我们可以通过重投影矩阵Q将2D像素坐标转换为3D世界坐标。

距离计算核心代码：

def calculate_distance(disparity_map, Q, x, y): # 将视差图转换为3D坐标 points_3D = cv2.reprojectImageTo3D(disparity_map, Q) # 获取指定像素的3D坐标 x, y = int(x), int(y) point_3d = points_3D[y, x] # 计算距离（欧氏距离） distance = np.sqrt(point_3d[0]**2 + point_3d[1]**2 + point_3d[2]**2) return distance, point_3d # 鼠标回调函数 def mouse_callback(event, x, y, flags, param): if event == cv2.EVENT_LBUTTONDOWN: disparity, Q = param distance, coords = calculate_distance(disparity, Q, x, y) print(f"世界坐标: {coords/1000:.3f}m, 距离: {distance/1000:.3f}m")

常见问题解决方案：

视差图噪声大：
- 增加speckleWindowSize和speckleRange
- 使用cv2.medianBlur进行后处理
测距结果跳变：
- 检查相机标定质量
- 验证Q矩阵是否正确
边缘区域精度差：
- 使用validPixROI排除边缘区域
- 增加numDisparities值

5. 完整系统集成与性能优化

将各个模块整合成完整的实时测距系统，需要考虑帧率、精度和资源消耗的平衡。

实时测距系统架构：

class StereoVisionSystem: def __init__(self, calib_file): self.load_calibration(calib_file) self.matcher = create_sgbm_matcher() self.cap = cv2.VideoCapture(0) def load_calibration(self, file): # 加载标定参数 fs = cv2.FileStorage(file, cv2.FILE_STORAGE_READ) self.Q = fs.getNode("Q").mat() self.left_map1 = fs.getNode("left_map1").mat() self.left_map2 = fs.getNode("left_map2").mat() self.right_map1 = fs.getNode("right_map1").mat() self.right_map2 = fs.getNode("right_map2").mat() fs.release() def process_frame(self): ret, frame = self.cap.read() if not ret: return None # 分割左右图像 h, w = frame.shape[:2] left_img = frame[:, :w//2] right_img = frame[:, w//2:] # 极线校正 left_rect = cv2.remap(left_img, self.left_map1, self.left_map2, cv2.INTER_LINEAR) right_rect = cv2.remap(right_img, self.right_map1, self.right_map2, cv2.INTER_LINEAR) # 计算视差 disparity = self.matcher.compute(left_rect, right_rect) return left_rect, disparity

性能优化技巧：

使用cv2.UMat启用OpenCL加速
降低图像分辨率到640x480
采用ROI区域处理代替全图处理
使用多线程分离图像采集和处理

6. 实际应用案例与扩展方向

双目测距技术在实际项目中有广泛的应用场景，下面介绍几个典型应用：

工业检测应用：

def measure_object_size(disparity, Q, contour): # 从轮廓提取点集 points = contour.squeeze() # 转换为3D坐标 points_3d = [] for x, y in points: pt_3d = cv2.reprojectImageTo3D(disparity, Q)[y, x] if not np.isinf(pt_3d).any(): points_3d.append(pt_3d) # 计算物体尺寸 points_3d = np.array(points_3d) length = np.max(points_3d[:,0]) - np.min(points_3d[:,0]) width = np.max(points_3d[:,1]) - np.min(points_3d[:,1]) height = np.max(points_3d[:,2]) - np.min(points_3d[:,2]) return length, width, height

扩展方向：