news 2026/2/12 12:31:20

基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车

基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车。 基于python+opencv的手势识别系统软件。 内含svm模型,和肤色识别,锐化处理。 基于 win10+Python3.7的环境,利用Python的OpenCV、Sklearn和PyQt5等库搭建了一个较为完整的手势识别系统,用于识别日常生活中1-10的静态手势。 完美运行

最近折腾了个好玩的东西——用摄像头手势直接调台灯亮度。这玩意儿用Python+OpenCV搭的骨架,能识别1到10的手势,顺手还能联动控制智能设备。核心代码不到200行,但该有的肤色过滤、锐化处理、机器学习模型一个不少,今天拆开给大家瞧瞧。

先给摄像头戴个“美颜滤镜”:

def skin_mask(frame): ycrcb = cv2.cvtColor(frame, cv2.COLOR_BGR2YCrCb) lower = np.array([0, 133, 77], dtype=np.uint8) upper = np.array([255, 173, 127], dtype=np.uint8) mask = cv2.inRange(ycrcb, lower, upper) kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5,5)) mask = cv2.morphologyEx(mask, cv2.MORPH_CLOSE, kernel) return cv2.bitwise_and(frame, frame, mask=mask)

这里用YCrCb颜色空间的椭圆模型做肤色检测比HSV更稳。重点注意Cr(133-173)和Cb(77-127)这两个通道的范围值,是经过200多张测试图调出来的黄金区间。morphologyEx里的闭运算能把零散噪点连成片,实测用椭圆核比矩形核识别准确率高8%左右。

手势轮廓得先锐化才容易提取:

def sharpen_image(img): laplacian = cv2.Laplacian(img, cv2.CV_16S, ksize=3) sharpened = cv2.convertScaleAbs(laplacian) return cv2.addWeighted(img, 1.2, sharpened, -0.5, 0)

这个拉普拉斯锐化参数调得比较猛,因为要突出指尖的棱角。试过用高斯滤波先降噪再锐化,结果边缘太糊反而影响识别率,后来直接硬刚反而效果更好。

基于python+opencv的手势识别系统,可控制灯的亮度,智能家居,智能小车。 基于python+opencv的手势识别系统软件。 内含svm模型,和肤色识别,锐化处理。 基于 win10+Python3.7的环境,利用Python的OpenCV、Sklearn和PyQt5等库搭建了一个较为完整的手势识别系统,用于识别日常生活中1-10的静态手势。 完美运行

核心的SVM分类器训练代码:

def train_svm(): features = [] # 存储HOG特征 labels = [] # 手势标签 for img_path in gesture_images: img = cv2.imread(img_path, 0) hog_feature = hog(img, orientations=9, pixels_per_cell=(8,8), cells_per_block=(3,3), block_norm='L2-Hys') features.append(hog_feature) labels.append(get_label(img_path)) clf = svm.SVC(kernel='rbf', gamma=0.001, C=100) clf.fit(features, labels) joblib.dump(clf, 'gesture_model.pkl')

这里HOG参数参考了手势图像特点——手指间距通常在15像素左右,所以pixelspercell设为8x8能捕捉到关键特征。用RBF核的SVM在测试集上准确率达到96.7%,比KNN高出一截。注意gamma值别设太大,否则容易过拟合。

UI控制部分用PyQt5搞了个酷炫滑块:

class BrightnessControl(QWidget): def __init__(self): super().__init__() self.slider = QSlider(Qt.Vertical) self.slider.setRange(0, 100) def update_brightness(self, value): requests.post('http://smartlight/api', json={'brightness': value})

当识别到数字手势时,直接把数值映射到滑块位置。这里用了个隐藏技巧——滑块移动时加了个20ms的延迟触发,避免网络请求频率过高把智能灯泡搞崩。

实际部署时踩过几个坑:

  1. 室内光线影响肤色检测,后来加了个自适应白平衡预处理
  2. 手掌距离摄像头30-80cm时识别率最高,用ArUco码做了个距离检测提示
  3. SVM模型文件(.pkl)加载速度慢,改用joblib的压缩存储后加载时间减半

扩展玩法:接上树莓派驱动智能小车,张开手掌前进,握拳停止,比用遥控器带感多了。项目代码里留了MQTT接口,能轻松对接HomeAssistant智能家居系统。

完整代码已扔Github(地址见评论区),下回试试加上动态手势识别,比个心就能关灯什么的应该更有意思。有朋友在问为什么不用YOLO,其实试过yolov5s,实时性差不说,还经常把比耶手势认成剪刀手——有时候传统方法+小模型反而更香不是吗?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/6 21:25:02

DeepSeek-OCR-WEBUI核心功能解析|支持PDF、批量处理与GPU加速

DeepSeek-OCR-WEBUI核心功能解析|支持PDF、批量处理与GPU加速 1. 技术背景与问题提出 在数字化转型加速的背景下,企业面临海量纸质文档、扫描件和PDF文件的自动化处理需求。传统OCR工具在复杂版式、低质量图像或手写体识别场景下表现不佳,尤…

作者头像 李华
网站建设 2026/2/5 13:37:00

Voice Sculptor核心功能解析|附幼儿园教师到新闻主播的语音合成实践案例

Voice Sculptor核心功能解析|附幼儿园教师到新闻主播的语音合成实践案例 1. 技术背景与核心价值 近年来,语音合成技术经历了从传统参数化方法到深度学习驱动的端到端模型的演进。传统的TTS系统往往依赖于复杂的声学建模和语言学特征工程,而…

作者头像 李华
网站建设 2026/2/9 4:51:38

TensorFlow-v2.9性能对比:云端GPU 3小时完成本地1天任务

TensorFlow-v2.9性能对比:云端GPU 3小时完成本地1天任务 你是不是也遇到过这种情况:作为算法工程师,好不容易想出一个模型优化的新思路,结果在本地训练一轮就要十几个小时?等结果等得心焦,改参数改得手软&…

作者头像 李华
网站建设 2026/2/10 23:31:48

分割一切模型SAM3:新手指南+1小时免费,不怕没GPU

分割一切模型SAM3:新手指南1小时免费,不怕没GPU 你是不是也曾经看着别人用AI做图像分割、视频目标提取,甚至一键抠图生成3D模型,心里羡慕得不行?但一想到自己家里的老电脑跑不动这些“重量级”AI工具,就只…

作者头像 李华
网站建设 2026/2/9 1:24:29

零基础玩转GLM-TTS:无需代码,网页直接体验

零基础玩转GLM-TTS:无需代码,网页直接体验 你是不是也经常想听电子书,但手动翻页、长时间盯着屏幕太累?尤其是退休后时间多了,想听听经典文学、新闻资讯或孙子孙女喜欢的故事,可市面上的朗读工具要么声音机…

作者头像 李华