news 2026/6/3 12:33:25

FoundationPose使用说明

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
FoundationPose使用说明
1、配置cuda环境如下
dengwei@youdao:~$ nvidia-smi Fri Dec1914:48:022025+---------------------------------------------------------------------------------------+|NVIDIA-SMI535.183.01 Driver Version:550.54.14 CUDA Version:12.4||-----------------------------------------+----------------------+----------------------+|GPU Name Persistence-M|Bus-Id Disp.A|Volatile Uncorr. ECC||Fan Temp Perf Pwr:Usage/Cap|Memory-Usage|GPU-Util Compute M.||||MIG M.||=========================================+======================+======================||0NVIDIA GeForce RTX3060Off|00000000:01:00.0 On|N/A||35% 31C P8 10W / 170W|3MiB / 12288MiB|0% Default||||N/A|+-----------------------------------------+----------------------+----------------------+ +---------------------------------------------------------------------------------------+|Processes:||GPU GI CI PID Type Process name GPU Memory||ID ID Usage||=======================================================================================||No running processes found|+---------------------------------------------------------------------------------------+ dengwei@youdao:~$ nvcc -V nvcc: NVIDIA(R)Cuda compiler driver Copyright(c)2005-2021 NVIDIA Corporation Built on Sun_Mar_21_19:15:46_PDT_2021 Cuda compilation tools, release11.3, V11.3.58 Build cuda_11.3.r11.3/compiler.29745058_0 dengwei@youdao:~$ls/usr/local/ bin cuda-11.3 cuda-12.2 games lib protobuf-3.11.4 share sunlogin tensor.tar.gz cuda cuda-12.1 etc includemansbin src TensorRT-10.8.0.43 zed dengwei@youdao:~$ ll /usr/local/cuda lrwxrwxrwx1root root20111123:36 /usr/local/cuda ->/usr/local/cuda-11.3/
2、参考博客安装foundationPose

https://blog.csdn.net/zml2973002937/article/details/149842806
下载镜像wenbowen123/foundationpose可能不顺利,可以导出本电脑的镜像,之后导入目标设备中;也可以将本电脑正在运行的容器导出来,导入到目标设备,这样容器不用再编译环境,导入运行即可用。镜像或容器的导出导入参考博客:
https://blog.csdn.net/qq_25735431/article/details/143256770

以下是我用的一些安装命令

# git下载FoundationPose代码cd/home/dengwei/PoseDetect/gitclone https://github.com/NVlabs/FoundationPose.git# docker下载镜像cd~ docker pull wenbowen123/foundationpose&&docker tag wenbowen123/foundationpose foundationpose# 配置docker容器内可打开GUI界面dengwei@youdao:~$ xhost +local:root# 使用镜像启动容器dengwei@youdao:~$ docker run -it --gpus all --name foundationpose\-eDISPLAY=$DISPLAY\--envQT_X11_NO_MITSHM=1\-v /home/dengwei/PoseDetect/FoundationPose:/workspace/FoundationPose\-v /tmp/.X11-unix:/tmp/.X11-unix:rw\-v ~/.Xauthority:/root/.Xauthority:rw\wenbowen123/foundationposebash# 查看正在运行的容器dengwei@youdao:~$ dockerps-a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 2b45e0ae068d wenbowen123/foundationpose"bash"5weeks ago Up5weeks foundationpose# 进入该容器dengwei@youdao:~$ dockerexec-it 2b45e0ae068dbash(my)root@2b45e0ae068d:/##进入容器内目录(my)root@2b45e0ae068d:/# cd /workspace/FoundationPose(my)root@2b45e0ae068d:/workspace/FoundationPose## 构建项目(首次运行需要)(my)root@2b45e0ae068d:/workspace/FoundationPose# bash build_all.sh# 运行 demo(my)root@2b45e0ae068d:/workspace/FoundationPose# python run_demo.py --debug 2#以后不小心退出了容器,只要没删除容器,则可以重启容器:dengwei@youdao:~$ docker restart foundationpose dengwei@youdao:~$ dockerexec-it foundationposebash(my)root@2b45e0ae068d:/# cd /workspace/FoundationPose(my)root@2b45e0ae068d:/workspace/FoundationPose# python run_demo.py --debug 2
3、制作数据集进行目标姿态检测(自备3D模型)

目标物体的3D模型需要依赖iPhone 12 以上并且需要是PRO版本的(有深度相机) 或者是iPad PRO M1以上的设备,用AR Code应用app进行扫描得到,仅扫描模型无需花钱。
参考博客:https://www.cnblogs.com/day1024/p/18948051
已制作好的一份数据所在目录为:

/home/dengwei/PoseDetect/FoundationPose/demo_data/data1

修改文件…/FoundationPose/run_demo.py指定为你自己的数据即可跑出实时检测姿态的结果。

4、Grounded-Segment-Anything 配置与运行

该模型的功能是安装文字提示对图片进行语义分割。
参考博客安装python虚拟环境:https://blog.csdn.net/Acecai01/article/details/148233545

dengwei@youdao:~$ pyenvinstall3.8.10 dengwei@youdao:~$ pyenv virtualenv3.8.10 SAM dengwei@youdao:~$ pyenv activate SAM(SAM)dengwei@youdao:~$cd~/PoseDetect/(SAM)dengwei@youdao:~/PoseDetect$gitclone https://github.com/IDEA-Research/Grounded-Segment-Anything.git(SAM)dengwei@youdao:~/PoseDetect$cdGrounded-Segment-Anything(SAM)dengwei@youdao:~/PoseDetect/Grounded-Segment-Anything$cdGroundingDINO(SAM)dengwei@youdao:~/PoseDetect/Grounded-Segment-Anything/GroundingDINO$ python setup.py build_ext --inplace

可能还需安装其他python模块,下载模型权重,请参考博客配置:
https://www.cnblogs.com/wmt0822/p/19005202
使用模型对图片进行分割:

# 第1步骤,打开梯子,连接外网# 第2步骤,(SAM)dengwei@youdao:~/PoseDetect/Grounded-Segment-Anything$ python grounded_sam_demo.py --config GroundingDINO/groundingdino/config/GroundingDINO_SwinT_OGC.py\--grounded_checkpoint groundingdino_swint_ogc.pth\--sam_checkpoint sam_vit_h_4b8939.pth\--input_image /home/dengwei/PoseDetect/FoundationPose/demo_data/data1/rgb/0000000.png\--output_dir"outputs"\--box_threshold0.3\--text_threshold0.25\--text_prompt"bolt with nut"

注意上述使用命令中需要修改成你自己的图片路径,以及目标名字。此外,如果你用多张图片需要分割,可以让AI参考代码grounded_sam_demo.py写一个处理某个目录内多张图片的代码。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/3 13:07:26

Langchain-Chatchat部署教程:从零搭建支持PDF、TXT、Word的AI问答系统

从零搭建支持PDF、TXT、Word的AI问答系统:Langchain-Chatchat实战部署 在企业知识管理日益复杂的今天,员工查找一份制度文件可能要翻遍多个共享文件夹;客服面对客户提问,常常需要手动查阅厚厚的产品手册。尽管通用大模型已经能流畅…

作者头像 李华
网站建设 2026/5/31 23:26:50

Calpuff模型具体数据的输入及运行结果

目前,大气污染仍为我国亟待解决的环境问题。为了弄清大气污染物排放后对周围环境的影响,需要了解污染物的扩散规律。Calpuff模型是一种三维非稳态拉格朗日扩散模型,可有效地处理非稳态(如,熏烟、环流、地形和海岸等&am…

作者头像 李华
网站建设 2026/5/28 15:12:10

AI大模型应用开发全攻略:从入门到精通_AI_大模型应用开发全攻略

本文全面介绍了AI大模型应用开发的核心技术,包括Messages对话机制、RAG检索增强生成、工具调用、ReAct推理模式、Agent自主任务执行、模型微调及提示词工程等关键概念。通过实例和代码演示,帮助读者理解大模型的工作原理和应用方式,并提供了企…

作者头像 李华
网站建设 2026/6/3 19:53:23

3分钟掌握Layui树形复选框:多选联动全攻略

3分钟掌握Layui树形复选框:多选联动全攻略 【免费下载链接】layui 一套遵循原生态开发模式的 Web UI 组件库,采用自身轻量级模块化规范,易上手,可以更简单快速地构建网页界面。 项目地址: https://gitcode.com/GitHub_Trending/…

作者头像 李华
网站建设 2026/5/30 15:14:52

SoapCore快速上手:在ASP.NET Core中构建SOAP服务的完整指南

SoapCore快速上手:在ASP.NET Core中构建SOAP服务的完整指南 【免费下载链接】SoapCore SOAP extension for ASP.NET Core 项目地址: https://gitcode.com/gh_mirrors/so/SoapCore 在当今微服务和REST API盛行的时代,SOAP协议仍然在企业级应用、金…

作者头像 李华