HY-Motion 1.0代码实例：调用start.sh启动本地服务并调试生成动作-开发者社区

HY-Motion 1.0代码实例：调用start.sh启动本地服务并调试生成动作

1. 为什么你需要亲手跑通这个start.sh脚本

你可能已经看过HY-Motion 1.0那些丝滑如电影的动作演示视频，但真正决定你能否把文字变成律动的，不是模型参数有多大，而是你能不能在自己机器上稳稳当当地跑起来。很多开发者卡在第一步——连服务都启不动，更别说调试提示词、观察关节运动轨迹了。

这不是一个“下载即用”的玩具，而是一个需要你亲手拧紧每一颗螺丝的精密仪器。start.sh就是那把最关键的扳手。它不只负责拉起Gradio界面，还统筹环境变量加载、模型权重路径校验、CUDA设备绑定、端口冲突检测等一整套底层逻辑。跳过它直接改Python文件？大概率会遇到ModuleNotFoundError: No module named 'hy_motion'或OSError: unable to open shared object file这类让人抓耳挠腮的问题。

这篇文章不讲高深理论，只聚焦一件事：从你双击终端那一刻起，到浏览器里看到第一个动作预览框，全程实操、零猜测、可复现。你会拿到一份能直接粘贴执行的命令流，看到每一步输出的真实日志，理解每个报错背后的实际原因，并掌握三个关键调试技巧——让动作不抽搐、让响应不卡顿、让提示词不被忽略。

2. 准备工作：检查硬件与环境是否真正就绪

2.1 显存与驱动：别让硬件成最大瓶颈

HY-Motion 1.0-Lite 要求最低24GB显存，这指的是GPU显存可用量，不是系统总内存。很多人误以为32GB内存就能跑，结果nvidia-smi一查，显存只有22.8GB，启动直接失败。

请先执行这条命令确认真实状态：

nvidia-smi --query-gpu=name,memory.total,memory.free --format=csv

你应该看到类似这样的输出：

name, memory.total [MiB], memory.free [MiB] NVIDIA A100-SXM4-40GB, 40960, 38250

注意第二列数值必须 ≥ 24576（即24GB）。如果低于此值，请关闭所有占用显存的进程（Jupyter、其他AI服务、甚至桌面环境）：

# 查看显存占用前五的进程 nvidia-smi --query-compute-apps=pid,used_memory --format=csv | sort -t',' -k2 -nr | head -5 # 强制结束指定PID（谨慎操作） kill -9 <PID>

同时验证CUDA版本是否匹配。HY-Motion 1.0构建时基于CUDA 12.1，运行nvcc --version应返回：

nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2023 NVIDIA Corporation Built on Mon_Apr__3_17:16:06_PDT_2023 Cuda compilation tools, release 12.1, V12.1.105

若版本不符，不要强行降级驱动——直接使用Docker镜像更稳妥（后文会提）。

2.2 文件结构校验：你的/root/build/HY-Motion-1.0目录长什么样

start.sh脚本依赖严格的目录结构。请进入该路径后执行：

ls -l

你必须看到以下核心文件与子目录：

drwxr-xr-x 3 root root 4096 Jan 23 20:19 checkpoints/ drwxr-xr-x 2 root root 4096 Jan 23 20:19 configs/ drwxr-xr-x 2 root root 4096 Jan 23 20:19 data/ -rw-r--r-- 1 root root 1204 Jan 23 20:19 requirements.txt -rwxr-xr-x 1 root root 1842 Jan 23 20:19 start.sh drwxr-xr-x 4 root root 4096 Jan 23 20:19 src/

特别注意：

checkpoints/下必须包含hy_motion_1.0.ckpt或hy_motion_1.0_lite.ckpt，大小约3.2GB或1.5GB
start.sh必须有可执行权限（-rwxr-xr-x），若无则运行chmod +x start.sh
src/目录不能为空，其中应有inference.py和gradio_app.py

任何一项缺失，start.sh启动时会在日志中抛出FileNotFoundError，但错误信息藏在后台，不易察觉。

3. 执行start.sh：逐行拆解脚本逻辑与预期输出

3.1 一行命令背后的完整流程

不要把它当成黑盒。我们手动展开start.sh的核心逻辑，让你知道每一步在做什么：

#!/bin/bash # 1. 激活conda环境（假设名为hy-motion-env） source /opt/conda/bin/activate hy-motion-env # 2. 切换到项目根目录（确保相对路径正确） cd /root/build/HY-Motion-1.0 # 3. 安装依赖（仅首次运行触发） if [ ! -f ".deps_installed" ]; then pip install -r requirements.txt touch .deps_installed fi # 4. 设置关键环境变量 export PYTHONPATH="${PYTHONPATH}:/root/build/HY-Motion-1.0/src" export HY_MOTION_CHECKPOINT="/root/build/HY-Motion-1.0/checkpoints/hy_motion_1.0_lite.ckpt" # 5. 启动Gradio服务（监听localhost:7860） python src/gradio_app.py --port 7860 --share False

这就是全部。没有魔法，只有清晰的路径、环境和依赖管理。

3.2 实际执行与日志解读：识别成功与失败信号

现在，在终端中输入：

bash /root/build/HY-Motion-1.0/start.sh

成功启动的标志性日志（最后5行）：

Running on local URL: http://127.0.0.1:7860 To create a public link, set `share=True` in `launch()`. INFO: Started server process [12345] INFO: Waiting for application startup. INFO: Application startup complete.

此时打开浏览器访问http://localhost:7860，你会看到一个简洁的Gradio界面：左侧文本框、中间预览窗口、右侧参数滑块。

常见失败场景与直击要害的修复方案：

报错现象	根本原因	一句话修复
`Command 'python' not found`	conda环境未激活或python未加入PATH	在`start.sh`开头添加`export PATH="/opt/conda/bin:$PATH"`
`ModuleNotFoundError: No module named 'torch'`	依赖未安装或环境错乱	删除`.deps_installed`文件，重新运行脚本
`OSError: [Errno 98] Address already in use`	7860端口被占用	修改`start.sh`中`--port 7861`，或`lsof -i :7860 \| xargs kill -9`
界面加载后提示`Model not found`	`HY_MOTION_CHECKPOINT`路径错误	运行`ls -l /root/build/HY-Motion-1.0/checkpoints/`确认文件名完全一致

记住：所有问题都源于路径、权限、环境三者之一。不要猜，用ls、echo $PATH、nvidia-smi三连查。

4. 调试生成动作：从“能跑”到“跑好”的实战技巧

4.1 提示词调试：为什么你的“dancing”没动起来

HY-Motion对提示词极其敏感。输入a person dancing可能生成静止站立，而A person performs a rhythmic side-step shuffle with arms swinging loosely at waist level却能精准还原。原因在于模型训练数据中，后者是高频出现的细粒度动作描述。

调试方法：分层递进法

第一层：验证基础通路
输入最简指令：A person stands still
预期：T-pose静止姿态，无抖动
❌ 若抖动：检查--num_seeds=1是否生效（见下文）
第二层：引入单关节运动
输入：A person raises right arm slowly to shoulder height
预期：右臂平滑上抬，肩部无突兀旋转
❌ 若手臂穿透身体：提示词中缺少with elbow bent at 90 degrees等约束
第三层：复合动作链
输入：A person squats down, pauses for 1 second, then jumps upward with both arms raised
预期：蹲→停→跳三阶段分明，空中手臂伸展自然
❌ 若跳跃高度不足：增加jumping high with full extension of legs

每次修改后，点击“Generate”旁的“Clear Cache”按钮，避免旧缓存干扰。

4.2 参数微调：三个关键滑块的实际影响

Gradio界面右侧有三个滑块，它们不是摆设：

num_frames（默认120）：控制动作总帧数。120帧 ≈ 4秒（30fps）。想生成5秒动作？设为150。但注意：每+30帧，显存占用+1.2GB。Lite版超过150帧易OOM。
guidance_scale（默认7.5）：提示词遵循强度。设为5.0时动作更自由但可能偏离指令；设为10.0时更精准但易僵硬。推荐调试区间：6.0–8.5。
num_seeds（默认4）：生成候选动作数量。设为1可立竿见影降低显存压力（-65%），且对单次调试足够。生产环境再调回4选最优。

** 真实调试记录**：在A100上，num_seeds=1+num_frames=120时，单次生成耗时23秒，显存峰值23.1GB；而num_seeds=4时耗时89秒，显存峰值25.8GB——提升精度的代价是近4倍时间。

4.3 动作质量诊断：如何判断是不是“电影级连贯性”

别只看预览窗。点击Gradio界面上方的“Download Result”按钮，获取生成的.npz文件（含SMPL-X格式关节点坐标）。用Python快速验证：

import numpy as np import matplotlib.pyplot as plt # 加载生成的动作数据 data = np.load("output_20250415_1423.npz") joints = data["joints"] # shape: (120, 127, 3) # 计算手腕速度波动（判断是否抖动） wrist_vel = np.linalg.norm(np.diff(joints[:, 21], axis=0), axis=1) # 21号索引为右手腕 plt.plot(wrist_vel) plt.title("Right Wrist Speed over Time") plt.ylabel("Speed (m/s)") plt.xlabel("Frame") plt.show()

健康曲线：平滑起伏，无尖峰（<0.8 m/s）
❌ 抖动信号：出现>1.5 m/s的尖刺，说明某帧关节位置突变——此时应回退到上一步，降低guidance_scale或重写提示词。

5. 进阶调试：当start.sh不够用时的替代方案

5.1 Docker一键部署：绕过环境地狱

如果你反复遭遇依赖冲突，Docker是最干净的解法。项目已提供Dockerfile，构建命令如下：

cd /root/build/HY-Motion-1.0 docker build -t hy-motion:1.0 . docker run --gpus all -p 7860:7860 -v $(pwd):/workspace hy-motion:1.0

镜像内已预装CUDA 12.1、PyTorch 2.3、全部依赖及校验通过的checkpoint。start.sh在此容器中变为：

#!/bin/bash cd /workspace python src/gradio_app.py --port 7860

零配置，开箱即用。

5.2 命令行直调：跳过Gradio，获得原始输出

想集成到你自己的流水线？直接调用推理脚本：

python src/inference.py \ --prompt "A person walks forward with confident stride, arms swinging naturally" \ --checkpoint /root/build/HY-Motion-1.0/checkpoints/hy_motion_1.0_lite.ckpt \ --num_frames 120 \ --guidance_scale 7.5 \ --output_dir ./outputs/

输出目录将生成：