45:机台启停、断电、重启全流程规范与故障处理
一、本课学习目标
- 掌握机台正常停机、紧急停机、断电重启的标准操作流程
- 梳理不同场景下EAP、HSMS/SECS链路、数据上报的联动变化
- 识别停机/重启后常见遗留故障、链路异常、数据异常问题
- 明确操作红线,规避误操作引发的批量生产问题
- 建立断电、重启后的快速恢复排查思路
二、停机分类与应用场景
1. 正常计划停机
日常保养、换品、班次交接、计划性维护,提前结束工单,有序停机。
2. 临时手动停机
单批次异常、临时检查设备,不涉及整机断电。
3. 紧急停机(EPO)
重大安全隐患、设备卡机、火灾等突发状况,立即切断动力与控制回路。
4. 意外断电
电网波动、线路故障、跳闸,整机无预警掉电。
三、场景1:正常计划停机(标准流程)
步骤1:工单收尾
- 等待当前批次加工完成,机台状态回到IDLE
- 确认S6F13上报Lot End完工事件,MES工单闭环
- 停止Trace数据采集(S6F11停止上报)
步骤2:停止自动化控制
- 机台由REMOTE远程切为LOCAL本地模式
- EAP下发正常断开指令,设备主动发送Deselect报文
- HSMS会话关闭,EAP设备状态变为OFFLINE
步骤3:设备本体停机
- 依次停止腔体、气路、真空、传输机构
- 关闭机台应用程序、PLC控制系统
- 按需关闭设备总电源、气源、水路
停机后状态
- EAP:链路断开,停止所有报文收发与数据转发
- 机台:本地可手动操作,GEM/HSMS服务停止
重启恢复流程
- 按上电顺序依次启动硬件、PLC、主控软件,等待自检完成
- 确认HSMS/SECS服务自动启动并进入监听状态
- EAP执行重连,完成TCP建链→HSMS会话→S1F1握手→校时全流程
- 核对报警、事件、数据订阅正常,切REMOTE模式,恢复生产
四、场景2:运行中临时手动停机
操作流程
- 下发Stop指令,当前工艺立即终止,设备由RUN转为IDLE
- 自动停止S6F11工艺数据上报,记录停机事件S6F13
- 保留HSMS/SECS通信链路,设备仍保持ONLINE状态
- 可在LOCAL模式下做简单检查,无需断电
恢复流程
- 检查无异常、无激活报警
- 切回REMOTE,直接下发Start指令继续生产,无需重新下载配方
常见小问题
停机后状态缓存异常,EAP界面状态不刷新:触发一次S1F13查询状态即可修复。
五、场景3:紧急停机 EPO(安全最高优先级)
现象与联动
- 按下EPO急停按钮,硬件回路强制切断,腔体、传动立即锁死
- 机台瞬间触发Fatal致命报警(S5F1),状态跳转ERROR
- 网络、控制软件短时正常,通信链路暂时保持
- 所有自动化指令全部被锁定,拒绝Load/Start等操作
恢复标准步骤
- 排查并解除安全隐患,复位物理EPO按钮
- 逐一清除所有激活报警与硬件联锁
- 整机执行硬件复位,机构回归原点
- 确认机台自检正常、条件满足
- EAP侧确认链路正常,下发复位指令,状态回到IDLE
- 核对配方、点位、数据上报正常后再启动生产
风险点
EPO频繁触发易导致控制器进程异常、配置缓存错乱,必要时重启机台软件。
六、场景4:意外断电 & 跳闸
断电瞬间现象
- 整机硬件、控制器、网卡全部掉电,TCP链路强制断开
- EAP检测链路丢失,持续自动重连,设备显示OFFLINE
- 未完成的报文、缓存数据全部丢失,批次记录中断
上电重启恢复流程
- 恢复供电,等待机台完整上电、硬件自检、主控软件加载完成
重点:严禁自检未完成就强制重连EAP
- 确认HSMS/SECS服务正常启动、进入监听
- EAP自动/手动发起重连,走完完整联机流程
- 核查异常项:
- 历史报警是否残留、是否需要手动清报警
- 配方是否丢失、变量状态是否正常
- CEID/ALID/Trace订阅是否生效
- 清空中断批次标记,重新下发工单恢复生产
七、停机/重启后高频故障及排查
故障1:重启后无法联机,一直OFFLINE
- 机台HSMS/SECS服务未自动启动,手动重启对应服务
- 断电导致网络配置重置,核对设备IP、端口
- 临时防火墙规则生效,放行通信端口
故障2:联机成功,但历史报警无法清除
断电造成报警状态缓存异常。在机台面板执行全局复位,同步EAP缓存。
故障3:重启后配方丢失/配方错乱
- 设备存储异常,重启后本地配方被清空
- 解决:重新下载标准Recipe,并做参数比对
故障4:联机正常,但无事件、无工艺数据
断电后GEM订阅配置丢失。重新重载EAP点位订阅,或重启机台GEM服务。
故障5:断连重连后T3超时变多
机台控制器刚启动,负载偏高、响应变慢。等待3~5分钟系统稳定再下发指令,或临时调高T3时长。
八、量产操作红线与规范
- 整机断电前必须先结束当前工单、切LOCAL、断开通信,禁止直接带电拔电源。
- RUN运行状态严禁执行整机重启、断电操作,易造成机构卡滞、晶圆报废。
- EPO紧急停机解除后,必须逐项检查硬件与联锁,不可直接强行启动。
- 意外断电恢复后,优先核对数据、配方、报警状态,再投入量产。
- 设备批量重启错开时间,避免网络瞬时压力过大引发集体断连。
九、本课核心总结
- 计划停机有序收尾工单再断电;临时停机保留通信链路;EPO强制锁机并触发致命报警。
- 意外断电会造成报文、缓存、临时状态全部丢失,属于高风险场景。
- 重启后故障优先排查:机台服务 → 网络配置 → 缓存状态 → 订阅配置。
- 任何停机操作都要先终结生产批次,再操作硬件与通信。
- 自检未完成不要急于重连EAP,防止服务卡死。
十、课后小作业
- 简述正常计划停机完整操作步骤。
- EPO急停后设备会出现哪些联动变化?
- 意外断电重启后收不到事件数据,如何处理?
- 为什么RUN状态下禁止直接断电重启?
- 机台重启后联机慢、频繁T3超时是什么原因?