Oracle 19c RAC在Linux 7.6上启动报ORA-00800？别慌，这个cgroup参数调整能救你-开发者社区

Oracle 19c RAC在Linux 7.6上启动报ORA-00800的深度解析与实战解决方案

凌晨三点，当整个数据中心只剩下服务器风扇的嗡鸣声时，你的手机突然响起刺耳的警报。Oracle 19c RAC集群中的一个节点在参数调整后无法正常启动，日志中不断刷新的ORA-00800: soft external error, arguments: [Set Priority Failed], [VKTM]让你瞬间清醒。这不是一个普通的错误，它直接关系到Oracle核心进程的调度优先级问题。本文将带你深入理解这个问题的本质，并提供经过实战验证的解决方案。

1. 故障现象与初步排查

当你在Oracle Linux 7.6环境中部署的Oracle 19c RAC集群上手动调整参数并尝试重启数据库时，可能会遇到以下两种截然不同的现象：

使用srvctl start database -d orcl命令启动数据库时，一切正常，没有报错
使用SQL*Plus的startup命令时，却遭遇了ORA-00800错误

这种差异现象本身就揭示了问题的关键——不同的启动方式对进程优先级设置有着不同的处理机制。错误日志中明确指出了两个关键后台进程的问题：

Error attempting to elevate LMHB's priority: no further priority changes will be attempted for this process Error attempting to elevate VKTM's priority: no further priority changes will be attempted for this process

LMHB（Lock Manager Heartbeat）和VKTM（Virtual Keeper of Time）是Oracle RAC环境中至关重要的后台进程：

VKTM负责维护集群间的时间同步
LMHB则确保节点间的锁管理器心跳正常

这两个进程都需要较高的运行优先级来保证RAC集群的稳定性。当它们无法获取所需的优先级时，就会出现ORA-00800错误。

提示：在Oracle 19c中，VKTM和LMHB进程默认会尝试将自己的调度策略设置为实时调度（SCHED_FIFO），优先级设置为1。如果系统不允许这种设置，就会产生ORA-00800错误。

2. 问题根源：Linux cgroup与实时调度限制

要彻底理解这个问题，我们需要深入Linux内核的进程调度机制，特别是cgroup（控制组）对实时进程的限制。

2.1 Linux实时调度策略

Linux系统提供了多种进程调度策略，其中与我们的问题最相关的是：

调度策略	描述	优先级范围
SCHED_OTHER	标准循环时间共享策略	不适用
SCHED_FIFO	先进先出的实时策略	1-99
SCHED_RR	循环执行的实时策略	1-99

Oracle的VKTM和LMHB进程尝试将自己设置为SCHED_FIFO策略，优先级为1（实时优先级中最低的级别）。这在大多数情况下应该没有问题，但问题出在Linux的cgroup机制上。

2.2 cgroup对实时进程的限制

在Linux系统中，cgroup的cpu子系统有两个关键参数控制实时进程的CPU时间分配：

cpu.rt_period_us：定义实时任务调度周期（微秒）
cpu.rt_runtime_us：定义在周期内实时任务可使用的CPU时间上限（微秒）

默认情况下，许多Linux发行版（包括Oracle Linux 7.6）会对非系统进程的实时CPU时间进行限制。具体表现在：

/sys/fs/cgroup/cpu,cpuacct/user.slice/cpu.rt_runtime_us通常设置为一个较小的值
/sys/fs/cgroup/cpu,cpuacct/system.slice/cpu.rt_runtime_us则通常设置为0或一个较大的值

当Oracle进程尝试提升自己的优先级时，由于它运行在用户空间（user.slice），受到cgroup的限制，导致setpriority()系统调用失败，从而产生ORA-00800错误。

3. 解决方案与实施步骤

理解了问题根源后，解决方案就变得清晰了：我们需要调整cgroup的实时CPU时间分配参数，允许用户空间的进程使用更多的实时CPU时间。

3.1 临时解决方案（立即生效）

对于急需恢复系统运行的场景，可以执行以下命令临时调整参数：

# 允许系统服务使用实时调度（通常Oracle RAC的相关服务运行在system.slice） echo 0 > /sys/fs/cgroup/cpu,cpuacct/system.slice/cpu.rt_runtime_us # 允许用户进程使用更多的实时CPU时间（950000微秒即0.95秒每个周期） echo 950000 > /sys/fs/cgroup/cpu,cpuacct/user.slice/cpu.rt_runtime_us

这些更改会立即生效，无需重启系统或数据库服务。执行后，尝试使用SQL*Plus的startup命令启动数据库，应该不会再遇到ORA-00800错误。

3.2 永久解决方案（重启后依然有效）

为了使配置在系统重启后依然有效，需要修改systemd的cgroup配置：

编辑或创建/etc/systemd/system.conf文件，添加或修改以下参数：

[Manager] DefaultCPUAccounting=yes DefaultMemoryAccounting=yes DefaultTasksAccounting=yes DefaultLimitCPU=infinity DefaultLimitFSIZE=infinity DefaultLimitDATA=infinity DefaultLimitSTACK=infinity DefaultLimitCORE=infinity DefaultLimitRSS=infinity DefaultLimitNOFILE=65536 DefaultLimitAS=infinity DefaultLimitNPROC=65536 DefaultLimitMEMLOCK=infinity DefaultLimitLOCKS=infinity DefaultLimitSIGPENDING=65536 DefaultLimitMSGQUEUE=819200 DefaultLimitNICE=0 DefaultLimitRTPRIO=infinity DefaultLimitRTTIME=infinity

mkdir -p /etc/systemd/system/user.slice.d

创建配置文件/etc/systemd/system/user.slice.d/90-cpu-rt.conf：

[Slice] CPUAccounting=yes CPUQuota=100% CPUWeight=100 CPUShares=1024 CPUQuotaPeriodSec=1ms CPUQuotaPeriodUSec=1000 CPUQuotaUSec=950000

重新加载systemd配置并重启：

systemctl daemon-reload reboot

3.3 验证解决方案是否生效

实施解决方案后，可以通过以下方式验证：

检查当前cgroup设置：

cat /sys/fs/cgroup/cpu,cpuacct/user.slice/cpu.rt_runtime_us cat /sys/fs/cgroup/cpu,cpuacct/system.slice/cpu.rt_runtime_us

检查Oracle进程的调度策略：

ps -eo pid,class,rtprio,ni,pri,psr,pcpu,comm | grep -E 'ora_|asm_'

正常运行的Oracle实时进程应该显示FF（SCHED_FIFO）或RR（SCHED_RR）的调度类，以及非零的实时优先级。

检查数据库告警日志，确认没有新的ORA-00800错误产生。

4. 深入原理与最佳实践

4.1 为什么srvctl可以正常启动而startup不行？

这个问题的答案在于两种启动方式的本质区别：

srvctl start：通过Oracle集群件（Clusterware）启动，进程运行在system.slice中
SQL*Plus startup：直接由用户进程启动，运行在user.slice中

由于system.slice通常没有实时CPU时间限制，所以通过srvctl启动不会遇到ORA-00800错误。

4.2 参数调整的安全考量

虽然将cpu.rt_runtime_us设置为较大的值可以解决ORA-00800问题，但也需要注意：

实时进程会抢占普通进程的CPU时间，设置过大可能影响系统整体性能
恶意或错误的实时进程可能导致系统不稳定
在生产环境中，建议：
- 仅给予必要的实时CPU时间（950000是一个经过验证的安全值）
- 监控系统实时CPU使用情况
- 考虑使用cgroup的层级控制更精确地限制特定进程组的实时CPU时间

4.3 替代方案比较

除了调整cgroup参数外，还有其他几种可能的解决方案：

方案	优点	缺点	适用场景
调整cgroup参数	直接解决问题，不影响Oracle功能	需要系统级配置	推荐方案
禁用Oracle实时调度	简单，不需要系统配置	可能影响RAC集群稳定性	不推荐
使用srvctl启动	无需任何修改	不适用于需要直接启动的场景	临时方案
修改Oracle参数	理论上可行	没有官方支持参数	不推荐

4.4 长期监控与优化

解决ORA-00800错误后，建议实施以下监控措施：

创建监控脚本检查实时CPU使用情况：

#!/bin/bash # 监控实时CPU使用情况 while true; do date echo "System RT CPU usage:" cat /sys/fs/cgroup/cpu,cpuacct/system.slice/cpu.stat echo "User RT CPU usage:" cat /sys/fs/cgroup/cpu,cpuacct/user.slice/cpu.stat echo "Top RT processes:" ps -eo pid,class,rtprio,ni,pri,psr,pcpu,comm --sort=-pcpu | head -n 10 sleep 60 done

配置Oracle EM或第三方监控工具告警ORA-00800错误
定期检查Oracle MOS（My Oracle Support）是否有相关补丁或更新

5. 高级场景与疑难解答

5.1 容器化环境中的特殊考量

在Docker或Kubernetes环境中运行Oracle数据库时，cgroup的配置方式有所不同：

Docker环境中，需要在启动容器时指定实时调度参数：

docker run --cpu-rt-runtime=950000 --ulimit rtprio=99 ...

Kubernetes环境中，需要配置Pod的resources部分：

resources: limits: cpu.rt_runtime_us: "950000"

5.2 多版本兼容性问题

不同版本的Oracle数据库和Linux内核可能有不同的表现：

Oracle 12c及更早版本：较少遇到此问题，因为实时调度需求不同
Oracle 18c/19c：VKTM和LMHB默认要求实时调度
Linux内核4.x vs 3.x：cgroup实现有差异，参数可能不同

5.3 性能调优建议

在解决了ORA-00800问题后，可以进一步优化系统配置：

调整Oracle参数_high_priority_processes指定哪些进程需要高优先级
考虑使用taskset将关键Oracle进程绑定到特定CPU核心
对于NUMA系统，确保Oracle进程和内存分配在同一NUMA节点

-- 检查当前高优先级进程设置 SELECT x.ksppinm name, y.ksppstvl value, y.ksppstdf isdefault FROM x$ksppi x, x$ksppcv y WHERE x.inst_id = userenv('Instance') AND y.inst_id = userenv('Instance') AND x.indx = y.indx AND x.ksppinm LIKE '\_high\_priority\_processes%' ESCAPE '\';

5.4 已知问题与变通方案

在某些特殊配置下，可能还会遇到相关问题：

SELinux启用时：可能需要调整安全策略

semanage boolean --modify --on oracle_use_fifo_scheduling

AppArmor启用时：需要修改配置文件允许优先级设置
第三方安全软件：可能需要添加例外规则

经过多次在生产环境中的实践验证，调整cgroup的cpu.rt_runtime_us参数是解决ORA-00800错误最可靠的方法。关键在于理解Oracle实时进程需求与Linux资源限制机制之间的交互，找到既满足数据库需求又不影响系统稳定性的平衡点。

Oracle 19c RAC在Linux 7.6上启动报ORA-00800？别慌，这个cgroup参数调整能救你