Docker 容器 CPU 配额失效：cgroups v1 到 v2 的配置迁移

xiaoshi 05-30 93 抢沙发

默认

摘要： ...

Docker容器CPU配额失效：从cgroups v1到v2的迁移指南

为什么你的Docker CPU限制突然失效了？

最近不少运维工程师发现，原本在Docker中设置得好好的CPU限制突然不起作用了。这通常发生在系统从cgroups v1升级到cgroups v2后。cgroups（控制组）是Linux内核功能，负责资源限制、优先级控制等功能，而Docker正是依赖它来实现容器资源隔离。

Docker 容器 CPU 配额失效：cgroups v1 到 v2 的配置迁移

cgroups v2作为新一代控制组系统，带来了更简洁的设计和更好的资源管理能力，但也引入了一些不兼容的变化。如果你的系统升级到了较新的Linux发行版（如Ubuntu 21.10+或CentOS 8+），很可能已经默认启用了cgroups v2，这就导致了原有的Docker CPU配额配置失效。

cgroups v1与v2的核心差异

理解问题的根源，我们需要先看看两个版本的关键区别：

层级结构简化：v1允许多个层级结构同时存在，而v2采用单一层级结构，更简洁但限制更多
控制器合并：v1中CPU和内存控制器是分开的，v2中它们被合并为统一的资源控制接口
权重分配变化：v1使用"cpu.shares"设置相对权重，v2改用"cpu.weight"且取值范围不同
配额实现方式：v1通过"cpu.cfs_period_us"和"cpu.cfs_quota_us"设置绝对配额，v2保留了类似机制但实现细节有变

如何检测你的系统使用哪个版本

在开始解决问题前，先确认你的系统实际运行的cgroups版本：

$ stat -fc %T /sys/fs/cgroup/

如果返回"cgroup2fs"，说明系统使用cgroups v2；如果是"tmpfs"，则还在使用v1。

另一个检查方法是查看/proc/filesystems：

$ grep cgroup /proc/filesystems

如果只有"nodev cgroup2"而没有"nodev cgroup"，说明系统完全切换到v2了。

Docker在cgroups v2下的CPU限制配置

1. 启用混合模式（推荐）

大多数现代Linux发行版支持cgroups v1和v2混合模式，这可以让Docker继续使用v1接口：

# 编辑grub配置
$ sudo vi /etc/default/grub

# 找到GRUB_CMDLINE_LINUX行，添加
GRUB_CMDLINE_LINUX="systemd.unified_cgroup_hierarchy=0"

# 更新grub并重启
$ sudo update-grub
$ sudo reboot

这种方法最简单，但长期来看不是最佳方案，因为cgroups v1最终会被淘汰。

2. 完全适配cgroups v2

如果你决定全面转向cgroups v2，需要调整Docker的CPU限制配置方式：

CPU份额设置

v1中的--cpu-shares参数在v2中等效为：

docker run --cpuset-cpus=0 --cpu-weight=100 your-image

注意权重范围从v1的2-262144变为v2的1-10000，默认值是100。

CPU配额设置

v1中使用--cpus或--cpu-quota的方式在v2中仍然有效，但底层实现不同：

# 限制容器最多使用1.5个CPU核心
docker run --cpus=1.5 your-image

# 等效的详细设置方式
docker run --cpu-period=100000 --cpu-quota=150000 your-image

CPU亲和性设置

CPU亲和性设置保持不变：

# 限制容器只能使用第一个CPU核心
docker run --cpuset-cpus=0 your-image

常见问题解决方案

问题1：Docker报错"cgroups v2 not supported"

解决方案：

升级Docker到20.10或更高版本
或者暂时切换回cgroups v1（如前文所述）

问题2：CPU限制似乎没有生效

检查步骤：

确认Docker版本支持cgroups v2
检查容器实际使用的CPU资源：
```
docker stats
```

验证cgroup设置：

cat /sys/fs/cgroup/docker/<容器ID>/cpu.max

问题3：性能监控工具显示异常

许多监控工具（如Prometheus的cAdvisor）需要更新才能正确解析cgroups v2的指标。解决方案：

升级监控工具到最新版本
或者暂时使用cgroups v1混合模式

最佳实践建议

测试环境先行：先在测试环境验证cgroups v2的兼容性，再应用到生产环境
全面监控：升级后密切监控系统资源使用情况，特别是CPU密集型应用
文档更新：更新你的运维文档，记录新的配置方式和验证方法
工具链检查：确保你的CI/CD流水线、监控告警系统都支持cgroups v2

内核参数调优：考虑调整以下内核参数以获得更好性能：

echo "kernel.sched_cfs_bandwidth_slice_us=5000" >> /etc/sysctl.conf
sysctl -p

未来展望

随着容器技术的演进，cgroups v2将成为标准。Docker和Kubernetes等工具正在积极适配这一变化。虽然迁移过程可能遇到些小麻烦，但cgroups v2带来的改进值得投入：

更精确的资源控制
更低的系统开销
更好的安全性
更一致的API设计

建议所有容器用户尽早规划向cgroups v2的迁移，而不是依赖混合模式作为长期解决方案。

通过以上调整，你的Docker容器CPU配额将在cgroups v2环境下重新生效，确保应用程序获得预期的计算资源，同时避免影响主机上其他关键进程。记住，每次系统级变更后都要进行全面测试，特别是对性能敏感的应用。

文章版权及转载声明

作者:xiaoshi本文地址：http://blog.luashi.cn/post/1397.html发布于 05-30
文章转载或复制请以超链接形式并注明出处小小石博客

打赏

海报

阅读

发表评论取消回复

评论列表（暂无评论，93人围观）参与讨论

Docker 容器 CPU 配额失效：cgroups v1 到 v2 的配置迁移

Docker容器CPU配额失效：从cgroups v1到v2的迁移指南

为什么你的Docker CPU限制突然失效了？

cgroups v1与v2的核心差异

如何检测你的系统使用哪个版本

Docker在cgroups v2下的CPU限制配置

1. 启用混合模式（推荐）

2. 完全适配cgroups v2

CPU份额设置

CPU配额设置

CPU亲和性设置

常见问题解决方案

问题1：Docker报错"cgroups v2 not supported"

问题2：CPU限制似乎没有生效

问题3：性能监控工具显示异常

最佳实践建议

未来展望

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

发表评论取消回复

还没有评论，来说两句吧...

Docker容器CPU配额失效：从cgroups v1到v2的迁移指南

为什么你的Docker CPU限制突然失效了？

cgroups v1与v2的核心差异

如何检测你的系统使用哪个版本

Docker在cgroups v2下的CPU限制配置

1. 启用混合模式（推荐）

2. 完全适配cgroups v2

CPU份额设置

CPU配额设置

CPU亲和性设置

常见问题解决方案

问题1：Docker报错"cgroups v2 not supported"

问题2：CPU限制似乎没有生效

问题3：性能监控工具显示异常

最佳实践建议

未来展望

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

相关推荐

Visual Studio Code 主题定制，打造个性化编程界面

IntelliJ IDEA 团队协作开发的高效模式

PyCharm 单元测试框架的使用方法

Eclipse 与版本控制系统的完美结合

NetBeans 搭建 Java 项目的详细教程

C# 编程学习的泛型编程高级应用

Java 设计模式学习的策略模式应用

Xcode 游戏开发的入门之路

发表评论取消回复

还没有评论，来说两句吧...