在CSDN学Golang云原生（Kubernetes集群管理）_Golang

一，node的隔离与恢复

在 kubernetes 集群中，node 的隔离与恢复通常可以通过以下方式实现：

使用 taints 和 tolerations 实现隔离

taints 和 tolerations 是 kubernetes 中用于节点调度的机制。通过给节点添加 taints（污点），可以让节点拒绝某些特定的 pod 调度。而对于需要运行在这些节点上的 pod，我们需要在 pod 的定义中设置 tolerations（容忍度）来允许它们被调度到这些污点节点上。

例如，我们可以使用以下命令将一个污点添加到 node 上：

kubectl taint nodes <node-name> key=value:taint-effect

其中 key 和 value 用于指定污点的名称和值，taint-effect 用于指定污点对应的效果，包括 noschedule、prefernoschedule 和 noexecute。

然后，在定义 pod 时，我们需要为它设置 tolerations：

tolerations:
- key: "key"
  operator: "equal"
  value: "value"
  effect: "noschedule"

这样就可以让这个 pod 能够被调度到带有相应污点的节点上了。

使用 node selector 实现隔离

另一种实现隔离的方式是使用 node selector。node selector 允许你根据标签选择要运行 pod 的节点。如果某个节点没有符合条件的标签，那么就不会被选中来运行 pod。

例如，我们可以使用以下命令为一个节点添加标签：

kubectl label nodes <node-name> key=value

然后，在定义 pod 时，我们需要为它设置 node selector：

nodeselector:
  key: value

这样就可以让这个 pod 只能被调度到带有相应标签的节点上了。

使用 daemonset 实现恢复

在 kubernetes 中，daemonset 是用于在每个节点上运行一个副本的控制器。通过使用 daemonset，我们可以确保每个节点都运行了某个特定的 pod 副本。

如果某个节点出现故障或者被移除了，kubernetes 会自动将该节点上对应的 pod 删除，并在其他可用节点上重新创建一个新的 pod 副本。这样就可以实现对 node 的快速恢复。

在 kubernetes 集群中实现 node 的隔离和恢复通常需要结合多种技术手段进行综合应用。

二，node的扩容

在 kubernetes 集群中，可以通过以下步骤实现 node 的扩容：

准备新的节点

首先，需要准备一个或多个新的节点用于扩容。这些节点可以是物理机器、虚拟机或者云主机等。

安装 kubernetes 软件

在新的节点上安装和配置 kubernetes 软件。具体来说，需要安装 kubelet、kube-proxy 和 container runtime 等组件，并确保它们能够正常运行。

加入集群

将新的节点加入到 kubernetes 集群中。这可以通过执行以下命令实现：

kubeadm join <master-ip>:<master-port> --token <token> --discovery-token-ca-cert-hash sha256:<hash>

其中 <master-ip> 和 <master-port> 分别为 kubernetes 主节点的 ip 地址和端口号；<token> 为加入集群所需的令牌；<hash> 为 ca 证书哈希值。这些信息可以通过在主节点上执行 kubeadm token create 和 kubeadm token create --print-join-command 命令获取。

验证加入状态

检查新的节点是否已经成功加入到集群中。可以使用以下命令列出当前所有的节点：

kubectl get nodes

如果一切顺利，应该能够看到新增加的节点已经出现在列表中。

手动调度 pod

如果希望将某些特定的 pod 调度到新的节点上，可以使用 node selector 或 taints 和 tolerations 等技术手段来实现。例如，我们可以为新的节点设置标签，然后在 pod 定义中指定相应的 node selector，或者在新的节点上添加污点，并在需要运行该 pod 的节点上设置 tolerations。

自动调度 pod

最后，如果希望 kubernetes 能够自动将一些未调度的 pod 调度到新的节点上，可以考虑扩容集群中的其他组件，如 deployment、statefulset 等控制器。这些控制器会自动创建和管理多个副本，并确保它们均匀地分布在不同的节点上。

在 kubernetes 集群中进行 node 的扩容通常需要结合多种技术手段进行综合应用

golang云原生学习路线图、教学视频、文档资料、面试题资料（资料包括c/c++、k8s、golang项目实战、grpc、docker、devops等）免费分享有需要的可以加qun：793221798领取

三，namespace与context集群环境共享与隔离

kubernetes 中的 namespace 和 context 都是用于实现多租户和多集群环境下资源共享和隔离的关键组件。

namespace 是 kubernetes 中用于将一个物理集群划分为多个虚拟集群的机制。通过在不同的 namespace 中创建和管理 pod、service、replicationcontroller 等资源对象，可以有效地隔离不同应用或用户之间的资源使用，并提供更细粒度的权限控制。例如，可以为每个团队或部门创建一个独立的 namespace，并将相应的应用部署到该 namespace 中。

context 则是 kubernetes cli 工具中用于管理多个 kubernetes 集群配置信息的机制。通过定义不同的 context，可以轻松地在不同的 kubernetes 集群之间进行切换，并且保持相应配置信息（如 api server 地址、认证信息等）隔离和安全。例如，可以定义两个 context 分别指向生产环境和测试环境中运行的 kubernetes 集群，并使用 kubectl config use-context 命令来快速切换。

同时，namespace 和 context 也可以结合起来使用，以实现更加复杂的场景下资源共享和隔离。例如，在一个大型企业内部，可能需要同时管理数十个 kubernetes 集群，并且需要为每个项目或部门创建独立的 namespace 来实现资源隔离。此时，可以为每个 kubernetes 集群配置一个独立的 context，并将相应的 namespace 对象映射到该 context 中，从而实现 namespace 和 context 的双重隔离和共享。

需要注意的是，在使用 namespace 和 context 时，必须确保正确地配置 rbac（基于角色的访问控制）策略，以限制用户或服务账户对资源对象的访问权限。另外，在多集群环境下还需要考虑网络互通、数据同步等问题，这些都需要根据具体情况进行详细设计和实现。

四，基于节点资源的pod驱逐机制

在 kubernetes 中，当节点资源（如 cpu、内存等）不足时，会触发 pod 驱逐机制，即根据一定的策略将某些 pod 从当前节点中驱逐出去，以释放资源供其他 pod 使用。pod 驱逐机制是 kubernetes 自我保护机制的一部分，旨在避免因资源耗尽导致整个集群崩溃。

kubernetes 支持多种 pod 驱逐策略，其中最常用的是基于优先级的策略。具体来说，在每个 node 上都有一个叫做 kubelet-eviction-manager 的守护进程负责监控该 node 上所有运行中的 pod，并根据配置的优先级和条件来判断哪些 pod 应该被驱逐。

在进行基于优先级的驱逐时，kubelet-eviction-manager 会根据下列原则进行判断：

优先保留有高优先级别需求的 pod。
当同一 namespace 下存在多个可被替代的 pod 时，则保留“最少就绪时间”较长的那个。
如果没有可被替代的低优先级别 pod，则考虑删除已经执行完成但未被标记为不可删除（非必要性）或者未设置 deadline 的低优先级别 pod。
如果仍然无法满足需求，则依次判断同一 node 上的其他 pod，直到满足条件或者所有 pod 都被判断过为止。

需要注意的是，pod 的优先级别、资源限制和 qos 等因素都会影响驱逐机制的决策结果。因此，在进行 pod 调度和管理时，必须合理设置这些参数，并确保在出现资源不足时能够正确地进行 pod 驱逐。同时，还应该定期监控集群中的资源使用情况，并及时采取措施以避免出现资源耗尽等问题。

在CSDN学Golang云原生（Kubernetes集群管理）

2024年07月28日 • Golang •我要评论

一，node的隔离与恢复

相关文章:

【Golang】slice切片

软件测试（概念Ⅱ） · 开发模型 · 软件的生命周期 · 瀑布模型 · 螺旋模型 · 增量模型 · 迭代模型 · 敏捷模型 · scrum · 软件测试模型之 V 模型 & W 模型

发表评论


验证码：