如何创建高效、经济的Kubernetes集群
更新:HHH   时间:2023-1-7


Kubernetes是我主要学习的主题之一。我知道不光是我,还有一定数量的人愿意在工作之余进一步使用和研究它。


本文是介绍关于如何创建一个高效的Kubernetes集群,用于在Scaleway上使用Terraform和Rancher 2.x的开发目的。我假设你已经知道了(或者至少听过):

  • Kubernetes

  • Terraform

  • Rancher

  • Scaleway

  • Cloudflare


概    述


下图的概要描述了本文尝试实现的内容:

部署工作大部分将由Terraform自动完成。我们将创建一个Rancher服务器,在上面添加Rancher代理来创建和管理Kubernetes集群。域解析也将由Terraform自动配置到Cloudflare。所有的服务器都将部署到Scaleway上,而且它们非常的便宜(在撰写本文时Start1-S服务器只花费€3.99/mo和€0.008/小时!)


为什么选择Rancher?


如果你想从头开始学习Kubernetes成为一名kubectl魔术师,这个出发点不错,我不反对。不过在我看来,仅仅是学习Kuberenetes是不够的,更重要的是你想用它做什么,你想实现什么。比如,我经常开发微服务和功能来进行测试(特别是webhook集成),并在Kubernetes上运行它。当然,在管理Kubernetes方面kubectl起到了很大的帮助,但是当我想检查某些服务的日志或创建一些secrets时,我不得不使用kubectl输入大量命令创建出大量的清单,这些常让我感到疲惫。有时候我只是想简单地部署一下资源,并不使用清单。我知道有很多工具(如stern、ksonnet等等)可以帮助实现这些工作流,但是我从Rancher 1.x开始就是忠实用户了,知道他们的UI可以让工作变得更简单直观。这也是我为什么在这个工具集中包含Rancher的原因。


让我们开始吧!


话不多说,我们开始部署一些资源吧。这儿有一些准备工作:

  • 准备一个Scaleway账号

  • 准备一个Cloudflare账号

  • 在Cloudflare中设置至少1个zone(你可以得到一个免费的服务域比如Freenom)

  • 克隆kenfdev/rancher-scaleway仓库

  • 安装terraform

  • 安装kubectl

我不会详细解释这些内容,因为如果都写的话这篇文章得爆炸了。你可以自己搜索找到相关的资源。


在这里有一个重要的提示。我们将在Scaleway上部署服务器,这些都不是免费的。所以事先要确认这一点,它会花费一些钱(不过Scaleway非常便宜)。我不会对这些成本承担任何责任,所以如果你完成了,一定要破坏掉它们。


从Scaleway获取信息


我们将在Scaleway上自动部署服务器,为此,我们需要有一个token。在Scaleway中转到Credentials页面并点击Create new token。把Secret key记录下来,因为我们之后会用到这个。

同时,前往Account页面找到ORGANIZATION ID做好记录。到现在为止你已经完成了Scaleway的部分,Terraform会处理好其他事情。


从Cloudflare获取API token


我们需要为创建的Rancher服务器设置DNS,为了实现这一点,我们需要获得Cloudflare的API token。前往Cloudflare下的My Profile,可以在这里找到API Keys。如下图所示点击Global API KeyView按钮。

现在记录下这个token,到这里收集信息的工作结束了。


为Rancher服务器准备Terraform资源


现在我们已经有了需要收集的信息,那么下一步就是用Terraform来部署了。先去克隆kenfdev/rancher-scaleway仓库。


首先,前往rancherserver目录,按照terraform.tfvars.sample创建一个tfvars文件,打开它:

tfvars文件看起来像这样:

需要对这些内容做修改:

  • scw_token – 你的Scaleway Secret Token

  • scw_org – 你的Scaleway Organization ID

  • admin_password – 你将在Rancher服务器使用的密码

  • rancher_server_url – Rancher服务器所使用的URL。Terraform会为你的cloudflare zone设置一个rancher子域名。所以如果你的zone名为example.com,那么terraform会创建一个记录链接到rancher.example.com

  • cloudflare_email – 你Cloudflare中的Email

  • cloudflare_token – 你Cloudflare的API token

  • cloudflare_zone – 你的Cloudflare zone

你也可以根据你自己的需求修改其他变量。


部署Rancher Server


现在我们准备好了,用Terraform来进行部署吧!点击terraform apply你会看到像下面这样的显示:

5个资源?

“为什么是5个资源?我们刚刚不是只部署了1个服务器吗?”你可能会这么问,其实我们确实部署了不止一个资源,我们部署了:

  • 1个服务器(Rancher服务器)

  • 1个为cloud-init进程引导Rancher服务器的用户数据

  • 1个安全组

  • 1条附加到安全组来控制流量的规则

  • 1条指向Rancher服务器的Cloudflare DNS记录

这样便添加了5个资源,现在点击yes。如果一切进行顺利,你应该能看到这样的信息:

如果检查Scaleway的话:

看起来服务器是部署好了,那DNS如何呢?

它看起来也添加到了Cloudflare!现在我们用这个地址访问Rancher服务器:

https://rancher.your.zone/


如果你使用的是Chrome的话应该会看到警告提示

这是因为你还没有给服务器设置合法的SSL证书。单击左下角的按钮,忽略警告并强制访问页面。

瞧!我们用1条命令部署了一个带有DNS的Rancher服务器!很酷吧!输入你保存在tfvars中设置的密码,应该能登陆了。

现在你有了一个正在工作的Rancher服务器!你可以在UI上开始为各个位置创建Kubernetes集群,不过本文不会介绍这些用例。取而代之的,我们将在这里使用Terraform,在Scaleway上创建Rancher代理,自动设置这些由Rancher服务器管理的集群。


为Rancher代理准备Terraform资源


返回kenfdev/rancher-scaleway仓库。现在,前往rancheragent目录。同样复制一份terraform.tfvars.sampleterraform.tfvars

现在打开terraform.tfvars:

和Rancher服务器时一样填入凭证信息,这里列出一些要记住的变量:

  • rancher_server_address – Rancher Serve的地址,它可能是一个IP或者域名,不过我建议你在之前的步骤中设置成域名

  • count_agent_all_nodes – 统计创建的拥有all roles(etcd, controlplane, worker)的节点数。如果你只是取体验一下Kubernetes集群,那么有一个就足够了。

  • count_agent_etcd_nodes – 统计创建的拥有etcd role的节点数

  • count_agent_controlplane – 统计创建的拥有controlplane role的节点数

  • count_agent_worker_nodes – 统计创建的拥有worker role的节点数


部署Rancher代理


现在再一次点击terraform apply,将rancher代理部署到Scaleway上。

选择yes,服务器就部署好了。几分钟后你可以看到资源部署完毕:

同时,在Rancher服务器的UI下,你可以看到一个新的集群注册好了。

再过一会,你可以看到Kubernetes集群部署完毕(Active)!

这也很酷对吧?我们可以在Internet(Scaleway)上创建自己的Kubernetes集群,而这仅仅通过几行命令!


测试Ingress控制器


现在我们可以使用Kubernetes集群了,让我们看看Nginx Ingress控制器是否按照预期工作。在rancheragent目录中,打开dns.tf 文件并添加下面的信息:

这将创建一个Cloudflare记录来指向具有all roles的Rancher代理节点。点击terraform apply,在Cloudflare设置DNS。


现在我们访问http://default.your.zone,我们还没有在集群上配置任何Ingress,因此需要访问默认后端。

嘿!我们可以看到Ingress控制器正按我们期望的运作着。


通过kubectl访问集群


最后,我们来试试能不能通过kubectl访问这个集群。拉取kubeconfig十分容易。只要在集群层找到按钮即可:

把config文件复制或者下载到model上:

kubectlKUBECONFIG获取一些信息

成功获得了关于节点的信息,pods又是如何呢?

只用了简单的kubectl就能轻松获得信息,你也可以通过Rancher UI或者kubectl部署资源。


清   理


如果你想继续使用集群,你可以从这时起继续使用,不过我下面要介绍的是如果你已经使用完毕,该如何把这一切清理掉。


破坏掉Rancher代理和Cloudflare资源


执行下面的命令:


销毁Rancher服务器和Cloudflare资源


确保Scaleway上没有任何资源了(只有默认的安全组)。否则你还要为这些资源付费。


总  结


有好几种方法可以利用这种工作流,而我更倾向于不直接使用Rancher Server,而是经常创建和销毁Rancher Agent(以及Kubernetes集群)。


返回云计算教程...