在私有云部署软件的时候时长没有网络,没有办法安装apt仓库内已有的软件,这个时候我们可以使用光驱或者iso镜像挂载到本地作为apt仓库进行使用,具体操作如下:1.挂载光驱到指定目录作为本地仓库的方法首先我们创建挂载目录,...
使用GPU的容器运行了一个训练任务,一段时间以后查看训练任务失败,进POD容器内执行nvidia-smi返回"Failed to initialize NVML: Unknown Error"。目前该问题是一个已知问题,...
我们重新部署了k8s环境,centos7环境下使用的k8s1.27.0这个版本,今天在部署k8s上使用storageclass资源资源部署nfs使用时,POD挂载nfs资源报错提示“unexpected error ge...
之前我们部署k8s多master高可用集群中使用的代理均衡器是nginx,这次我们使用haproxy来做负载均衡器,之前的笔记也会用到,可以查看之前的笔记:https://sulao.cn/post/950直接从之前笔记...
通常我们在使用nginx做代理时,不使用http协议的场景下,我们需要使用四层的负载均衡,例如在mysql和k8s场景在都是使用4层负载均衡来做代理,通常在大并发的场景下也会在七层负载前面增加四层的负载均衡然而在ngin...
prometheus将采集到的样本以时间序列的方式保存在内存(TSDB 时序数据库)中,并定时保存到硬盘中。prometheus默认本地会存储15天的数据,如果超过15天会自动删除,如果需要调整这个时间,需要修改prom...
目前我的k8s环境容器是使用的containerd,删除POD以后一直terminating,无法销毁,然后查看terminating的POD有以下事件报错 Normal Killing 8m16s ...
之前使用docker配置的可以查看这个笔记https://sulao.cn/post/783进行配置现在使用containerd以后需要在config.toml中配置仓库的相关信息修改/etc/containerd/co...
集群部署k8s1.23.0版本,容器使用的是containerd1.7.10版本规划的集群信息如下192.168.1.72 master1 192.168.1.73 master2 192.168.1.74 ...