2023.12.13 加入,已入驻 154 天。
2023.12.13 加入,已入驻 154 天。
项目职责:海外版是为了满足海外客户群体的需求,为了最大化利用资源与平台扩展性,进行前后台代码分离,采用 docker+k8s编排系统实现容器集群的自动化部署方式。不仅解决了海外客户认为不是刚需的功能,而且在迭代过程 中更加高效。在定制策略上,做到客户账号页面相互隔离的效果。 项目职责: 1、使用docker+k8s部署测试环境以及生产环境,并负责平台的运维、迭代版本、问题定位的工作; 2、通过阿里云控制台的报警系统,负责监控生产环境异常进行定位并作出总结、汇报给开发和项目负责人; 3、负责搭建文件系统GlusterFS,并对其进行运维以及后期节点扩容; 4、协助测试组长将测试环境以及生产环境的所有服务器的网络迁移到专有网络; 5、培训新员工,对其进行车载设备相关协议、测试流程、运维技术方面的相关培训; 6、为了解决测试环境与生产环境的数据不同步问题,分为三个阶段: 第一个阶段,记录生产环境的部分数据并将其 引入测试环境;第二阶段,使用生产环境的后台数据部署预发环境,做到测试包、真数据;第三阶段,巧妙利用阿 里云的SLB,将一个测试节点,切入到生产环境的SLB中,做到数据的前后端交互;在使用k8s的过程中,因网络问 题导致的故障次数是最多的,总结网络排查方法: 1)排查service,检查pod之间是否可以通信、pod内部与外部是否可以通信、pod与各节点是否可以通信,以及 各节点是否在一个网段中; 2)检查网络插件 kube-proxy、flannel的工作状态: 比如 systemctl -l Kube-proxy; 3)检查DNS的工作状态以及DNS各个pod的存活状态;并且检查端口是否定义正确; 4)检查docker的网络是否被覆盖: docker重启后会重新生成网桥。网络不通的原因是flannel启动后生成的网络覆 盖了docker的网络,当你重启docker后,又重新写了一遍iptables,解决网络互通的问题。 教育背景