1.机器学习平台主要有集群节点管理/数据存储/任务模块(核心)/镜像模块/监控系统/权限认证/用户管理模块
2.我负责的是用户管理/节点管理/数据存储/任务模块(核心)模块开发
3.项目用到的技术栈:springcloud,其他技术有java、websocket、mysql、
rabbitmq、redis、elasticSearch、fileBeat、kibana、okhttp、
webservice、K8s client、gluster client、docker-client、
vuejs、maven、git/gerrit等等
4.遇到的难点问题:系统cpu飙高,通过查看TOP查看进程,jstack抓取线程栈,找到问题根源,优化代码。
慢查询sql以及死锁:通过慢查询日志和查询死锁日志,分析问题SQL,进行优化。