个人介绍
多年从事Linux软件开发工作,在Linux系统开发及云计算方面具有丰富的工作经验及项目实践,较强的需求分析和系统设计能力。
1,精通Linux os,编程语言c/c++、python、shell;
2,精通Linux内核及应用编程(文件I/O、进程管理、多进程和多线程、网络编程);
3,熟练掌握云计算虚拟化及容器相关技术,xen、xenserver、kvm、openstack、docker、k8s;
4,熟练掌握各种存储技术,raid、iscsi、ceph;数据处理与展示numpy、matplotlib。
工作经历
2018-01-11 -至今深圳市商汤科技有限公司云计算系统工程师
工作期间主要负责人工智能超算平台的设计与研发。 1,基于openstack设计并实现人工智能超算系统; 2,利用docker与kubernetes技术实现高性能AI训练系统;
2014-10-08 -2018-01-11云宏信息科技有限公司云计算系统工程师
工作期间主要负责云计算虚拟化产品及超融合系统产品的研发,主要工作内容及成果如下: 1,服务器虚拟化产品设计与实现; 2,利用ceph分布式存储及xen虚拟化设计并实现超融合系统产品;
技能
在GPU物理服务器集群上构建云计算平台,通过虚拟化技术将计算、存储等资源进行按需分包隔离,向人工智能机训练提供高性能算力服务保障。 1,通过IB虚拟化实现高性能网络通信; 2,利用GPU穿透技术实现GPU资源在虚拟机中按需分发; 3,利用ceph分布式存储与openstack结合实现高性能存储支撑系统;
在云计算集群中,构建一套高效能算力资源系统,设计一套使用时分配资源的机制,通过按需分配和即时回收的策略充分释放集群算力潜能,提高资源利用率及人工智能训练效能。 1,利用docker容器机制实现用户隔离及gpu资源共享使用功能;, 2,通过k8s机制实现任务分发与资源回收功能;