个人介绍
工作经历
2021-04-01 -至今软件工程国家工程研究中心软件开发
参与设计和开发国家电网项目的高可用服务中心的弹性资源分配服务。成功得解决了,国家电网服务中心的资源浪费的问题。并发表了一篇ccf c类的文章
2020-05-01 -2020-09-01美团软件开发
负责分布式服务的设计和开发。负责虚拟化gpu的测试和开发工作,从多角度评测服务软件对整个基础平台服务的适用性,并进行一些性能优化。
2020-11-01 -2021-04-01滴滴软件开发
参与了地址推荐服务的旧项目改造,增加了服务的扩展性、模块化的功能,并做了很多性能优化。 独立开发了深度学习在线服务,才用go-tf的方式调用深度模型,性能提高了5-6倍。
教育经历
2018-05-01 - 北京大学智能化软件工程硕士
在校学习成绩优秀,实习经历丰富,分别在美团滴滴等公司实习!
技能
基于Faiss设计并实现了分布式向量检索服务。由于市面上的向量检索服务大多依赖于高性能的服务器和GPU资源, 该项目基于Faiss在内存中构建向量检索服务解决了在廉价的服务器上构建高性能向量检索服务的难题。该项目基于Faiss 构建单节点的向量检索服务FaissRecall,FaissRecall采用了索引构建和查询服务一体化设计,并支持了内存优化等功能。 该项目设计并实现了FaissRecall的分布式支持Ranker子项目,采用K-means算法将数据集切分成多个数据块,部署到多 个FaissRecall节点,请求时采用节点筛选的方式选择目前节点进行访问,从而极大地降低了网络延时。经过测试,相较于 单节点服务,分布式的服务的准确率高达97%。处理500W的向量检索,只需要约18ms。另外设计了服务管理模块、节 点调度子项目和数据管理子项目。
独立完成了深度学习在线服务的设计和开发。将多个服务中对深度学习的调用独立成一个基础服务,采用 Go-tensorflow等基础实现了对多种深度学习的调用服务,打通了算法开发和工程开发中间的壁垒,简化并缩短了 在线服务的开发周期,性能上也得到了极大的提升。相比于调用鲁班的耗时,该项目的性能提升了5-6倍。
参与设计基于Kubernetes/kubeflow 的可拖拽的机器学习构建平台。独立开发了后端部分。在平台上页面上, 算法工程师输入Component的输入参数确定算子,然后通过拖拽算子的方式构建机器学习任务。机器学习任务的算 子通常会形成一个有向无环图(dag)。任务提交到后台,服务会根据DAG的依赖关系去依次构建Component。首次 构建Component,服务会到指定的git地址去pull代码,构建为镜像,并把Component的信息保存到数据库中,以供 重复使用。执行机器学习任务时,采用懒加载模式,边构建边执行。任务执行完,托管的服务,会发送执行的信息到算 法工程师的*中。极大提高了算法工程师的工作效率。