个人介绍
(1)主要掌握的技能包括:机器学习、深度学习、图像识别、时间序列预测等,在这些领域都有对应的实际项目。
(2)主要掌握的工具包含:python,hive、neo4j,spark、docker等。
(3)能够针对具体问题具体分析,对数据挖掘各个环节常用的方法,包括数据预处理、特征工程、模型构建、模型上线等。熟悉深度学习,能够使用常用的模型对图像进行识别和检测(基于Tensorflow)。
工作经历
2021-10-01 -至今腾讯云西安有限公司算法工程师
(1)负责CDP平台建设中算法相关的工作。包括IDM、数据分析、特征建模、线索排序等。 (2)负责时空大数据项目中,图像处理相关工作。包括图像识别、图像检测。 (3)支撑其他运营项目。对接腾讯云运营部门,支撑运营部门相关业务的数据分析与挖掘。
教育经历
2016-09-01 - 2019-06-01西安科技大学数据挖掘硕士
硕士研究生期间,主要研究方向为数据挖掘与能源经济,在校期间,聚焦能源经济领域,结合数据挖掘技术,发表学术论文共四篇,其中北大核心两篇、EI来源期刊一篇,EI会议检索一篇。
技能
项目背景:利用卫星拍摄的遥感数据,对城市中的道路进行检测。主要目的是为了识别和检测城市道路的位置,并对其进行标记,用于相关政务项目的推进。 成果:该项目为腾讯云相关项目,并在深汕地区得到了相关应用,项目中涉及到的检测目标有耕地、水体、建筑物、道路等。 个人工作内容:(1)数据预处理。包括数据打标签、数据集切分。(2)模型搭建与训练。尝试不同模型的搭建与训练,对比不同模型的效果,最终选用HRnet网络,对城市交通道路,进行检测网络的训练。(3)模型测试与调优。
项目背景与目的:为了监测公司C端产品的营收情况,便于比较公司运营活动带来的效果收益,发掘营收波动是否异常,对实时的营收额进行预测,并对固定时间点(14、18 点)的营收状况进行归因分析。 成果:构建的LSTM模型具备良好的预测能力,与ARIMA模型相比,预测的误差下降了3.5%,为营收数据的检测提供了良好的依据。 个人工作内容:(1)进行实时营收数据的加工,包括归因因子的数据;(2)梳理影响营收的相关因子,包括节假日、运营活动、疫情影响程度;(3)进行模型的构建、训练、调优、筛选、部署、应用与 监测; 主要技术工具:Python、MySql、Tensorflow、Hive;
项目背景与目的:面对日益复杂的电信业务,为了提升用户对自己办理的业务的使用满意度,维护用户的稳定性,需要对用户的满意度进行预测,识别出满意度低的用户,进行关怀维护。 成果:进过对模型使用的追踪,在半年时间内,在查全率固定的条件下,模型的查准率近下降了5%, 在模型的应用过程中,该模型的的准确率比友商模型的准确率高出20%。 个人工作内容:(1)负责业务需求的对接,将业务问题转化为技术问题;(2)进行数据的梳理,与业务方核对,形成建模所需的数据,并明确口径;(3)进行模型的设计、开发、调优、部署;(4)进行模型使用效果的跟踪。 主要技术工具:Hive、Python、Tensorflow。