个人介绍
熟练使用:Numpy,Pandas,Matplotlib,sklearn
熟练使用:线性回归,逻辑回归,SVM,Knn,决策树,gdbt,随机森林,Adaboost,boosting,bagging,Xgboost等熟练使用Tensorflow深度学习框架,CNN,RNN,
熟练使用:Hadoop,Hive,Hdfs,Impala,Kafka,Hbase
工作经历
2019-06-01 -至今汽车之家算法工程师,Python工程师
命名实体识别:抽取句子中出现的名字,公司***证号,地址信息等 车辆估价:根据以往车系,车型,车龄,公里数,等数据构建车辆估价项目,清洗数据,特征工程,模型搭建,项目测试 行驶证识别:识别线上行驶证,使用PaddleOCR构建模型,识别线上行驶证,识别率达96% ocr识别车牌省份:识别线上行驶证后利用OCR模型识别行驶证上的省份车牌号,并返回结果 车商画像:根据车商消费行为,日常行为,为车商划分等级,并打标签,生成字段超120+
2018-06-01 -2019-06-01小诺科技算法工程师,Python工程师
根据生产数据,三个月以上用户还款概率,分析好坏客户概率 对数据进行,数据清洗,特征提取,分箱等常见特征工程操作 通过Kafka消费大数据部门接收的三方数据,根据策略组所定相应规则进行ETL处理 结果进入规则引擎,返回结果放至Redis,三方数据集结完毕后存入Hbase 配置存入远程仓储Apollo,使用Finder查询日志,使用Jenkins部署项目
2017-01-01 -2018-06-01新华社Python工程师
后台页面接口开发,数据库搭建,服务器搭建,分布式系统搭建,日常后台业务开发,业务数据处理,编写接口文档,与前端工程师对接等工作
教育经历
2013-03-01 - 2017-06-01吉林大学计算机科学与技术本科
计算机专业毕业,擅长数据分析,整合,算法基础牢固,
技能
命名实体识别:抽取句子中出现的名字,公司***证号,地址信息等 车辆估价:根据以往车系,车型,车龄,公里数,等数据构建车辆估价项目,清洗数据,特征工程,模型搭建,项目测试 行驶证识别:识别线上行驶证,使用PaddleOCR构建模型,识别线上行驶证,识别率达96% ocr识别车牌省份:识别线上行驶证后利用OCR模型识别行驶证上的省份车牌号,并返回结果 车商画像:根据车商消费行为,日常行为,为车商划分等级,并打标签,生成字段超120+
根据生产数据,三个月以上用户还款概率,分析好坏客户概率 对数据进行,数据清洗,特征提取,分箱等常见特征工程操作 通过Kafka消费大数据部门接收的三方数据,根据策略组所定相应规则进行ETL处理 结果进入规则引擎,返回结果放至Redis,三方数据集结完毕后存入Hbase 配置存入远程仓储Apollo,使用Finder查询日志,使用Jenkins部署项目