个人介绍
硕士在读期间发表论文3篇,关于爬虫架构,采集策略和大数据量下的数据存储。
优秀毕业生和优秀毕业论文
曾在国内领先金融平台融360和字节跳动和亚马逊负责核心业务。
积极向上,工作认真负责,一丝不苟。
工作经历
2023-05-01 -至今Amazon研发工程师
做cloudauth接入,UT coverage覆盖以及arm64迁移等,与国外channel与人员沟通推进各项进展,包括印度业务,美国业务
2019-07-01 -2022-10-01字节跳动资深研发工程师
主要技术:python + scrapy + redis + eular+ mysql。 负责科室识别开发,具体如下: 算法上,准确度从统计模型的87.6%提升到97.3%: 业务上,badcase分析,科室逐渐细化与迭代 特征工程:信息熵特征选取与特征权重控制,pre分别提高:2.5%与1.2% 分词层面:利用gram进行字词力度发现新词,同时找到适合分词系统,提升2.1% 语意挖掘:关键词组合作为feature,提升1.3% 样本纠正:对抗训练,抓取百度,小荷搜索结果挖掘错误样本, 提升2.6% 统计模型VS (CNN, RNN,Bert), 准确结果平分秋色,但速度占据优势 工程上, 平均响应时间
2015-04-01 -2019-07-01融360研发工程师
主要技术: Java + python+ redis + mysql + hbase + linux+tomcat。 负责抓取,为风控提供数据服务,至今覆盖14家,具体如下: 负责项目架构设计与编码开发 负责框架搭建,异步设计以及后期并发窗口合理控制 抓取采用多线程+阻塞队列方式 系统web后台统计数据采用多线程分发处理 抓取接口文档编写与各个保险公司实现类的开发 主要技术: python+ pandas + mysql + hive + kafka。 从仓库和接口方面提供实时数据分析,具体如下: 基于django搭建web站点,用户展示站点维度,用户维度以及关联数据 分别从hive和kafka读取历史数据和实时数据 利用pandas中进行数据分析,数据分析结果存入mysql库
教育经历
2008-09-01 - 2012-07-01内蒙古工业大学计算机科学与技术本科
获得国家奖学金,多次三好学生,三下乡队长,优秀毕业生,英语四级。
技能
基于spring、springmvc、mybatis的新闻发布系统,包含有前台新闻展示、用户操作功能,后台管理系统。 数据库使用的是:mysql。 其中使用到的插件是编辑器UEditor