个人介绍
中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文中文
工作经历
2021-09-01 -2024-06-01国内互联网大厂数据开发
主要从事应用层数据开发工作: 1.流量数据开发 2.金融数据开发 3.标签数据建设 4.后端日志接入 5.数据治理
教育经历
2018-09-01 - 2021-06-01南开大学应用数学硕士
2014-09-01 - 2018-06-01中国民航大学航空运输管理专科
技能
项目目标:保证数据指标来源唯一性(质量)、减少数据开发成本(效率) 项目成果: 1. 从0建设导流主题层,保证了下游导流、资源位、活动数据来源一致性; 2. 实现20+新增页面、100+新增入口的数据自动生产,数仓开发成本为0pd; 3. 入口解析自动化——实现json格式流量来源信息自动解析出导流入口的过程; 4. 商品解析自动化——将入口划分为资源位、搜索、猜喜三种类别,按类别解析json中的商品/物料信息。
项目目标:降低监控报警率,提高监控覆盖问题率(主要负责波动率阈值判定) 项目成果: 1. 提供新的指标异常波动监控方式——从监控波动率是否超过固定阈值,迭代到通过结合指标值和波动率共同判定指标波动异常; 2. 每日1000+条报警数据,下降为每日30条+报警数据; 3. 按照历史问题统计,新监控能够暴露90%的数据问题/业务异常波动。
bitmap标签模板建设 项目目标:降低开发标签人力成本(开发效率);解决长周期标签运算慢、消耗资源多的问题(运行效率) 项目成果: 1. 完成了基于bitmap实现留存和历史行为标签模板建设,降低了bitmap代码的理解成本,模板使用者填写变量即可生成ETL任务,每个标签开发时长在1pd内; 2. 标签模板能生产的指标包括——N日内的留存次数、留存天数、历史行为次数、历史下单金额、首/末行为日期等; 3. 标签模版支持任意时间段内的数据回溯,简化和降低回溯成本; 4. 每天人群数量范围在200w左右的用户标签,运行时间从4000s优化在2000s内; 5. 模版已通过数据验证,组内推行后共有40+个标签使用了该模版。