




个人介绍
主要方向是数据分析, 数据开发, 以及数据挖掘. 主语言python. 可以从事一些跟python有关的数据处理工作, 类似data cleaning, 数据挖掘项目, 爬虫等. 在校参加过多个数据挖掘项目, 主要担任coding类的任务. 目前悉尼大学研究生在校生, 即将毕业, 去向是某互联网中厂数据分析工程师. 曾在快手实习半年, 主要负责部门的数据分析和数据开发, 周报自动化, 以及数据分析报道等业务向的工作. 本人性格沉稳, 认真负责, 热爱写代码, 因此在此类工作上比较专注, 勤于思考和学习, 也因此可以提供更好的作品质量
工作经历
2021-08-25 -2022-01-21快手数据分析师
政务、健康产品部 - 数据分析 政务号短视频运营部、快手健康产品部 1. 数据分析 - app某功能的订单转化率分析、A/B测数据产出分析 2. 协助mentor进行短视频投放业务分析,为决策提供数据支持 3. 维护,构建BI看板,漏斗分析看板 4. 独立进行政务号短视频,健康产品两部门数据周报的自动化工作,缩短每周周报制作时间(2~3h -> 30分钟以内) 5. HiveQL取数,提供产品、运营侧数据需求支持 快手热榜热点产品运营部 1. 数据开发:(非挖掘项)利用系统后台日志产出的数据,提供所有在线热词人工操作的在榜的时长、位置 2. 数据分析:圣诞节、元旦节站内热点用户情绪特征分析 3. Hive取数、优化部门常用的sql模板,提高跑数效率
教育经历
2018-03-01 - 2021-02-22悉尼大学经济学本科
本科主修经济学, 辅修会计, 金融, 数据科学等, 但研究生主要方向是数据科学, 精通python, 算法, sql 等
技能

Regression task,主要负责数据清理,EDA,特征工程,算法模型搭建,以及特征重要性分析的全部代码部分,以及建模部分文字部分的撰写。项目主要用了7个模型(4个线性,3个树模型),包括线性回归,Lasso,Ridge,Elastic net,decision tree,rf和xgboosting。最终选择的模型是xgboosting,得到的rmsle score为0.88


Classification task. 利用往期商业推销用户反馈的信息作为基础数据集,挖掘有价值的特征。我们使用了5种算法,最后得到的AUC-ROC score为0.797(二分类),kaggle排名16/70。 主要职责:负责数据清洗、EDA以及特征工程,次要负责协助进行算法模型的选择
