个人介绍
我有丰富的统计学理论基础,能结合计算机技术包括python,R编程以及机器学习做数据的分析及预测。熟悉从数据清理,挖掘,建模到可视化的相关流程。并对推荐系统,爬虫、人脸识别以及深度学习有相应的应用和项目经验。如果您有数据类项目需要,请联系我。
工作经历
2019-04-29 -2021-06-04亿磐系统(深圳)有限公司数据工程师
亿磐系统:公司成立于1993年,总部位于美国,在全球30多个国家拥有分公司和接近四万名员工。主要从事计算机软件、硬件、网络技术的开发、设计及相关技术服务、技术转让、技术咨询;提供信息系统集成方案设计、调试、安装、维护服务及相关技术咨询 参与完成内部数据科学培训。内容包含python基础与编程、数据科学常用算法的应用、可视化与演示; 协助客户清理,挖掘可用数据逻辑;提高机器学习模型精度,包括回归、分类任务;撰写数据报告并展示; 与团队协作,利用python爬取热门流行语言和技术栈数据并对其进行整理,提供可视化设计建议;后续设计基于流行语言对公司内部员工的技术构造推荐系统; 参与设计分公司人脸表情识别项目,给予技术支持;应用到web端进行演示; 加入内网团队以提供数据分析支持;
教育经历
2017-03-06 - 2019-04-05奥克兰大学数据科学硕士
相关课程:数据可视化、数据挖掘理论与应用、机器学习算法、统计编程、数据库等
2012-02-06 - 2016-02-26奥克兰大学统计学本科
相关课程:推论统计学、统计模型与分析学、时间序列分析、抽样调查、高等数学、数据结构与算法等
技能
介绍:从Github以及Stackoverflow爬取技术数据,建立排序逻辑,统计近几年最热门的编程语言以及预测未来趋势。根据公司内部员工的技术特点,为其推荐科学系的热门技术 利用python进行数据的爬取并储存至MongoDB数据库; 通过时间序列模型预测未来趋势,根据最准确的模型提取数据并建立预测数据集; 建立推荐逻辑并测试可行性; 通过DBSCAN以及Tf-idf对测试的文字描述数据做聚类分析并应用推荐系统; 与团队,前端工程师沟通需求以及具体实现细节;
介绍:通过分析菲律宾零售店饮料销售的数据,横(不同公司间的饮料)纵(公司内部的饮料产品)向对比消费者购买饮料的行为习惯,以及饮料本身影响其销量的因素 进行市场调研,熟悉菲律宾地区饮料销售的特点,根据其特性挖掘新数据,例如天气,地区,财富差距; 通过比对销售特征之间的关系,与团队成员合作,挖掘,分析可口可乐旗下饮料的销售数据; 运用机器学习算法例如随机森林,线性回归来预测和进行特征的选择; 调用seaborn包进行可视化展示,包含基础统计和热量关系图,从中找出饮料见的销售关系并根据产品特性划分;