个人介绍
熟悉 SQL 分组聚合、窗口函数、表关联、子查询,掌握函数存储过程,能够进行完整的数据入库、清 洗、统计,能够编写 SQL 语句进行数据分析,能够基于 MySql 执行计划调优
熟悉 pandas、numpy、matplotlib、seaborn、sklearn 进行数据清洗、重组、可视化和建模分析;
熟悉 ETL 基本流程,能够使用 Kettle 的转换、作业、可视化编程,进行数据的抽取、转换、装载
熟练掌握 BI 工具 PowerBI、Tableau 和 PPT 进行可视化,根据业务需求搭建、完善指标体系,产出数据 分析报告
熟悉 python 函数式编程以及常用的第三方库,有良好编程习惯
熟悉 requests 模块,selenium 工具,Scrapy 框架,能实现合法数据的爬取
掌握 Linux 环境下的项目部署
掌握 Hive 在 Hadoop 数仓创建分区表、分桶表、外部表、数据加载及复合数据类型的查询,了解数仓 Hadoop 生态圈、Spark
了解描述性统计分析、分组分析、象限分析、RFM 分析、综合评价分析、帕累托分析、漏斗分析等多种分 析法
了解 SKlearn 的线性回归、SVR、逻辑回归、NB、KNN、SVM、决策树、KMeans、DBSCAN、Adabosting、 随机森林算法模型的特征选取、数据集划分、训练和调参
工作经历
2021-01-03 -至今开封不太象互联网工作室数据分析
通过python进行数据分析与处理,进行数据可视化。 python编写办公自动化脚本
教育经历
2018-09-01 - 河南工学院数据科学与大数据技术本科
技能
监控销售数据 企业经营分析通常由财务部门主导,通过企业资产负债、经营成果、盈利能力等方面的分析,诊断经营现况,发现经营问题,保证企业良性运转。 业务经营分析与企业如出一辙,目的也是保证业务的顺利推进、业绩的节节攀升。具体可以分为以下五个部分: 经营分析结果的需求方包括:部门领导、业务侧、数据分析师。 对数据进行预处理 1. 在销售表中计算各订单的总价金额(用于之后对销售金额进行汇总) 2.产品销售可视化,在可视化编辑器中选择添加相应的图表到视图界面。
1. 数据获取:从售后部门得到23w条用户反馈数据及客服处理信息,对数据做描述分析,数据不规整,需要对于反馈类型及实际反馈问题进一步细分 2. 数据处理:使用pandas完成处理,对反馈类型进行拆分,分别拆为一级,二级,三级类目中详细问题描述,定义标签路径信息,存储完整的反馈类型信息。 3. 统计分析1:统计不同类型的反馈数量,*网络信号这一类别反馈较多,不同类型反馈数量差异性较大,针对反馈数量多的类别,加大人员安排,给出详细解决方案,进行培训,必要时进行专项服务,提高响应速度 4. 统计分析2:统计不同类型的处理时长,大小不一,对于*网络信号, 国际漫游服务,宽带网络信号时长达到8小时以上,对于这个类别需要重点培训 5. 统计分析3:每个人处理问题的类别占比不均,根据客服处理速度,对于后25%的人员进行重新培训,考核上岗