个人介绍
做过35个数据分析中小型项目,涉及kaggle和飞桨的电商,支付,新零售,股票,生物,气象领域数据;
具备扎实的Python数据获取+数据清洗+数据整合+数据分析+数据可视化的数据分析经验(pandas,numpy,matpoltlib,seaborn,pyecharts,pyhive,pymysql,scikit-learn);
工作经历
2019-09-12 -至今扫地哥Python数分工作室数据分析师
承接“数据分析+Python技术+商分”的咨询 扫地哥是Python-Code技术-代码的狂热信仰者,拒绝低代码和拖拽类平台!时间宝贵,代码先行! 本人独立Code,完成的30个Python数据分析实战项目
教育经历
2003-09-01 - 2007-07-01河南财经政法大学信息管理与信息系统本科
技能
(1)电商用户消费行为分析 A. 数据清洗,time列转成标准datetime,首先是用户整体消费趋势分析含按month统计产品购买数量,消费金额,消费次数,消费人数;然后是用户个体消费分析含用户消费金额,消费次数(产品数量)描述统计,分别subplot()各个bar图,line图和scatter图; B.用户消费行为:求首次购时间和最后一次购买时间,然后分别plot()图;然后用户分层,分别计算R-F-M值,做RFM模型,然后用户分层可视化scatter()图; C.新老,活跃,回流用户分析及可视化,用户购买周期,用户生命周期分析以及可视化,复购率和回购率分析以及可视化 (2)电商新零售客户数据分析 A.数据清洗,提取订单时间中的:年-月-日,去重,分析异常数据占比和特点;按月分组,销量最多的月份排序可视化bar图; B. 按城市分组,按购买数量求和,按数量求和排序,购买商品数量前10的城市--可视化bar图; C.计算客单价;按客户ID分组,汇总销售数量和销售额,计算用户平均消费金额和消费次数; D. pivot_table透视表计算年度退货率;计算R-F-M值,各分位数段客户消费频次,RFM的数据类型做转换,按RFM的价值取值判断价值:高和低,各用户等级的个数统计,最后可视化用户等级情况的重要度bar图和用户等级比例pie图;
Mysql数分类+Hive数仓类 1. 熟练操作基于workbench和navicat 15的Mysql数据分析,并熟练基于Pycharm操作Mysql和Hive数仓; 2.熟练操作基于Mysql的 (企业级) 车车智能营销数据分析项目和淘宝用户行为分析SQL版项目; 3.熟悉Hadoop下的HDFS文件操作和Hive数据分析,熟练Hive窗口函数和分区表+分桶表+内部表+外部表;
Python数据分析类 1. 做过35个数据分析中小型项目,涉及kaggle和飞桨的电商,支付,新零售,股票,生物,气象领域数据; 2. 具备扎实的Python数据获取+数据清洗+数据整合+数据分析+数据可视化的数据分析经验(pandas,numpy,matpoltlib,seaborn,pyecharts,pyhive,pymysql,scikit-learn); 3. 精通4个版本的数据大屏实现:Pyecharts的overlap和Page大屏+Js版的Echarts大屏+基于Flask框架的数据大屏分析系统+基于PowerBI和Tableau的数据大屏; 4. 【项目】B端聚合支付交易数据的python多维度数据分析,喜茶门店评价数据分析,kaggle电子游戏数据可视化分析,Iris纸鸢花数据的EDA探索分析,龙源风电数据EDA探索及分析,混泥土强度数据可视化分析,广告投放效果的数据分析,淘宝商品数据的数据挖掘与分析,基于搜索记录的用户画像分析,北京空气质量的数据建模分析,双十一淘宝化妆品销量信息的数据分析,电子产品深度分析与会员RFM模型分析,贷款申请数据的分析,财务报表的数据处理分析,用户消费行为分析和O2O消费券线下使用分析,Flask+Vue3+Mysql的前后端数据交互项目;