个人介绍
• 3年数据分析工作经验,涉及B段的SaaS系统数据分析以及C端消费金融数据分析;
• 对于业务领域有成体系的分析框架以及思路;
• 工作期间业绩突出,带领五人团队承接集团17家子公司全部财务类型的数据需求以及分析报告需求;
• 抗压能力强,在接手数据组三个月内,完成财务部数据团队人员的构建,搭建财务部数据组知识共享机制,连续四个月数据分析考核前三。
数据分析• 熟练使用Excel,能使用VBA进行编程;
• 熟练使用Python,包括NumPy、Pandas模块进行数据清洗以及科学计算;
• 了解线性回归、极大似然估计等统计方法的数学原理以及使用编程语言进行实现;
• 掌握机器学习的数学基础掌握主流算法,包括KNN,朴素贝叶斯,K-Means算法,决策树算法(ID3/ID4.5/CART),线性回归,逻辑回归,GMM以 及随机森林(数学原理以及推导);
• 熟练使用 AB 测试协助产品经理进行功能测试以及数据埋点工作;
• 掌握数据分析模型:包括漏斗分析、用户留存分析、用户分群、RFM 客户价值模型、行为事件分析模型、用户行为 路径、点击分析模型。
• 掌握资产管理核心指标的计算,包括flow rate、vintage、first payment delay
数据库类• 掌握 MySQL 命令的编写,创建过项目使用的生产库(百万行级别),目前负责多个百万级别的数据库的更新与维护,能够使用 MySQL 进行科学计算;
• 使用 SQL 编写算法模型对于企业的估值以及租赁需求等进行估算评分;
• 使用窗口函数针对订单信息统计新老用户的质量、收入、生命价值等指标;
• 掌握Presto、Hive、PostgreSQL结构型数据库、MongoDB非结构型数据库的使用。
数据可视化类• 掌握 Matplotlib、Power BI、Tableau 的BI软件的使用;
• 熟练使用Superset、神策数据等数据可视化解决方案搭建看板。
工作经历
2022-08-01 -至今中国电信国际股份有限公司数据产品经理
1、辅助梳理数据中台工作流以及指标口径等元数据管理; 2、基于数据中台的数据湖搭建中间件; 3、基于目前的数据库信息开发一些数据营销工具;
2021-04-22 -2022-07-31岩心科技(深圳)有限公司数据分析师
• 提供每月财务部入账数据,自动化以及标准化交付 具体内容:为满足财务部每月编制财务报表以及管理报表的需求,需要及时准确提供集团层面以及各地区各公司的月度业务数据进行核算。因此, 使用Landsat(定时执行任务工具),Superset(BI工具)等工具自动化该数据获取流程。最终实现在每月2号前按照标准化模板提供全集团七个国家五家公司的电商交易以及金融放款和还款数据,共42份。 • 对接各类审计、监管机构的数据需求 具体内容:为满足公司战略以及日常运营需求,需要对接各类外部机构(包括IPO审计、年度财务审计、特定目的尽职调查以及印尼监管机构OJK) 的数据需求,包括检验订单的真实性,资料的完整性、用户的真实性以及风控流程是否严密等。因此,需要和信息安全的同事一起提供对应的明细数据。最终实现成功对接BDO年度审计、EY尽职调查、DTT-IPO审计、OJK业务合规监管审计。 • 制作各类监控财务报表 具体内容:基于管理层日常查询以及监控实时数据需求,利用Superset制作各类大盘监控报表。报表类型包括:季度、月度、每日的资产规模、收入规模、资产质量等报表。同
2019-07-01 -2021-04-21前海梧桐数据(深圳)有限公司数据分析师
• 数据分析晨会主持 具体内容:为了及时复盘公司大盘数据,改进业务营销策略,需要及时针对昨日新增用户、用户留存、热点政策以及热门的产业园内进行盘点。此每天主持数据分析晨会为业务同事及时反馈公司业务现状,帮助他们优化营销策略以及圈定目标群体。 • 维护APP对应的数据库 具体内容:为了保证APP的内容的及时更新,需要编写爬虫文件抓取深圳、江苏、南通、东莞、南通、上海五地 962 个政府网站公告公示,对应五个市约合一千万家企业的工商信息,并且将数据直接通过管道灌入数据库中进行保存。平均每天为企业数据库更新数据50万条,项目数据库新增3万条。 • iPess app 政策规则、企业标签的自动生成(基于 python) 具体内容:对于每日生成的政策数据,根据申请条件,政府层级等条件进行解析并做好数据标注,同时基于决策树算法对企业进行分类,便于后续模 型针对企业数据以及政策数据进行模型匹配 • 利用百万级别的企业数据生成特定城市的产业迁移报告 具体内容:基于数据库中三百万企业的迁址数据、产业类型以及营收规模等信息进行数据分析python的各个模块自动化生成企业迁址大数据报告。
教育经历
2022-09-01 - 伊利诺伊州立大学数据科学硕士
2015-09-01 - 2019-07-01深圳大学会计学与计算机科学本科
主修课程:中级财务会计、概率论与数理统计、公司估值、SPSS应用与实战、风险管理
技能
场景和目标 由于公司开始推行精细化管理,需要改变过去粗放型的管理模型,因此具体到数据组,需要按照业务条线安排对应的数据分析师,完善数据需求接洽流程,专人专项负责对应业务条线的数据。 我在项目中的行动 盘点梳理目前数据组的六个数据分析师的常规性工作,手上的项目有哪些; 根据每个人熟悉的业务领域不同,突出的技能点的不同,安排对应的业务条线工作; 搭建数据接洽的SOP,从需求的提出、到交付时间的安排,到最终数据的输出以及落地,全部使用谷歌在线表格进行留底; 每周三开半个小时的组会,主要讨论目前各个业务线数据上难以推进的障碍,或者是及时同步业务变动,让各组员了解业务变动是否会对自己负责业务条线产生影响。 结果 1、顺利安排数据组六位数据分析师对接17家子公司的数据需求以及来自管理层的管理报表数据需求; 2、提升入账效率,从原来的不能保证入账数据时效,到所有子公司均有入账时间死线,最短的三天,最长的十八天。 3、更加便于管理各个数据分析师的绩效,在保证KPI部门最优的同时,部门内部加班时长最低。
场景&目标 为了满足管理层能及时获取公司三类金融资产的各项常规指标,包括在贷余额、每日新增分发、每日回款、迁徙率、vintage、FPD等数据,需要通过Superset等BI报表工具制作资产管理报表,按照特定频率更新资产数据。 我在项目中的行动 1、了解各类资产的数据库储存方式以及各数据库表的字段含义; 2、根据数据指标的差异制作不同的数据图表以便数据使用者能一目了然获取资产信息。 结果 1、在superset上能T+1获取资产各类指标信息; 2、帮助资金组同事指定资金日报,优化资金筹划头寸。
场景和目标 为了节省公司开支,增强公司在金融资产减值模型方面可解释性,需要自己开发一套符合IFRS9(国际财务会计准则第九号)的预期信用减值模式(简称ECL模型),用以替换目前使用由KPMG提供的基于SAS的ECL模型。 我在项目中的行动 从最初的模型理论调研阶段,主导选择使用迁徙率模型以及逻辑回归作为违约概率计算基础,使用多元回归模型作为宏观经济指标作为前瞻性调整; 在项目实施阶段选择公司自有的Jupiter AI作为模型实践平台; 在模型验证阶段与风控部门合作观测模型的鲁棒性、适用性、是否存在过拟合现象,与财务专家讨论模型的参数是否符合IFRS 9 的规定。 结果 1、为公司节省每个月四十万人民币的模型租赁费用 2、提升财务入账数据的及时性和可解释性,从每月十八号结账提速到每月十三号前结账; 3、提高公司的减值模型的可解释性,能够在审计报告的附注中展示该模型的各项参数,结果集中各类资产的分层; 4、提升公司资产管理水平,为公司及时调整财务会计政策以及风控政策提供数据支撑和模型支撑。