Truth熊-上海Python-程序员客栈

1月前来过

D级

数据分析师

上海

全职 · 400/日 · 8700/月信用正常

工作时间: 工作日09:00-18:00、周末09:00-18:00工作地点: 远程

服务企业: 0家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

有1年大厂数据分析经验，3年Python开发经验，3年SQL开发经验。最擅长Python、SQL数据分析。可独立完成从数据获取，到数据清洗，数据分析，数据可视化全流程。项目中可以独立领导一个模块的数据分析工作，可以处理百万级别数据。参加过kaggle泰坦尼克号数学建模比赛，排名top1%。参加过CCF大数据与计算智能大赛中原银行个人违约贷款预测，排名top5%。

2022-09-01 -至今埃森哲数据分析师
1.负责日常业务问题的监控，及时预警系统风险并给出解决方案 2.协助数据开发人员进行平台开发，提供数据模型测试案例 3.参与数据模型优劣分析，完成模型准确率分析报告 4.积极同其他模块展开沟通，确保各模块不出现认知偏差

2018-09-01 - 2022-06-01上海第二工业大学智能科学与技术本科
相关课程：数据结构与算法，智能统计学，人工智能基础。英语6级516 四级579 计算机二级 90 大学平均绩点 3.53

Python

SQL Server

作品

中原银行个人贷款违约预测三

项目需要利用已有的与目标客群稍有差异的个人信贷数据，辅助目标风控模型的创建，并利用该风控模型实现新业务下的用户违约预测。模型选择为lightgbm + lr 处理过程分为以下几个步骤：特征选择选取符合条件的特征，根据相关性、缺失率、IV等指标数据划分按照一定比例划分训练集和验证集，用于模型训练和验证数据转化利用lightgbm模型把源数据输出为叶子节点矩阵并把此作为lr模型新的输入。卡方分箱利用分箱把连续值离散化，手动调整分箱单调性让分箱结果更贴合真实业务场景 WOE编码为各个分箱分配不同权重，并通过设置IV阈值处理过拟合，得到新数据集模型训练输入新数据集并设置模型参数来解决样本不平衡现象，通过训练得到模型模型验证绘制ROC，根据AUC值评估模型灵敏度，根据k-值评估模型区分好坏客户的能力技术栈：Python + Pandas + Numpy + Sklearn + LR + Matplotlib

2023-06-17 00:22

中原银行个人贷款违约预测二

项目需要利用已有的与目标客群稍有差异的个人信贷数据，辅助目标风控模型的创建，并利用该风控模型实现新业务下的用户违约预测。模型选取lightgbm模型处理过程分为以下几个步骤：特征选择选取符合条件的特征，根据相关性、缺失率、IV等指标数据划分按照一定比例划分训练集和验证集，用于模型训练和验证模型训练输入新数据集并设置模型参数来解决样本不平衡现象，通过训练得到模型模型验证绘制ROC，根据AUC值评估模型灵敏度，根据k-值评估模型区分好坏客户的能力技术栈：Python + Pandas + Numpy + Sklearn + LR + Matplotlib

2023-06-17 00:09

中原银行个人贷款违约预测

项目需要利用已有的与目标客群稍有差异的个人信贷数据，辅助目标风控模型的创建，并利用该风控模型实现新业务下的用户违约预测。由于借贷数据特征以连续型为主，故本人选取解释性更好，更适合连续型数据的逻辑回归模型。处理过程分为以下几个步骤：特征选择选取符合条件的特征，根据相关性、缺失率、IV等指标数据划分按照一定比例划分训练集和验证集，用于模型训练和验证卡方分箱利用分箱把连续值离散化，手动调整分箱单调性让分箱结果更贴合真实业务场景 WOE编码为各个分箱分配不同权重，并通过设置IV阈值处理过拟合，得到新数据集模型训练输入新数据集并设置模型参数来解决样本不平衡现象，通过训练得到模型模型验证绘制ROC，根据AUC值评估模型灵敏度，根据k-值评估模型区分好坏客户的能力技术栈：Python + Pandas + Numpy + Sklearn + LR + Matplotlib

2023-06-17 00:23

更新于: 2023-06-16 浏览: 613

个人介绍

工作经历

教育经历

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐