个人介绍
随机森林、scikit-learn、 LogisticRegression、 朴素贝叶斯、K-means、SOM神经聚类等机器学习。
NLP-word2vec自然语言处理,深度学习框架TensorFlow-CNN,了解keras。
SMOTE,AdaBoost提升算法
Linux服务器日常生产操作
一般水平Java/shell
Mysql,redis等主流数据库操作。
使用Scrapy爬虫框架,熟悉selenium+phantomjs动态网页抓取原理及技术,极验验证码识别;
Css,js爬虫加密,小程序爬虫
工作经历
2018-08-23 -2020-04-01北京文思海辉高级后端工程师
针对保险险种是中文汉字,使用独热编码维度高并且稀疏,item2vec 基于word2vec与item2item,使用负采样,CBOW训练模型。 基于协同过滤算法使用Tensorflow深度学习框架构建个性化推荐系统,数据清洗,特征选择,创建保险得分矩阵和评分记录矩阵,模型训练。 针对保险客户续保率建模分析,随机森林分类,分类指标判断特征工程选择,auc与roc判断准确度,后期某地数据出现数据不平衡,改进采用adaboost提升算法,较欠采样与过采样效果颇好。 为了提高对非流失客户的预测精度,对客户进行聚类细分识别高价值客户,SMOTE 处理不平衡的客户数据 对数据进行统计、整理、分析,协助定期制作周期性报告;几种算法中最终选用LogisticRegression算法进行建模 根据客户需求,提出对探头设计及预期市场效果的客观有效分析; 日常维护,对于文本分类直接选取朴素贝叶斯进行机器学习模型的构建,对不同产品介绍关键词进行不同的分类。使用默认参数进行文本分类。
教育经历
2013-09-01 - 2017-07-01郑州轻工业学院应用化学本科
数据挖掘分析工作,曾就职于北京文思海辉金信公司。